技術 | 知識圖譜構建:圖情領域

知識圖譜在圖情領域被稱為“科學知識圖譜”,雖然有的學者認為圖情領域的“科學知識圖譜”與業界所稱的“知識圖譜”不是一個東西,但個人認為科學知識圖譜屬于知識圖譜,只是科學知識圖譜中的實體、邊、屬性等都是“最簡化”的,例如科學知識圖譜中的“實體”可能直接用科技文獻中已經結構化了的著錄信息,但這并不阻擋其是知識圖譜的本質。下文是個人梳理的圖情領域知識圖譜的構建方法和常用工具,對于我們后續深入了解知識圖譜應該會有一定的意義。

1? 引言

共現科學知識圖譜是對科學文獻系統中知識單元間的共現模式進行抽取、簡化和可視化的結果,即通過科學文獻所承載學科及研究領域的概念、知識和社會結構間的相互聯系,構建知識單元共現網絡,以圖譜方式揭示科學研究知識單元和知識群體的網絡結構與動態演變。從1964年加菲爾德等人基于引文數據手工繪制完成DNA領域歷史發展圖譜,1965年Price[1]基于相同數據完成經典論文《科學引文網絡》,到1973年Small[2]提出基于共被引關系研究科學知識結構,1983年Callon等人[3]將共詞網絡引入科學知識圖譜,再到1991年Peters等人[4]建立合作網絡發現科學研究中的社會合作結構,以及2005年劉則淵[5]正式引入“知識圖譜”指代計量學新興研究主題“MappingKnowledgeDomains”,無不展現出共現科學知識圖譜循序漸進的研究過程。

科學研究規模蔓延生長、不斷演化和科技成果指數級增長的趨勢,使得歷經50多年發展并日趨成熟的共現科學知識圖譜在洞察科研動向中扮演的角色愈加重要,成為圖書情報學科的主要研究領域之一,并在其它學科得到快速滲透和廣泛擴散,如教育學、醫學、計算機科學、管理學與經濟學等[6],是學者洞察領域熱點與趨勢、發現學術共同體、對學科交叉及融合進行測度與可視化的重要方法和有效工具,特別是近幾年層出不窮的新技術(如大數據、物聯網、人工智能、區塊鏈)更為共現科學知識圖譜的應用增添了新活力[7-8]。面對該領域快速興起和發展的趨勢,已有學者通過統計計量與理論思辨等方法對其進行研究現狀梳理和知識體系構建[9-11],以期厘清其發展脈絡、理論基礎、實現工具和應用概貌。

共現科學知識圖譜在支撐理論和應用成果方面都取得長足發展,但對于一個正處在從夯實理論基礎向多學科融合發展和轉變的領域來說,筆者認為有必要對其實現原理和流程進行梳理,歸納構建共現科學知識圖譜的關鍵技術和集成工具,探索共現科學知識圖譜的發展趨勢和主要挑戰,從而幫助科研人員更好地理解、掌握和運用共現科學知識圖譜,選擇適合的繪制方法和工具,提高圖譜運用、解讀與轉化能力,也可為共現科學知識圖譜工具的進一步優化提供借鑒路徑。

2? 實現原理與流程

2.1? 基礎原理

文獻組件指科學文獻中的任一邏輯組成部分,包括文獻題名、摘要、關鍵詞、作者、機構等以元數據形式予以標注和存儲的外部特征,也包括正文中的段落、句子、詞組、關鍵概念和術語等反映內在語義的部件[12-13],這些基礎組件可被視為科學文獻邏輯內容及外在形式的重要表征,它們構成了特定文獻的知識單元集合。不同知識單元間由于某種聯系(如詞共現、作者合作、共被引等)而被組合成具有意義的實體對,作為有指示價值的概念或主體被人們理解,這些知識單元高頻率的共現說明其指示的概念或主體間關聯的可能性更大,在此基礎上構建的網絡一定程度上能建立起對特定領域知識結構的描述,進而反映特定學科或領域的研究熱點、發展過程和結構演化。

共現科學知識圖譜可看做是一張由科學文獻知識單元集合構成的網絡,網絡中的節點代表文獻知識單元,節點間的連線代表知識單元之間的共現關系[14],我們可以將這種共現關系稱為“共現大家庭”[15]或“大共現”[16]。共現圖譜繪制的基本原理就是對樣本文獻集進行解構,提取出待分析的知識單元,然后根據知識單元間的共現類型和強度進行重構,形成不同意義的網絡結構,通過對網絡結構的測度和可視化,發現特定學科和領域知識結構的隱含模式和規律(如圖1)。

圖1 科學知識圖譜實現原理圖解??

2.2? 構造流程與關鍵技術

B?rner等人[17]將科學知識圖譜繪制歸結為數據提取、分析單元確定、方法選擇、相似度計算、布局、可視化展現與圖譜解讀六個階段;楊思洛等人[18]認為知識圖譜繪制由樣本數據獲取、數據清洗、選擇分析單元、構建單元關系、數據標準化、數據簡化、知識可視化、圖譜解讀八部分組成;Cobo等人[19]則將其劃分為數據檢索、數據清洗與處理、網絡提取、標準化處理、圖譜繪制、統計分析、可視化、圖譜解讀。筆者認為,共現科學知識圖譜的實現可看做三個層次:知識單元抽取層、知識網絡構建層、知識發現與可視化層,其中,知識單元抽取是圖譜構建的第一步,主要解決如何從數據源中抽取待分析的知識單元這一問題;知識網絡構建層則對知識單元間的共現類型和強度進行抽取,建立關系網絡;知識發現與可視化層基于前期構建的知識單元網絡,利用聚類技術、社會網絡分析、多維尺度分析等方法對知識單元間的共現關系和潛在規律進行挖掘,并通過可視化手段將數據及統計分析結果映射到圖形屬性。圖2結合共現圖譜繪制軟件VOSviewer中涉及的關鍵技術,對共現科學知識圖譜的一般處理流程進行了歸納,以便讀者進一步理解和掌握圖譜實現技術和流程。

圖2 共現科學知識圖譜一般實現流程??

2.2.1?知識單元抽取層

文獻數據獲取與整理。共現科學知識圖譜的數據來源是科學知識域(Knowledge

Domains),其載體主要是某一主題相關的科學文獻樣本數據[20],因此,圖譜繪制的質量、合理性與可靠性很大程度上依賴于文獻樣本數據的準確性和全面性。國際層面研究中Web of Science、Scopus、Google Scholar是較為常用的數據獲取來源,國內研究則主要集中于中國知網、萬方或中文社會科學引文索引(CSSCI),不同數據源在收錄范圍、計量指標、領域分類標準等方面各有不同,研究者需立足其優劣,根據研究目的選擇合適的樣本數據[21]。其次,獲取特定學科或領域的樣本文獻集時常采用基于關鍵詞組合[22]、主流期刊[23]、特定作者/機構/國家[24]、相關領域/學科分類[25]的檢索式。在獲取樣本文獻集后,對不同格式和質量的數據進行預處理和清洗也是必要的,共現圖譜繪制可能涉及的數據清洗類型有[26]:重復數據、拼寫錯誤或不完整數據、同形異義、同義異形、通用性強或無意義的詞等。

知識單元提取與篩選。知識單元是共現圖譜構建的基本元素,其來源可分為兩類:一是直接利用作者、機構、被引文獻和關鍵詞等文獻著錄項;二是從標題、摘要和全文中提取詞源(術語),由于詞源(術語)提取更具復雜性,現有研究日益將共詞分析的詞源選擇問題納入深入研究范圍[27]。此外,受研究工具、統計分析過程限制及出于提高結果分析與可視化效用的目的,研究者通常選擇部分知識單元繪制共現圖譜,這使得知識單元篩選也成為一個難以解決的問題,當前研究大多根據相關指標或方法篩選出核心知識單元(如表1),但對其篩選標準并沒有達成統一見解,很大程度上放大了知識單元過濾的主觀性和不確定性。

表1 常見知識單元篩選方法??

2.2.2 知識網絡構建

傳統共現矩陣構建。網絡是對復雜系統的簡化表示,通過抽取復雜系統中的關系模式,利用點和連線可建立抽象網絡結構,共現科學知識圖譜構建主要基于共現矩陣形式所表現的網絡。為有效提取樣本文獻集中的知識單元關系矩陣,通常先構造一個行動者集合*事件集合形式的M*N維屬性矩陣O(occurancematrix)(M指行動者集合的數量,N指行動者集合中所有或部分知識單元的個數,Okj表示第k個行動者與第j個知識單元的數量關系)[28],其中,“行動者”可以是文獻、作者、期刊、機構等主體,“事件”指不同類型的知識單元,如作者、關鍵詞、參考文獻,若行動者集合為文獻,事件集合為該文獻集所包含的關鍵詞,得到的屬性矩陣O表示某篇文獻k是否包含或包含關鍵詞j的數量。?

基于屬性矩陣O進行變換可得到的一個N階對稱方陣,即共現矩陣C(co-occurrencematrix),其中,對屬性矩陣O的轉換方式可分為基于事件轉換和基于行動者轉換兩種(表2),基于事件轉換可構建詞共現、合作、共被引等共現矩陣,基于行動者轉換可構建起耦合形式的共現矩陣,若屬性矩陣O表示樣本文獻集*被引文獻的關系,基于事件轉換的結果是文獻共被引矩陣,基于行動者轉換的結果為文獻耦合網絡。筆者以事件集合(x軸)、行動者集合(y軸)、轉換方式(z軸)建立三維坐標系,構建起如圖3所示的具有廣泛適用性的共現矩陣實現模型。

共現矩陣構建的另一關鍵問題是通過對共現矩陣的相似度度量消除量綱數量級差異造成的不可比性,通常采用相似度計算對共現矩陣進行標準化轉換,形成相似矩陣(similarity

matrix),共現數據相似性計算有兩種方式[29],一是根據共現次數這一單一指標來計算,如Pearson相關系數;二是根據兩個節點的共現次數、兩個節點各自出現的次數這三個指標來計算,如cosine、Jaccard index、association、strength,他們的數學原理不同會給計算結果造成顯著影響,但目前學術界尚未就不同相似度測度算法達成共識。

表2 共現矩陣提取方式? (注:定義 OT為矩陣 O 的轉置矩陣 )


圖3 三維坐標下的共現網絡構建模型

傳統共現矩陣的改進。傳統關系矩陣以知識單元的共現頻次為基礎衡量知識單元之間的相關性,這不可避免會存在“共現即相關”、“同量即同質”等缺陷,因此,越來越多學者開始注重對知識單元矩陣的優化,試圖引進更優的相關性計算方法測度知識單元間的相關關系。其一是進行差異化(加權)處理,突出核心知識單元或共現邊的主導作用,如吳清強等人[30]根據文獻來源期刊的重要程度對關鍵詞賦予權重,朱麗娟等人[31]提出將作者貢獻、作者之間人際關系、作者的學科及機構等因素引入合作網絡邊權計算;其二是考慮語義相關性,如唐曉波等人[32]引入領域本體計算高頻關鍵詞間的語義相似度,王玉林等人[33]則提出借助RDF三元組對知識單元進行語義關聯化。

2.2.3 知識發現與可視化層

關系矩陣并不能直觀的傳遞有價值的信息,需要借助統計分析方法和可視化技術構建知識圖譜[34],進一步揭示知識單元間的潛在規律,實現知識發現。現有共現科學知識圖譜工具主要提供兩種類型的知識發現與可視化方式:其一是直接將知識單元間的關系轉換為圖,即引入布局算法,按照特定方式將知識單元排列于圖中,從知識單元的位置對圖譜進行解讀;其二是利用統計算法對網絡進行測度,包括網絡總體特征、網絡模塊化、節點中心度、節點路徑特征、節點、動態度等,當然,對網絡節點及關系的測度值也會在外觀上作用于節點和邊,并映射到圖形屬性[35]。

網絡布局。筆者參照Eck和Waltman等人[36]提出的網絡布局分類,將目前應用于共現科學知識圖譜的布局算法分為三類(表3):基于距離法、基于圖法和基于時間線法,基于距離的布局利用節點間的距離揭示節點間的共現強度,典型算法包括多維尺度法、VOS布局、VxOrd、DrL、OpenOrd等;基于圖的布局也將節點布局在二維或多維空間中,但節點間的距離不代表二者關系的強弱,而是用連線表示,典型算法有Kamada-Kawai、Fruchterman-Reingold等,這些算法通常與尋徑網絡、最小生成樹算法結合使用,以達到修剪網絡的目的;而基于時間線的布局則包括兩個維度,一個維度用來反映時序關系,另一個用來揭示節點之間的聯系,其通常與前兩種布局算法結合使用。總體來說,現有布局算法均針對速度和美觀方面進行優化,主要目的體現在減少重疊、統一邊長度、實現對稱等。

表3 共現科學知識圖譜常見布局算法??

統計分析。在網絡統計分析方面,對網絡個體(節點和連線)、模塊化(小團體)、主干骨架及整體特性的測度是當前的主流方式(表4)。對網絡個體的測度目的是探討某一知識單元在網絡中的權力,而當網絡中某些知識單元間的關系特別緊密,以至于結合成一個次級子網絡時,這樣的子網絡通常被稱為“小團體”,通過網絡模塊化的方法可進行知識單元小團體發現。此外,由于特定領域或學科的產生及發展取決于為數不多的關鍵文獻,也有學者將主路徑分析引入共現圖譜中,用以識別關鍵文獻、關鍵人物和關鍵事件,從而更好地刻畫領域發展脈絡和知識演化過程。

表4 共現科學知識圖譜常見統計分析方法??

可視化映射。網絡布局和統計算法從量化的角度進行圖譜測度,而可視化手段則將測度結果反映到圖形屬性上。Wilkinson在2005年創建了一套描述統計圖形深層特性的語法規則[37],指出統計圖形是從數據到幾何對象(如點、線、條形等)的圖形屬性(如顏色、大小、形狀等)的映射,這其中包含數據統計變換,最后繪制在某個特定坐標系中[38]。反映到共現圖譜上,知識網絡中知識單元、連線的出現及共現頻次、時間、所屬類團及其他統計測度值均可映射到圖譜屬性,如節點大小反映知識單元出現頻次,節點顏色代表出現時間,連線粗細反映知識單元對之間的共現強度。在此基礎上,布局算法與圖譜屬性進一步融合,形成多種類型的可視化圖譜,如反映單元模塊化和結構性的聚類視圖,展現類團發展演化的時間線圖和時區圖,反映密度關系的熱力圖等,筆者借鑒Ognyanova[39]提出的網絡可視化框架,將共現圖譜從知識單元到圖形屬性的映射歸結為四大要素:映射主體、映射中介、映射結果和可視化目標(圖4),其中,“映射主體”指知識單元、連線、類團的統計屬性,如出現頻次、共現頻次和時間;“映射中介”指用以進行可視化的圖形屬性,如顏色、位置、大小和形狀;“映射結果”指從統計屬性到圖形屬性的最終視圖,如聚類視圖、熱力圖、弧圖和時間線圖,這三者共同實現共現圖譜“可視化目標”,即突出關鍵節點和連線、反映關系強度、展示網絡結構、發現小團體、洞察知識擴散及演化規律。

圖4 共現科學知識圖譜映射要素??

3 共現科學知識圖譜繪制工具

根據可處理數據類型的不同,將目前主流的共現圖譜軟件分為兩類(表5):第一類是以Pajek、Gephi、UCINET為代表的通用網絡分析工具,第二類是以CiteSpace、VOSviewer為代表的文獻專用圖譜繪制工具,筆者分別從可分析的圖譜類型、數據格式要求、統計分析功能、可視化及優勢等方面對當前主流共現圖譜繪制軟件進行歸納和對比。

表5 主流科學知識圖譜工具對比

表5表明,共現圖譜繪制工具在統計分析和可視化等方面存在很大不同,目前尚缺乏較完備的工具能將共現科學知識圖譜繪制過程中所涉及的技術和功能囊括在內,要進行深入分析需借助多種不同工具,而這其中涉及的一個關鍵問題是如何實現不同數據格式的轉換。通常來講,共現科學知識圖譜繪制常見的數據處理方式包括四種:一是從特定數據庫中下載不同格式的文獻題錄信息直接導入相應軟件;二是借助bibexcel、SATI、bicomb等工具抽取文獻記錄的字段信息,在進行頻次統計和生成共現矩陣(表)后導入支持的科學知識圖譜軟件;三是利用自編程序提取共現數據導入特定軟件;四是借助科學知識圖譜軟件提供的數據互操作功能(表6),其中,CiteSpace導出的矩陣數據支持的工具類型較多,但沒有可接受的知識圖譜類軟件數據格式,而Pajek、UCINET相對更具開放性。

表6 共現圖譜軟件的互操作情況

4 發展趨勢和挑戰

根據前文對共現科學知識圖譜構建技術與工具的梳理, 我們可以對當前挑戰和研究趨勢做一些回顧和預測(圖5)。

圖5 共現科學知識圖譜各環節面臨的主要挑戰??

4.1 知識單元選擇的客觀性、細粒度與多源性

繪制共現知識圖譜的基礎性工作是選擇知識單元,而知識單元的過多或過少都會對共現圖譜效果產生直接影響,這突出體現在:

知識單元選擇的客觀性與細粒度。合作、共被引等共現圖譜的知識單元相對明確,在篩選過程中所要解決的是選擇“何種篩選標準”以及選取“多少節點”的問題,而對于共詞圖譜來說,元數據描述取詞或全文自動標引取詞的詞源選擇問題,以及自然語言的不可控性所帶來的詞匯規范化[40]使其繪制更具復雜性和主觀性,雖然部分學者對共詞分析的詞源選擇問題進行了探索性或對比性分析,包括不同詞源選擇的應用對比、術語規范化的必要性和規范方法研究以及詞匯抽取的細粒度探究,但在研究結果上依然存在分歧。如何尋求更為科學有效的知識單元篩選方法,減少知識單元過濾的主觀性和不確定性?如何突破單純基于“元數據描述單元”的統計,研究有效算法提取粒度更細的“知識單元”?這些問題的解決都需要在未來研究中不斷探索。

知識單元選擇的多源性。科學交流系統不僅局限在科學技術文獻等正式交流渠道,數字化與網絡化語境推動下網絡計量學與替代計量學的興起,為共現圖譜的繪制帶來了更具創新性、可計量非正式交流特征的節點類型,如學術社區中知識主體的互動、網絡環境下知識單元的提及等,這種綜合多源知識單元的共現圖譜能更好反映知識類別界限、所構建的知識網絡更為緊密[41],如何挖掘存在于傳統科學文獻之外的新興知識單元,并將其有效融入共現知識圖譜中[42],更加全面反映學術景觀自然成為一個具有挑戰性的課題。

4.2 知識網絡構建的差異化、語義化與多維性

傳統共現圖譜的實現有兩大基本假設,一是“共現即相關”假設,即假設節點共現便意味著節點相關,但事實上知識單元間是存在直接共現關系和間接語義關聯的,這種研究假設缺乏對知識單元間語義關系的揭示,一定程度上簡化了網絡復雜性,未能有效揭示整體網絡的結構和特征信息[43]。二是“同量即同質”假設,即假設頻次相等,則重要性和相關性強度也相等,但從信息理論學、語言學及科研貢獻度的觀點來看,不同詞性、位置等要素的詞匯對文獻表達的貢獻程度是存在差異的,不同學者在網絡中的地位也是不一樣的,有效區分節點的差異性,考慮“同量不同質”,能更加客觀、真實反映科學交流系統內部要素的關聯。針對“共現不一定相關”、“同量不一定同質”這兩大問題,已有學者探索對知識單元及邊進行加權處理,以及研究有效測度節點間語義關系的算法[44],但大多處于探索性階段,現成知識圖譜繪制軟件中也僅有VOSviewer[45]將節點差異化算法嵌入。

此外,共現科學知識圖譜將抽象的計量信息表征為可視化的網絡,本質是對網絡的分析與可視化,已有研究表明,將多模網絡、多節點共現引入共現圖譜有利于增強圖譜信息揭示能力,將網絡動態演化機制應用于共現圖譜能更加真實的模擬網絡演化特征[46],探討如何將網絡結構維度上的異構、多模特征及時間維度上的演化特征引入共現圖譜是當前面臨的一個重要問題。

4.3 知識發現方法優化與計算能力提高

學術領域對共現圖譜的知識發現基本遵循“相似性測度+統計分析”的思路,在節點相似度計算方面,主要基于共現頻次這一基本指標衍生,包括互信息度算法、association strength、inclusion index、Jaccard’s coefficient、Salton’s cosine(Ochiia系數),如文獻共被引代表者Small主張采用Salton’s cosine或Jaccard’s coefficient測度[47],作者共被引代表者White傾向于Pearson相關系數[48],Leydesdorff則認為Pearson相關系數和cosine測度只適用于非對稱矩陣而不適用于對稱矩陣[49],在當前相似度計算算法眾說紛紜的情形下,有必要對不同算法應用于不同共現圖譜的效果進行對比研究,分析各類測度算法間的內在聯系及適用場景,提高后期統計分析的準確性和針對性。

在統計分析層面,突現檢測、聚類分析、多維尺度分析、社會網絡分析和主路徑分析一直占據主導地位,突現檢測用于提取突發術語,適用于識別研究前沿,聚類分析可識別不同類團,使得類團內節點具有高相似度、類團間存在較大差異,多維尺度分析則對聚類分析起進一步矯正作用,不僅可識別具有高相似度的類團,還可判定各節點在網絡中的相對位置和核心程度,社會網絡分析常用于探索學者、機構等主體間的合作關系,主路徑分析則在演化脈絡、關鍵節點識別方面更具優勢,各類統計分析方法的應用場景存在一定區別,需要對各類方法的優劣勢和適用性作進一步對比和梳理。另外,現有統計分析方法在參數選擇、分析過程等方面也存在一定模糊性,如聚類分析中類團數量的選擇、類間距離的選擇、類團標簽的確定等,這些懸而未決的問題使得共現圖譜的繪制充滿主觀性,進而導致研究人員對統計結果的解讀缺乏準確性與科學性。

在計算能力層面,大數據環境下共現圖譜的規模急劇擴大,這對計算機硬件及數據分析算法的性能提出更高的要求,探索能高效處理大規模、復雜化數據集的統計分析算法、尋求基于分布式計算機集群的云處理技術將更加清晰、快速的展示和發現海量知識單元間的復雜關系。

4.4 圖譜解讀的科學性與規范性

知識單元間的關系表現在多個層面和多種類型,其原理既有相似性又存在差別,進而繪制的知識圖譜在科學研究結構的揭示能力上具有相似性但又各具獨特性,知識基礎、研究熱點、研究前沿、演進脈絡等不同分析目標需要借助與之對應的圖譜類型,如基于共詞網絡的研究熱點識別、基于共被引網絡的知識基礎研究等,當前對不同網絡結構信息揭示能力的比較和內在機理研究相對缺乏,使得研究結果千差萬別,圖譜解讀欠缺科學性與規范性[50-51]。

5 結語

作為一種將各類信息載體中的共現現象定量化的有效手段和方法[52],幾十年來共現分析一直廣受圖情領域研究者青睞,并跨學科延伸至多領域,而融合圖形學、認知科學及可視化等技術的共現科學知識圖譜更有利推動了共現分析的快速發展與革新,并在基礎理論、方法研究和應用實踐方面取得顯著成果,無數研究表明,在可預見的未來,共現科學知識圖譜的“知識圖形可視化”與“知識譜系序列化”特征[53-54]及知識單元提取、網絡構建、知識發現與可視化等各環節的優化將進一步拓寬和深化基于海量數據的知識組織與發現,促進研究范式的變革與更迭。

參考文獻:

[1]? Price D J. NETWORKS OF SCIENTIFIC PAPERS[J].Science, 1965, 149(3683):510-515.

[2]? Small H. Co‐citation in the scientific literature:A new measure of the relationship between two documents[J]. Journal of theAmerican Society for Information Science & Technology, 1973, 24(4):265-269.

[3]? Callon M,Courtial J J P, Turner W A, et al. From translations to problematic networks - anintroduction to co-word analysis. Soc Sci Inf Sur Les Sci Soc[J]. SocialScience Information, 1983, 22(2):191-235.

[4]? Peters H PF, Raan A F J V. Structuring scientific activities by co-author analysis[J].Scientometrics, 1991, 20(1):235-255.

[5]? 陳悅, 劉則淵. 悄然興起的科學知識圖譜[J]. 科學學研究, 2005, 23(2):149-154.

[6]? 李明鑫, 王松. 近十年國內知識圖譜研究脈絡及主題分析[J]. 圖書情報知識, 2016(4):93-101.

[7]? 王發明, 朱美娟. 國內區塊鏈研究熱點的文獻計量分析[J]. 情報雜志, 2017(12):69-74.

[8]? 趙蓉英, 魏明坤. 基于可視化圖譜的國內外大數據研究[J]. 情報科學, 2016, V34(12):3-10.

[9]? Shiffrin RM, B?rner K. Mapping knowledge domains.[J]. Proc Natl Acad Sci U S A, 2004, 101Suppl 1(Supplement 1):5183-5185.

[10] 曹樹金, 吳育冰, 韋景竹,等. 知識圖譜研究的脈絡、流派與趨勢——基于SSCI與CSSCI期刊論文的計量與可視化[J]. 中國圖書館學報, 2015, 41(5):16-34.

[11] Chen C. Science Mapping:A Systematic Review ofthe Literature[J]. Journal of Data and Information Science, 2017, 2(2):1-40.

[12] Bishop A P.Digital libraries and knowledge disaggregation:the use of journal articlecomponents[C]// ACM Conference on Digital Libraries. ACM, 1998:29-39.

[13] 曹樹金, 李潔娜, 王志紅. 面向網絡信息資源聚合搜索的細粒度聚合單元元數據研究[J]. 中國圖書館學報, 2017, 43(4):74-92.

[14] Sugimoto CR, Mccain K W. Visualizing changes over time: A history of informationretrieval through the lens of descriptor tri-occurrence mapping.[J]. Journal ofInformation Science, 2010, 36(4):481-493.

[15] 楊立英. 科技論文共現理論研究與應用[D]. 中國科學院文獻情報中心, 2007.

[16] 張超星, 劉小玲, 譚宗穎. 圖情領域的大共現及其發展現狀[J]. 情報資料工作, 2016, 37(1):27-33.

[17] B?rner K,Chen C, Boyack K W. Visualizing knowledge domains[J]. Annual Review ofInformation Science & Technology, 2003, 37(1):179-255.

[18] 楊思洛, 韓瑞珍. 國外知識圖譜繪制的方法與工具分析[J]. 圖書情報知識, 2012(6):101-109.

[19] Cobo M J,Herrera-Viedma E, Herrera F. Science mapping software tools: Review, analysis,and cooperative study among tools[J]. Journal of the Association forInformation Science & Technology, 2014, 62(7):1382-1402.

[20] 楊萌, 張云中. 知識地圖、科學知識圖譜和谷歌知識圖譜的分歧和交互[J]. 情報理論與實踐, 2017, 40(5):122-126.

[21] Harzing A W, Alakangas S.Google Scholar, Scopus and the Web of Science: A longitudinal andcross-disciplinary comparison[J]. Scientometrics, 2016, 106(2):787-804

[22] 孫建軍. 鏈接分析:知識基礎、研究主體、研究熱點與前沿綜述——基于科學知識圖譜的途徑[J]. 情報學報, 2014, 33(6):659-672.

[23] 邱均平, 溫芳芳. 近五年來圖書情報學研究熱點與前沿的可視化分析——基于13種高影響力外文源刊的計量研究[J]. 中國圖書館學報, 2011, 37(2):51-60.

[24] 潘有能, 譚健. 普賴斯獎得主的科學合作網絡研究[J]. 圖書情報工作, 2012, 56(16):80-84.

[25] Zhu Y, YanE. Dynamic subfield analysis of disciplines: an examination of the tradingimpact and knowledge diffusion patterns of computer science[J]. Scientometrics,2015, 104(1):335-359.

[26] 潘瑋, 牟冬梅, 李茵,等. 關鍵詞共現方法識別領域研究熱點過程中的數據清洗方法[J]. 圖書情報工作, 2017, 61(7):111-117.

[27] 李綱, 巴志超. 共詞分析過程中的若干問題研究[J]. 中國圖書館學報, 2017, 43(4):93-113.

[28] Aria M,Cuccurullo C. bibliometrix : An R-tool for comprehensive science mappinganalysis[J]. Journal of Informetrics, 2017, 11(4):959-975.

[29] Eck N J V,Waltman L. How to normalize cooccurrence data? An analysis of some well‐known similarity measures[J].Journal of the Association for Information Science & Technology, 2010,60(8):1635-1651.

[30] 吳清強, 趙亞娟. 基于論文屬性的加權共詞模型探討[J]. 情報學報, 2008, 27(1):89-92.

[31] 朱麗娟, 于建榮. 合著關系網絡的加權模式研究[J]. 圖書情報工作, 2010, 54(12):69-73.

[32] 唐曉波, 肖璐. 融合關鍵詞增補與領域本體的共詞分析方法研究[J]. 現代圖書情報技術, 2013, 29(11):60-67.

[33] 王玉林, 王忠義. 細粒度語義共詞分析方法研究[J]. 圖書情報工作, 2014, 58(21):73-80.

[34] 徐碩, 喬曉東, 朱禮軍,等. 共現聚類分析的新方法:最大頻繁項集挖掘[J]. 情報學報, 2012, 31(2):143-150.

[35] 劉勇, 杜一. 網絡數據可視化與分析利器: Gephi中文教程[M]. 北京: 電子工業出版社, 2017:3-4

[36] Eck N J V,Waltman L. Visualizing Bibliometric Networks[M]// Measuring Scholarly Impact.Springer International Publishing, 2014:285-320.

[37] Wilkinson L. The grammar of graphics[M]. Springer, 2005:85-356

[38] 哈德利?威克姆. ggplot2:數據分析與圖形藝術[M]. 西安交通大學出版社, 2013:3-4

[39] Ognyanova,K. Network visualization with R. Retrieved from www.kateto.net/network-visualization.2017

[40] 傅柱, 王曰芬. 共詞分析中術語收集階段的若干問題研究[J]. 情報學報, 2016, 35(7):704-713.

[41] 張洋, 謝卓力. 基于多源網絡學術信息聚合的知識圖譜構建研究[J]. 圖書情報工作, 2014, 58(22):84-94.

[42] 商憲麗, 王學東, 張煜軒. 基于標簽共現的學術博客知識資源聚合研究[J]. 情報科學, 2016, V34(5):125-129.

[43] 巴志超, 李綱, 朱世偉. 共現分析中的關鍵詞選擇與語義度量方法研究[J]. 情報學報, 2016, 35(2):197-207.

[44] 王忠義, 譚旭, 夏立新. 共詞分析方法的細粒度化與語義化研究[J]. 情報學報, 2014(9):969-978.

[45] Perianes-RodriguezA, Waltman L, Eck N J V. Constructing bibliometric networks: A comparisonbetween full and fractional counting [J]. Journal of Informetrics, 2016,10(4):1178-1195.

[46] 黨永杰, 邱均平, 鄭世玨. 基于改進BA模型的作者合作加權網絡動態演化研究[J]. 情報學報, 2017, 36(1):28-38.

[47] Small H .Tracking and predicting growth areas in science[J]. Scientometrics, 2006,68(3):595-610.

[48] White H D .Author cocitation analysis and Pearson's r[M]. John Wiley & Sons, Inc.2003.

[49] LeydesdorffL , Vaughan L . Co-occurrence matrices and their applications in informationscience: Extending ACA to the Web environment[M]. John Wiley & Sons, Inc.2006.

[50] 崔雷, 隋明爽. 共現聚類分析結果表達方法的研究[J]. 情報學報, 2015, 34(12):1270-1277.

[51] 邱均平, 董克. 作者共現網絡的科學研究結構揭示能力比較研究[J]. 中國圖書館學報, 2014, 40(1):15-24.

[52] Kostoff RN. Multidisciplinary research thrusts from co-word analysis[C]// TechnologyManagement : the New International Language. IEEE, 2002.

[53] 劉則淵, 陳悅, 侯海燕. 科學知識圖譜:方法與應用[M]. 人民出版社, 2008:3-5

[54] 劉則淵, 陳超美, 侯海燕,等. 邁向科學學大變革的時代[J]. 科學學與科學技術管理, 2009, 30(7):5-12.

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,646評論 6 533
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,595評論 3 418
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,560評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,035評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,814評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,224評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,301評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,444評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,988評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,804評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,998評論 1 370
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,544評論 5 360
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,237評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,665評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,927評論 1 287
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,706評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,993評論 2 374