學會了用VOSviewer分析Web of Science數據后,想不想知道如何用它分析中文文獻?本文用CNKI數據做樣例,一步步教你實現步驟。
疑問
自從寫了《如何快速梳理領域文獻》一文后,不少讀者留言或者來信問我一個問題:
如何可視化分析中文文獻呢?
我之前沒有用VOSviewer做過中文文獻的梳理,所以還真不知道VOSviewer是否有這個功能。
但是我在博士畢業論文里用Citespace分析過中文文獻,所以就用我最有把握的答案做了答復。
不過,隨著問這個問題的人越來越多,我也來了興趣:VOSviewer到底能否分析中文文獻數據呢?
懷疑的原因,是因為之前在網上查資料時,看到的好像都是英文分析結果。而且VOSviewer的作者都是外國人,所以我不確認它對中文文獻是否友好。
于是,我決定驗證一下。
驗證的方法,不是直接拿軟件來嘗試,而是查文獻。
驗證
有句話,叫“在有魚的地方釣魚”,我覺得是至理名言。
如果有人用VOSviewer做過中文文獻分析,你覺得這樣的結果更可能在哪里出現呢?
新聞?博客?……不,一定是科研論文,而且是中文論文里。
我們到CNKI數據庫里找找看。
在CNKI首頁,以“VOSviewer”作為主題詞檢索。獲得了以下結果。
看來將VOSviewer作為研究工具的論文還真不少呢。
我們從標題尋找其中更有可能使用中文文獻數據的論文,于是找到了這篇《2010年中國檔案學研究熱點的知識圖譜分析》。
看了摘要,確認該文使用中文期刊數據,分析工具為VOSviewer。
于是我們下載原文看看。
在文中顯著位置,我們看到了這幅圖。
這幅圖說明,VOSviewer不僅支持中文文獻分析,而且至少從2011年就支持了。
好了,我們的疑惑解決了——VOSviewer可以分析中文文獻數據。
自然地,下一個問題就是:
該怎么做呢?
數據
第一步當然是收集數據。
我們繼續使用CNKI。這次我們以“圖書情報知識”(情報學領域核心期刊之一)作為“文獻來源”檢索詞搜索。
獲得的結果,有4700多條。我這里連接網速不夠快,4700多條文獻記錄都下載下來,需要很久。咱們精煉一下,只選擇2016年的數據。
2016年的記錄,一共有101條。我們每次50條,不斷翻頁,全部勾選。
勾選完畢后,選擇“導出/參考文獻”。
在屏幕的左側,我們可以看到不同的導出類型。
問題來了,該導出哪一種呢?
這時我們打開VOSviewer,瞄一眼,看VOSviewer可以接受哪些格式。
這里我們看到了Web of Science, Scopus, PubMed, RIS等格式。
我們的目標,是取CNKI導出格式,與VOSviewer導入格式的交集。
結果令人很苦惱——交集為空。
到這里,我大概知道為什么這么多讀者發問了。不少人可能在CNKI上做到了這一步,然后就不知道該怎么辦了。
其實你不必焦慮。因為文獻記錄格式之間,是可以轉換的。
我們選擇其中的Endnote格式,導出。
根據提示,存儲導出的txt文件。
我們打開這個文本文件,看看內容。
經檢驗,數據完整導出。下面我們就要嘗試格式轉換了。
轉換
我們的目標,是把數據轉化為VOSviewer可以支持的格式類型。
我們打開Endnote。
從主菜單里,選擇“導入(Import)”。
在彈出的窗口里,瀏覽并找到我們剛剛從CNKI導出的txt文件。
注意,此時不要直接導入文本文件,否則導入結果是空的。
我們需要調整一下選項。點擊文件瀏覽窗口左下角的“Option”。
點擊其中的第一項,可以看到許多選項。Endnote作為老牌的文獻管理工具,支持的數據格式很豐富。
選擇“Endnote Import”。這樣Endnote才知道,我們導入的,是Endnote自己的交換格式。
點擊確定后,你就能看到100余篇文獻正確導入進來了。
我們在這里對文獻做粗略篩選。略去“卷首語”和重復文章,同時略掉沒有作者的(一般是征稿啟示等內容)文章。
篩選后的文獻選中,選擇“導出”(Export)。
Endnote會提示我們導出的選項。
我們把輸出的文件名設定為有意義的名稱。注意要把“Output Style”選擇為“RIS”格式。
如果你的菜單里面沒有“RIS”格式,可以先選擇“Select another Style”。
然后你會看到許許多多的導出格式選項,下拉列表到“R”開頭的區域,找到“RIS”。
選擇后,“RIS”就被添加進來了。
默認導出文件擴展名是txt。我們將其修改為ris,以方便VOSviewer識別。
我們打開RIS文件看看內容:
可以看到,元數據都被保留,但是組織格式發生了變化。
至此,利用Endnote轉換文獻記錄格式環節順利完成。我們終于可以愉快地分析CNKI文獻了。
分析
在VOSviewer中選擇“Create”。會彈出以下對話框。我們選擇第二項。
然后我們需要選擇導入文獻的類型和位置。
點擊“RIS”標簽頁,利用文件選擇器,定位到剛剛Endnote導出的RIS文件上。
下面選擇分析類型,我們選擇作者共現(Co-authorship)分析。
因為文章篇數太少,我們不得不把閾值定低一些。
彈出的對話框里,我們可以依據實際情況,把某些記錄過濾掉。這里我們選擇保持不變。
執行后,就能看到Co-authorship分析結果了。
我們放大結果圖,看看細節。
圖中中文顯示一切正常。
至此,咱們利用VOSviewer分析CNKI文獻記錄的演示完成。
小結
回顧一下,本文主要介紹了以下內容:
- 我們確認了VOSviewer不止可以分析英文文獻,也可以分析中文文獻;
- 驗證猜想,需要找證據。找證據的關鍵,是在最可能的地方著手搜索和挖掘;
- 文獻記錄的格式多種多樣,但是其間大多是可以轉換的。Endnote作為橋梁,可以幫我們把CNKI的導出結果轉換為VOSviewer需要的RIS格式。
討論
讀過本文后,你是否了解如何用VOSviewer分析中文文獻數據?你之前做中文文獻可視化分析時,用過不同的方法嗎?它們是否更有效和便捷呢?歡迎留言,把你的經驗分享給大家,我們一起交流討論。
這里給你留個思考題:如果要做引文分析,CNKI的數據可以嗎?希望你能親自動手嘗試一下,把結果反饋給我。
如果你對我的文章感興趣,歡迎點贊,并且微信關注和置頂我的公眾號“玉樹芝蘭”(nkwangshuyi)。
如果本文可能對你身邊的親友有幫助,也歡迎你把本文通過微博或朋友圈分享給他們。讓他們一起參與到我們的討論中來。