如何用VOSviewer分析CNKI數據?

學會了用VOSviewer分析Web of Science數據后,想不想知道如何用它分析中文文獻?本文用CNKI數據做樣例,一步步教你實現步驟。

image

疑問

自從寫了《如何快速梳理領域文獻》一文后,不少讀者留言或者來信問我一個問題:

如何可視化分析中文文獻呢?

image

我之前沒有用VOSviewer做過中文文獻的梳理,所以還真不知道VOSviewer是否有這個功能。

但是我在博士畢業論文里用Citespace分析過中文文獻,所以就用我最有把握的答案做了答復。

image

不過,隨著問這個問題的人越來越多,我也來了興趣:VOSviewer到底能否分析中文文獻數據呢?

懷疑的原因,是因為之前在網上查資料時,看到的好像都是英文分析結果。而且VOSviewer的作者都是外國人,所以我不確認它對中文文獻是否友好。

image

于是,我決定驗證一下。

驗證的方法,不是直接拿軟件來嘗試,而是查文獻。

驗證

有句話,叫“在有魚的地方釣魚”,我覺得是至理名言。

如果有人用VOSviewer做過中文文獻分析,你覺得這樣的結果更可能在哪里出現呢?

新聞?博客?……不,一定是科研論文,而且是中文論文里。

我們到CNKI數據庫里找找看。

在CNKI首頁,以“VOSviewer”作為主題詞檢索。獲得了以下結果。

image

看來將VOSviewer作為研究工具的論文還真不少呢。

我們從標題尋找其中更有可能使用中文文獻數據的論文,于是找到了這篇《2010年中國檔案學研究熱點的知識圖譜分析》。

image

看了摘要,確認該文使用中文期刊數據,分析工具為VOSviewer。

于是我們下載原文看看。

在文中顯著位置,我們看到了這幅圖。

image

這幅圖說明,VOSviewer不僅支持中文文獻分析,而且至少從2011年就支持了。

好了,我們的疑惑解決了——VOSviewer可以分析中文文獻數據。

自然地,下一個問題就是:

該怎么做呢?

數據

第一步當然是收集數據。

我們繼續使用CNKI。這次我們以“圖書情報知識”(情報學領域核心期刊之一)作為“文獻來源”檢索詞搜索。

image

獲得的結果,有4700多條。我這里連接網速不夠快,4700多條文獻記錄都下載下來,需要很久。咱們精煉一下,只選擇2016年的數據。

image

2016年的記錄,一共有101條。我們每次50條,不斷翻頁,全部勾選。

image

勾選完畢后,選擇“導出/參考文獻”。

image

在屏幕的左側,我們可以看到不同的導出類型。

問題來了,該導出哪一種呢?

這時我們打開VOSviewer,瞄一眼,看VOSviewer可以接受哪些格式。

image

這里我們看到了Web of Science, Scopus, PubMed, RIS等格式。

我們的目標,是取CNKI導出格式,與VOSviewer導入格式的交集。

結果令人很苦惱——交集為空。

到這里,我大概知道為什么這么多讀者發問了。不少人可能在CNKI上做到了這一步,然后就不知道該怎么辦了。

其實你不必焦慮。因為文獻記錄格式之間,是可以轉換的。

image

我們選擇其中的Endnote格式,導出。

image

根據提示,存儲導出的txt文件。

我們打開這個文本文件,看看內容。

image

經檢驗,數據完整導出。下面我們就要嘗試格式轉換了。

轉換

我們的目標,是把數據轉化為VOSviewer可以支持的格式類型。

我們打開Endnote。

image

從主菜單里,選擇“導入(Import)”。

image

在彈出的窗口里,瀏覽并找到我們剛剛從CNKI導出的txt文件。

image

注意,此時不要直接導入文本文件,否則導入結果是空的。

我們需要調整一下選項。點擊文件瀏覽窗口左下角的“Option”。

image

點擊其中的第一項,可以看到許多選項。Endnote作為老牌的文獻管理工具,支持的數據格式很豐富。

image

選擇“Endnote Import”。這樣Endnote才知道,我們導入的,是Endnote自己的交換格式。

image

點擊確定后,你就能看到100余篇文獻正確導入進來了。

image

我們在這里對文獻做粗略篩選。略去“卷首語”和重復文章,同時略掉沒有作者的(一般是征稿啟示等內容)文章。

image

篩選后的文獻選中,選擇“導出”(Export)。

image

Endnote會提示我們導出的選項。

image

我們把輸出的文件名設定為有意義的名稱。注意要把“Output Style”選擇為“RIS”格式。

如果你的菜單里面沒有“RIS”格式,可以先選擇“Select another Style”。

image

然后你會看到許許多多的導出格式選項,下拉列表到“R”開頭的區域,找到“RIS”。

image

選擇后,“RIS”就被添加進來了。

默認導出文件擴展名是txt。我們將其修改為ris,以方便VOSviewer識別。

我們打開RIS文件看看內容:

image

可以看到,元數據都被保留,但是組織格式發生了變化。

至此,利用Endnote轉換文獻記錄格式環節順利完成。我們終于可以愉快地分析CNKI文獻了。

分析

在VOSviewer中選擇“Create”。會彈出以下對話框。我們選擇第二項。

image

然后我們需要選擇導入文獻的類型和位置。

image

點擊“RIS”標簽頁,利用文件選擇器,定位到剛剛Endnote導出的RIS文件上。

image

下面選擇分析類型,我們選擇作者共現(Co-authorship)分析。

image

因為文章篇數太少,我們不得不把閾值定低一些。

image

彈出的對話框里,我們可以依據實際情況,把某些記錄過濾掉。這里我們選擇保持不變。

執行后,就能看到Co-authorship分析結果了。

image

我們放大結果圖,看看細節。

image

圖中中文顯示一切正常。

至此,咱們利用VOSviewer分析CNKI文獻記錄的演示完成。

小結

回顧一下,本文主要介紹了以下內容:

  1. 我們確認了VOSviewer不止可以分析英文文獻,也可以分析中文文獻;
  2. 驗證猜想,需要找證據。找證據的關鍵,是在最可能的地方著手搜索和挖掘;
  3. 文獻記錄的格式多種多樣,但是其間大多是可以轉換的。Endnote作為橋梁,可以幫我們把CNKI的導出結果轉換為VOSviewer需要的RIS格式。

討論

讀過本文后,你是否了解如何用VOSviewer分析中文文獻數據?你之前做中文文獻可視化分析時,用過不同的方法嗎?它們是否更有效和便捷呢?歡迎留言,把你的經驗分享給大家,我們一起交流討論。

這里給你留個思考題:如果要做引文分析,CNKI的數據可以嗎?希望你能親自動手嘗試一下,把結果反饋給我。

如果你對我的文章感興趣,歡迎點贊,并且微信關注和置頂我的公眾號“玉樹芝蘭”(nkwangshuyi)。

如果本文可能對你身邊的親友有幫助,也歡迎你把本文通過微博或朋友圈分享給他們。讓他們一起參與到我們的討論中來。

延伸閱讀

如何用《玉樹芝蘭》入門數據科學?

數據科學相關文章合集(玉樹芝蘭)

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,527評論 6 544
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,687評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,640評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,957評論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,682評論 6 413
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 56,011評論 1 329
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,009評論 3 449
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,183評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,714評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,435評論 3 359
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,665評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,148評論 5 365
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,838評論 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,251評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,588評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,379評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,627評論 2 380

推薦閱讀更多精彩內容