本文基于公眾號(hào)“玉樹芝蘭”《如何用R快速了解科研領(lǐng)域》撰寫,感謝老師的分享。
BiblioShiny官方網(wǎng)址:https://bibliometrix.org/
BiblioShiny
官網(wǎng)說明:
Biblioshiny分為:
三個(gè)不同級(jí)別指標(biāo)的分析和圖表:
-來源?
-作者?
-文獻(xiàn)
知識(shí)的三個(gè)結(jié)構(gòu)(K結(jié)構(gòu)):?
-概念結(jié)構(gòu)?:主題和趨勢(shì)
-知識(shí)結(jié)構(gòu)?:作者對(duì)該領(lǐng)域的影響力
-社會(huì)結(jié)構(gòu):作者、機(jī)構(gòu)、國(guó)家如何彼此影響
簡(jiǎn)單來說,這款工具可以對(duì)某一科研領(lǐng)域的作者、期刊、文獻(xiàn)計(jì)量分析,無需敲打代碼,就可以對(duì)該科研領(lǐng)域有一個(gè)簡(jiǎn)單的認(rèn)識(shí)。
接下來的篇幅,主要圍繞BiblioShiny各個(gè)模塊介紹,大家可以根據(jù)需求進(jìn)行相應(yīng)分析。
數(shù)據(jù)
數(shù)據(jù)從Web of Science下載,選擇數(shù)據(jù)庫(kù)“Web of Science核心合集”,檢索式主題“information serendipit*”or 主題“information encounter*”,時(shí)間跨度“所有年份”。
對(duì)結(jié)果精煉,文獻(xiàn)類型“ARTICLE”。
避免文獻(xiàn)相關(guān)性過低,通過觀察,選擇前1000條。
導(dǎo)出格式選擇“其他文件格式”,記錄來源“1至500”,記錄內(nèi)容“全紀(jì)錄與引用的參考文獻(xiàn)”,文件格式“BibTex”。下一次導(dǎo)出,記錄來源改變“501-1000”。將下載的文件保存為Archive.zip。
安裝
通過官網(wǎng)安裝R與Rstudio,安裝后,在Rstudio中執(zhí)行以下命令。
如果安裝包過程中出現(xiàn)問題,有可能是鏡像問題。
選擇“Tools”中“Global Options”,Packages-CRAN Mirrors-China(Beijing)-enter鍵。
安裝成功,會(huì)跳出如下頁(yè)面。
數(shù)據(jù)加載與過濾(Data&Filter)
選擇Data-Import or Load,Import raw file(s)-Web of Science(WoS/WoK)-BibTex,將下載的wos數(shù)據(jù)上傳,可以選擇將bibliometrix文件另存為excel/R Data Format格式。
過濾:可以根據(jù)文獻(xiàn)類型、出版年份、被引次數(shù)、來源
數(shù)據(jù)集
Main Information(部分)
Annual Scientific Production:每年發(fā)文量
Average Citations per Year:每年平均引用次數(shù)
Three-Fields Plot:可以更改不同字段、調(diào)整數(shù)目,繪制可視化圖,記得Apply!
Sources(來源)
Most Relevant Sources:與該主題相關(guān)的期刊
Most Local Cited Sources:高被引期刊(當(dāng)前文獻(xiàn)集)
Bradford’s law:根據(jù)布拉德福定律劃分出核心區(qū)
Source Impact:期刊影響因子
Source Dynamics:期刊出現(xiàn)次數(shù)
Authors(作者)
Most Relevant Authors:最高產(chǎn)作者
其中,F(xiàn)ractionalized Frequency是作者對(duì)于論文的貢獻(xiàn)率。
Author’s Production over Time:高產(chǎn)作者近期發(fā)文
Lotka’s law:洛特卡定律(核心作者)
Author Impact:作者影響因子
Most Relevant Affiliations:最高產(chǎn)機(jī)構(gòu)
Corresponding Author’s Country:合著作者的國(guó)籍
其中MCP表示與其他國(guó)家作者合著論文的數(shù)量;SCP表示同國(guó)籍作者合著論文數(shù)量。
MCP_Ratio可以看出國(guó)際合作的比率高低。
Country Scientific Production:各個(gè)國(guó)家發(fā)文量
Most Cited Countries:高被引國(guó)家以及被引次數(shù)
Document(文獻(xiàn))
Most Global Cited Documents:在web of science中高被引文獻(xiàn)
Most Local Cited Documents:在當(dāng)前數(shù)據(jù)集中高被引文獻(xiàn)
Most Local Cited References:在當(dāng)前數(shù)據(jù)集中高被引的參考文獻(xiàn)
Reference Spectroscopy:每年參考文獻(xiàn)的數(shù)量
Most Frequent Words:高頻詞
根據(jù)需求,更改字段。
Keywords Plus:WoS增加的關(guān)鍵詞是和原文章相關(guān)的關(guān)鍵詞,但是作者本人沒有添加,為了增加文章在相關(guān)專題下的命中率。
WordCloud:詞云
TreeMap:樹圖
Word Dynamics:詞出現(xiàn)次數(shù),展示詞變化趨勢(shì)
Trend Topics:根據(jù)今年詞出現(xiàn)頻次推測(cè)熱點(diǎn)話題
Conceptual Structure(概念結(jié)構(gòu))
Co-occurrence Network:共現(xiàn)網(wǎng)絡(luò)
可以選擇對(duì)應(yīng)詞,確定與其相關(guān)聯(lián)的其他詞
Thematic Map:主題地圖
橫軸:中心度;縱軸:密度
第一象限(右上角):motor themes,既重要又有良好發(fā)展;
第二象限(左上角):highly developed and isolated themes,已有良好發(fā)展,但是對(duì)于當(dāng)前領(lǐng)域不重要;
第三象限(左下角):emerging or declining themes,邊緣主題,也沒有好的發(fā)展,可能剛剛涌現(xiàn),也許即將消失;
第四象限(右下角):basic and transversal themes,對(duì)領(lǐng)域很重要,但是未獲得良好發(fā)展。一般是指基礎(chǔ)概念。
Thematic Evolution:主題演化
Factorial Analysis:析因分析
三種方法:
Correspondence Analysis:對(duì)應(yīng)分析
Multiple Correspondence Analysis:多重對(duì)應(yīng)分析
Multidimensional Scaling:多維標(biāo)度法
word map(詞匯地圖)將研究領(lǐng)域劃分為幾個(gè)類別
最具貢獻(xiàn)論文(Most Contributing Papers)
Contributing:匯總的信息中每篇論文的權(quán)重
在wos被引次數(shù)最高的文獻(xiàn)(Most Cited Papers)
Intellectual Structure(知識(shí)結(jié)構(gòu))
Co-citation Network:同被引網(wǎng)絡(luò)
Historiograph:了解數(shù)據(jù)集中重要性較高文獻(xiàn)
Table列表中,LCS表示當(dāng)前數(shù)據(jù)集中,文獻(xiàn)被引次數(shù),也就是文獻(xiàn)在該領(lǐng)域的重要程度;GCS表示W(wǎng)eb of Science 中,文獻(xiàn)被引次數(shù)。
Social Structure(社會(huì)結(jié)構(gòu))
Collaboration Network:合作網(wǎng)絡(luò)(作者、機(jī)構(gòu)、國(guó)家)
Collaboration WorldMap
繪制圖是第一步,解讀圖是至關(guān)重要,合理應(yīng)用計(jì)量指標(biāo)以及設(shè)置參數(shù),才能快速了解某一科研領(lǐng)域。
以上對(duì)biblioshiny中的指標(biāo)解讀可能會(huì)存在不足,歡迎大家批評(píng)指正!