16S測(cè)序分析(二)菌群多樣性分析

導(dǎo)讀

多樣性分析是16S測(cè)序分析中常見(jiàn)的分析方法。本文旨在向初學(xué)者介紹多樣性分析中alpha多樣性和beta多樣性的由來(lái)、概念、計(jì)算,以及展示“如何用R語(yǔ)言實(shí)現(xiàn)alpha多樣性和beta多樣性的計(jì)算和可視化”的工作流程。

一、概念介紹

Alpha多樣性、beta多樣性和gamma多樣性的概念由美國(guó)杰出的生態(tài)學(xué)家Robert Harding Whittaker提出。Whittaker將一個(gè)環(huán)境中總的物種多樣性命名為gamma多樣性。Gamma多樣性由alpha多樣性和beta多樣性共同決定。Alpha多樣性指在環(huán)境中的一個(gè)區(qū)域內(nèi)的平均物種多樣性。Beta多樣性指環(huán)境中不同區(qū)域之間的差異。

二、Alpha多樣性指數(shù)

1. Shannon指數(shù):

Shannon指數(shù)最初是由Claude Shannon提出用來(lái)計(jì)算字符串文本信息熵的指標(biāo),后來(lái)逐漸發(fā)展成生態(tài)學(xué)研究中最常用的多樣性指數(shù)。Shannon指數(shù)不只考慮物種豐富度(Richness,樣本中物種數(shù)),而且同時(shí)考慮物種的均勻度(Evenness,平均程度),所以它是反應(yīng)群落結(jié)構(gòu)的綜合指標(biāo)。
計(jì)算方法:


公式

Pi:第i個(gè)物種的個(gè)體數(shù)占樣本中總個(gè)體數(shù)的比例
R:樣本中的總物種數(shù)
樣本的Shannon指數(shù)越高,則其物種多樣性也越高。

2. Simpson指數(shù):

Simpson指數(shù)是由Edward H. Simpson在1949年提出評(píng)價(jià)生物多樣性的另一種常用指標(biāo)。它也是既考慮樣本中的物種豐富度,又考慮物種均勻度的綜合指標(biāo)。
計(jì)算方法:


公式

Pi:第i個(gè)物種的個(gè)體數(shù)占樣本中總個(gè)體數(shù)的比例
R:樣本中的總物種數(shù)
Simpson指數(shù)的取值范圍在0和1之間。樣本的Simpson指數(shù)越高,則其物種多樣性也越高。

三、Beta多樣性的計(jì)算

Beta多樣性專(zhuān)用于不同樣本間的比較,它不能直接通過(guò)某一個(gè)樣本的物種豐富度和均勻度計(jì)算出該樣本的多樣性度量值。Beta多樣性是利用不同樣本間的豐度變化或進(jìn)化關(guān)系來(lái)計(jì)算樣本間距離,從而反映樣本間是否具有顯著的微生物群落差異。
計(jì)算beta多樣性的方法有很多:有最為常用的bray curtis距離、Jaccard距離還有歐式距離,他們考慮的是樣本間物種豐度(有無(wú))和均度(相對(duì)豐度);另外還有Unifrac距離法,它是根據(jù)系統(tǒng)發(fā)生樹(shù)進(jìn)行比較。

四、準(zhǔn)備工作

軟件準(zhǔn)備(window環(huán)境):

1. R
地址:https://www.r-project.org/
版本:3.4.1

2. R包:openxlsx
功能:打開(kāi)Excel文件
版本:4.1

3. R包:vegan
功能:包內(nèi)含有多種生態(tài)學(xué)分析必備的函數(shù)
版本:2.4

4. Excel
功能:數(shù)據(jù)處理

數(shù)據(jù)準(zhǔn)備:

標(biāo)準(zhǔn)化菌屬相對(duì)豐度表。獲取方法請(qǐng)參考16S測(cè)序分析系列(一)菌屬豐度表獲取

五、Alpha多樣性的計(jì)算和可視化

install.packages("openxlsx")  ##  下載安裝openxlsx包
install.packages("vegan")  ##  下載安裝vegan包

setwd("C:/mywd")  ##  設(shè)置工作目錄為C盤(pán)mywd文件夾
getwd()  ##  進(jìn)入工作目錄

library(openxlsx)  ##  調(diào)用openxlsx包
library(vegan)  ##  調(diào)用vegan包

workbook <- "C:/mywd/data.xlsx"
##  讀取并存儲(chǔ)data.xlsx的內(nèi)容到workbook

說(shuō)明:data.xlsx必須是標(biāo)準(zhǔn)化后的菌屬相對(duì)豐度表,格式如下:第一行是菌屬名稱(chēng),其余每行代表一個(gè)樣本,每列代表一類(lèi)菌屬的在每一個(gè)樣本中的相對(duì)豐度。

圖片.png
mydataframe <- read.xlsx(workbook, 1)
##  讀取并存儲(chǔ)workbook中的第一個(gè)sheet的內(nèi)容到mydataframe

alpha_shannon <- diversity(mydataframe, "shannon") 
##  用vegan包中的diversity函數(shù)計(jì)算shannon多樣性

write.xlsx(alpha_shannon, "data_diversity.xlsx")
## 獲得shannon多樣性指標(biāo)的計(jì)算結(jié)果,即data_diversity.xlsx
## 保存alpha_shannon到當(dāng)前的data_diversity.xlsx中(可自動(dòng)創(chuàng)建)

數(shù)據(jù)處理:打開(kāi)data_diversity.xlsx文件如“1”。其中第一個(gè)樣本的shannon index是shannon index 1,以此類(lèi)推。然后我們把這些shannon index加上變量名和分組信息(將其分為A,B兩組),得到“2”。利用R或者Excel可以對(duì)“2”中的數(shù)據(jù)進(jìn)行分組T檢驗(yàn),方法很簡(jiǎn)單,所以這里不再加以展示。接下來(lái)我將利用“2”制作boxplot來(lái)更直觀的觀察兩組的shannon index是否有明顯的差異。

圖片.png
workbook2 <- "C:/mywd/data_diversity.xlsx"
##  讀取并存儲(chǔ)data_diversity.xlsx的內(nèi)容到workbook2

mydataframe2 <- read.xlsx(workbook2, 1)
##  讀取并存儲(chǔ)workbook2中的第一個(gè)sheet的內(nèi)容到mydataframe2

boxplot(mydataframe2$Diversity~ mydataframe2$Group, main="Shannon index", col=c("green", "red"))
## mian:命名;col:上色
## 可視化結(jié)果如下。

圖片.png

由圖可見(jiàn),A組的多樣性明顯高于B組。

六、Beta多樣性的計(jì)算和可視化

setwd("C:/mywd")
getwd()

library(openxlsx)
library(vegan)

workbook <- "C:/mywd/data.xlsx"
mydataframe <- read.xlsx(workbook, 1)
ord <- cmdscale(vegdist(mydataframe, method="bray"))

write.xlsx(ord, "data_ord.xlsx")

數(shù)據(jù)處理:data_ord.xlsx中保存的是每個(gè)樣本的二維坐標(biāo)信息,它是進(jìn)行此分析的最關(guān)鍵的文件。用windows打開(kāi)data_ord.xlsx文件,格式如“1”。第一行是變量名,其余每行是每個(gè)樣本的坐標(biāo)信息。添加分組信息,如下圖“2”。為了方便作圖,我這里直接使用顏色”Color”代替組別”Group”,即red代替Group A,blue代替Group B。接下來(lái)利用“2”中的樣本坐標(biāo)信息進(jìn)行繪圖。

圖片.png
workbook3 <- "C:/mywd/data_ord.xlsx"
mydataframe3 <- read.xlsx(workbook3, 1)

plot(x=mydataframe3$V1,y=mydataframe3$V2,xlab="mds1",ylab="mds2",main="Beta diversity ( Bray Curtis )" , pch=19, col=mydataframe3$Color)
##  x=mydataframe3$V1,y=mydataframe3$V2:以V1為橫坐標(biāo),V2為縱坐標(biāo)
##  xlab:設(shè)置坐標(biāo)名稱(chēng)
##  main:設(shè)置圖片名稱(chēng)
##  pch=19:用點(diǎn)表示樣本
##  col=mydataframe3$Color:根據(jù)Color中的信息對(duì)點(diǎn)上色

legend("topright", pch=c(19, 19), col=c("red", "blue"), legend=c("Group A", "Group B"))
##  "topright":設(shè)置圖注在右上角
##  pch=c(19, 19):繪制兩個(gè)點(diǎn)代表兩個(gè)組
##  col:給點(diǎn)上色
##  legend:給點(diǎn)命名

圖片.png

結(jié)束語(yǔ)

到這里就完成了beta多樣性的計(jì)算和可視化的所有工作。從圖中可以看出A和B兩個(gè)組的樣本的腸道菌群有明顯的差異,所以可以推測(cè)“分組變量”很可能和腸道菌群有聯(lián)系。要想知道具體是“哪些菌”對(duì)此聯(lián)系做了貢獻(xiàn),還需要進(jìn)行更深層次的分析。本文到此就結(jié)束了,如有疑問(wèn)歡迎留言交流。下次將為大家推出“如何從腸道菌群中尋找你感興趣的細(xì)菌?”來(lái)介紹尋找“哪些菌”的方法。

相關(guān)閱讀:
16S測(cè)序分析(一)菌屬豐度表獲取
16S測(cè)序分析(二)菌群多樣性分析
16S測(cè)序分析(三)用LEfSe尋找組間差異細(xì)菌
16S測(cè)序分析(四)用MaAsLin尋找組間差異細(xì)菌
16S測(cè)序分析(五)用RandomForest尋找關(guān)鍵細(xì)菌
16S測(cè)序分析(六)用PICRUSt預(yù)測(cè)菌群KEGG代謝通路

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,739評(píng)論 6 534
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,634評(píng)論 3 419
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 176,653評(píng)論 0 377
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 63,063評(píng)論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,835評(píng)論 6 410
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 55,235評(píng)論 1 324
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,315評(píng)論 3 442
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 42,459評(píng)論 0 289
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,000評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,819評(píng)論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,004評(píng)論 1 370
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,560評(píng)論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,257評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 34,676評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 35,937評(píng)論 1 288
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,717評(píng)論 3 393
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,003評(píng)論 2 374

推薦閱讀更多精彩內(nèi)容