導(dǎo)讀
前面已經(jīng)介紹了獲取菌屬相對(duì)豐度表的方法,以及多樣性分析中的基本概念和計(jì)算方法。接下來將開始介紹一種尋找組間差異細(xì)菌的常用方法LEfSe。LEfSe(Linear discriminant analysis Effect Size)是哈佛大學(xué)的Curtis Huttenhower教授在2011年以第一通訊發(fā)表在Genome Biology中的統(tǒng)計(jì)方法。現(xiàn)在這篇文章的引用已經(jīng)達(dá)到1100余次。LEfSe能用于從高維數(shù)據(jù)中尋找組間差異的biomarker。輸入數(shù)據(jù)不僅可以是物種分類數(shù)據(jù)集,還可以是基因數(shù)據(jù)集,也可以是代謝通路數(shù)據(jù)集。
LEfSe在線工具地址:https://huttenhower.sph.harvard.edu/galaxy/
一、統(tǒng)計(jì)方法
- KW秩和檢驗(yàn)
針對(duì)每個(gè)屬性進(jìn)行檢驗(yàn),比較不同類之間的差異性,過濾掉p-value大于0.05的屬性,留下p-value小于0.05的屬性進(jìn)一步分析。
- Wilcoxon秩和檢驗(yàn)
針對(duì)第一步檢驗(yàn)后留下來的屬性,根據(jù)樣本的class類別,基于Wilcoxon秩和檢驗(yàn),檢測(cè)每個(gè)屬性在class之間的差異性。
- LDA分析
LDA是linear discriminant analysis的簡(jiǎn)寫,類別是因變量,篩選過后的屬性、小類和樣品是自變量,如此建立線性判別模型,然后利用模型前后的differences between class means去計(jì)算一個(gè)值,經(jīng)過對(duì)數(shù)轉(zhuǎn)化得到LDA score。
二、工作流程
0. 數(shù)據(jù)上傳
輸入數(shù)據(jù)格式如下:
上傳數(shù)據(jù)到LEfSe:
1. 數(shù)據(jù)標(biāo)準(zhǔn)化
2. 統(tǒng)計(jì)分析
3. 繪制LEfSe柱形圖
4. 繪制LEfSe樹狀圖
5. 單菌豐度可視化
挑選感興趣的細(xì)菌,觀察它在兩組的豐度差異。
相關(guān)閱讀:
16S測(cè)序分析(一)菌屬豐度表獲取
16S測(cè)序分析(二)菌群多樣性分析
16S測(cè)序分析(三)用LEfSe尋找組間差異細(xì)菌
16S測(cè)序分析(四)用MaAsLin尋找組間差異細(xì)菌
16S測(cè)序分析(五)用RandomForest尋找關(guān)鍵細(xì)菌
16S測(cè)序分析(六)用PICRUSt預(yù)測(cè)菌群KEGG代謝通路