A practical guide to amplicon and metagenomic analysis of microbiome data
第一作者:Yong-Xin Liu
時間:2021 May
發表期刊:Protein Cell
pubmed: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8106563/
期刊版: https://academic.oup.com/proteincell/article/12/5/315/6724529
摘要
高通量測序 (HTS) 的進步促進了微生物組研究領域的快速發展,現在正在生成大量微生物組數據集。然而,軟件工具的多樣性和分析流水線的復雜性使得這一領域難以進入。在這里,我們系統地總結了微生物組方法的優點和局限性。然后,我們推薦用于擴增子和宏基因組分析的特定流程,并描述常用的軟件和數據庫,以幫助研究人員選擇合適的工具。此外,我們介紹了適用于微生物組分析的統計和可視化方法,包括 alpha 和 beta 多樣性、分類組成、差異比較、相關性、網絡、機器學習、進化、來源追蹤、和常見的可視化樣式,以幫助研究人員做出明智的選擇。最后,介紹了分步可重現的分析指南。我們希望這篇綜述能夠讓研究人員更有效地進行數據分析,并快速選擇合適的工具,以高效地挖掘數據背后的生物學意義。
圖1 用于微生物組研究的 HTS 方法的優點和局限性。(A) HTS方法的簡介,用于不同級別的分析。在分子水平上,微生物組研究分為三種類型:微生物、DNA 和 mRNA。相應的研究技術包括培養組、擴增子、宏基因組、元病毒組和宏轉錄組分析。(B) 微生物組分析的各種 HTS 方法的優點和局限性。
圖2 擴增子 (A) 和宏基因組 (B) 測序常用方法的工作流程。藍色、橙色和綠色塊分別代表輸入、中間和輸出文件。箭頭旁邊的文本代表方法,常用軟件顯示在括號中。分類表和功能表統稱為特征表。請見 Table 1有關此圖中所列軟件的更多信息。
圖3 特征表的統計和可視化方法概述。微生物組特征表的下游分析,包括alpha/beta多樣性(A/B)、分類組成(C)、差異比較(D)、相關性分析(E)、網絡分析(F)、機器學習的分類(G)和系統發育樹 (H)。更多細節請見 Table 2。
alpha/beta多樣性:α多樣性主要體現樣本內物種多少、豐度和/或均勻度,而β多樣性指樣本間多樣性異同。(參考:https://blog.csdn.net/woodcorpse/article/details/106552561)