導讀
PICRUSt (Phylogenetic Investigation of Communities by Reconstruction of Unobserved States) 的原理基于已測細菌基因組的16S rRNA全長序列,推斷它們的共同祖先的基因(同源基因)功能譜,對Greengenes數據庫中其它未測物種的基因功能譜進行推斷,構建古菌和細菌域全譜系的基因功能預測譜,最后,將測序得到的菌群組成“映射”到數據庫中,對菌群代謝功能進行預測。
文獻:
Predictive functional profiling of microbial communities using 16S rRNA marker gene sequences. Nature Biotechnology 2013
一、數據準備
1 QIIME2 DADA2分析的輸出文件
1.1 rep-seqs.qza ## 代表性序列
1.2 table.qza ## 代表性序列豐度表,如下:
(導出qza文件的方法將在下面介紹)
2. Greengene細菌模板數據
下載地址:https://docs.qiime2.org/2019.1/data-resources/
下載得到gg_13_5_otus.tar.gz(最新版,大小為304M)后將其解壓得到97_otus.fasta(最新版,大小約為139M),文件獲取如下:
二、工作流程
1. 格式轉換
將97_otus.fasta命名為gg_13_5_97_otus.fasta,并將其格式轉化成QIIME2 qza格式
qiime tools import \
--type 'FeatureData[Sequence]' \
--input-path gg_13_5_97_otus.fasta \
--output-path gg_13_5_97_otus.qza
2. 聚類
參考QIIME2官方文檔:https://docs.qiime2.org/2018.8/tutorials/otu-clustering/
qiime vsearch cluster-features-closed-reference \
--i-sequences rep-seqs.qza \
--i-table table.qza \
--i-reference-sequences gg_13_5_97_otus.qza \
--p-perc-identity 0.97 \
--p-threads 10 \
--output-dir picrust/closed_ref_97_otu
3. 將qza格式轉換biom格式
qiime tools export --input-path closed_ref_*_otu/clustered_table.qza --output-path closed_ref_*_otu/
4. 將biom格式轉成tsv格式
biom convert --to-tsv -i feature-table.biom -o feature-table.tsv
這樣就得到了OTU豐度表feature-table.tsv。接下來用PICRUSt(網址:http://huttenhower.sph.harvard.edu/galaxy/)進行在線菌群代謝功能預測,步驟如下:
三、PICRUSt預測菌群KEGG通路
1 上傳數據
1.1 點擊上傳控件
1.2 選擇上傳格式和需要上傳的本地文件;點擊Start開始上傳;點擊Close返回
2 數據標準化
按如下操作:
3 KEGG代謝通路預測
按如下要求操作:
4 功能分類
按如下要求操作:
5 下載預測結果
6 菌群KEGG預測結果
相關閱讀:
16S測序分析(一)菌屬豐度表獲取
16S測序分析(二)菌群多樣性分析
16S測序分析(三)用LEfSe尋找組間差異細菌
16S測序分析(四)用MaAsLin尋找組間差異細菌
16S測序分析(五)用RandomForest尋找關鍵細菌