多樣性分析
- 群落多樣性主要指群落中所包含的物種數目和物種個體數的分布特征。
主要包含:
- 物種豐富度,species richness:群落中物種數目的多少
- 物種均勻度,species evenness:群落中每個物種的個體數目的分配情況,反應各個物種個體數目的均勻程度。
- 分類
α多樣性
β多樣性
α多樣性
α多樣性:主要指棲息地或群落中的物種多樣性,關注局域生境下的物種數目和豐度,因此也被稱為生境內的多樣性(within-habitat diversity)。
Chao1指數
Chao1指數為廣泛使用的豐富度指數之一,為物種豐富度的理論估計值
Sobs:觀測到的物種數
n1:表示singleton ,只觀測到1次的物種數目
n2:表示doubleton,觀測到2次的物種數目
ACE指數
ACE指數全稱為Abundance-based Coverage Estimator metric ;是利用修正因子對物種豐富度的估計值。通過低豐度物種估算還有多少沒發現的物種。
n1:表示singleton數目,只觀測到1次的物種數目
Sabund:高豐度物種數目,一般是豐度超過10個
Srare:低豐度物種數目,豐度小于等于10個
Cace:低豐度物種中非singleton所占比例
γ2ace:變異系數
Shannon指數
香濃-威納指數(Shannon-Wiener)指數借用了信息論方法,在群落多樣性的測度上,預測下一個個體屬于什么物種,如果群落的多樣性程度越高,其不定性也就越大。量化了從數據集中隨機抽取的個體物種身份的不確定性。
Pi:物種??的個體占群落中總個體數比例
R:物種數目
simpson指數及其變形
辛普森多樣性指數=隨機取樣的兩個個體屬于不同種的概率=1-隨機取樣的兩個個體屬于同種的概率
Pi:物種i的個體占群落中總個體數比例
S:物種數目
N:群落中全部物種個體數
Ni:物種i的個體數
稀疏曲線
稀釋曲線(rarefaction)是指從樣品中隨機抽取一定量的測序數據,統計他們所代表的物種數目,以數據量和物種數來構建的曲線。
參考腳本
# 使用 vegan 及 phyloseq 兩個 R 包進行多樣性分析
## 準備輸入biom文件
S.biom
## 進行alpha多樣性指數計算及繪制稀釋曲線
Rscript alpha.R S.biom S.alpha
輸出結果
S.alpha.alpha-diversity.table alpha 多樣性指數
S.alpha.Rarefaction_ggplot2.pdf 稀釋曲線
S.alpha.Rarefaction_orginal.pdf 稀釋曲線