導讀
非加權組平均法(unweighted pair-group method with arithmetic means, UPGMA或average linkage)是一種較常用的聚類分析方法,可用于分析分類問題,也常被用于微生物多樣性研究。下面介紹用R語言中的UPGMA函數(shù)分析微生物多樣性數(shù)據(jù)和結(jié)果可視化的方法,內(nèi)容如下:1)模擬(樣品、豐度)矩陣數(shù)據(jù);2)計算bray curtis相異指數(shù)和UPGMA聚類;3)繪制樹狀圖。
1 模擬(樣品、豐度)矩陣數(shù)據(jù)
set.seed(1995)
# 隨機種子
data=matrix(abs(round(rnorm(200, mean=1000, sd=500))), 20, 10)
# 隨機正整數(shù),20行,20列
colnames(data)=paste("Species", 1:10, sep=".")
# 列名-細菌
rownames(data)=paste("Sample", 1:20, sep=".")
# 行名-樣品
data_norm=data
for(i in 1:20){
sample_sum=apply(data, 1, sum)
for(j in 1:10){
data_norm[i,j]=data[i,j]/sample_sum[i]
}
}
# 標準化
data_norm
# 模擬完成的標準化矩陣數(shù)據(jù)如下:
Species.1 Species.2 Species.3 Species.4 ... Species.10
Sample.1 0.14032835 0.076767862 0.12225993 0.08713198
Sample.2 0.08434712 0.116281427 0.14405921 0.12976480
Sample.3 0.09997205 0.026460449 0.11571788 0.10006522
Sample.4 0.10753751 0.102236996 0.03449825 0.12766149
...
Sample.20
2 計算bray curtis相異指數(shù)和UPGMA聚類
用R語言vegan包中的vegdist函數(shù)分析菌群豐度數(shù)據(jù),計算樣品之間的bray curtis相異指數(shù)(Dissimilarity index),接著用phangorn包中的upgma函數(shù)進行樣品聚類分析。vegdist函數(shù)中可供選擇的dissimilarity算法有很多,如:"manhattan", "euclidean", "canberra", "bray", "kulczynski", "jaccard", "gower", "altGower", "morisita", "horn", "mountford", "raup" , "binomial", "chao", "cao" or "mahalanobis",其中"bray"即bray curtis在微生物多樣性研究中最為常用,故用之。
library("vegan")
library("phangorn")
up=upgma(vegdist(data_norm, method="bray"))
# 使用bray curtis dissimilarity算法和upgma聚類算法
3 繪制樹狀圖
plot畫圖函數(shù)中可供選擇的樹狀圖類型有:“phylogram”, “cladogram”, “fan”, “unrooted”, “radial”。利用par函數(shù)mfrow參數(shù)可將多張圖片組合到一起,mai參數(shù)可調(diào)整每張圖片的大?。ň噙呴L度)。
pdf('upgma.pdf')
opar=par(no.readonly=TRUE)
# 生成圖形參數(shù)列表
par(mfrow=c(3, 2), col.main="red", family="serif")
# par設置:按行填充,3行,2列,標題顏色,字體(羅馬)
par(mai=c(0.2, 0.2, 0.2, 0.2))
# par設置:每個圖形距邊距離(英寸)
plot(up, main="by default")
plot(up, type="phylogram", main="phylogram") # 默認
plot(up, type="cladogram", main="cladogram")
plot(up, type="fan", main="fan")
plot(up, type="unrooted", main="unrooted")
plot(up, type="radial", main="radial")
par(opar)
# 關閉par
dev.off()
# 關閉畫板
打開結(jié)果upgma.pdf可得如下結(jié)果:
同步發(fā)布于微信公眾號:微生態(tài)