WGCNA圖文詳解(七)-eigengene network的可視化
還是老習慣,給出官網教程,至于你是看還是不看,它就在那里,等著你的深入研究~
https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/
WGCNA分析圖文詳解專題中要解釋的第六張圖,eigengene network的可視化
關于這個WGCNA圖文詳解,我們已經講了6期了。我們通過聚類得到不同的模塊之后,那么模塊與模塊之間是否也存在一定的關系呢?模塊與性狀之間的關系呢?
圖剖依然成以下幾個部分:
1,左圖a,由模塊和性狀weight構成的聚類樹,右圖b,對應a圖的熱圖。兩幅圖表示的是一個意思,只不過是展示形式不一樣(個人感覺右圖更直觀具體一些)
小面我們來一一解讀,如有理解錯誤還請批評指正。
官方說明1:
Figure 2: Visualization of the eigengene network representing the relationships among the modules and the clinical trait weight. Panel (a) shows a hierarchical clustering dendrogram of the eigengenes in which the dissimilarity of eigengenes EI, EJ is given by 1 ? cor(EI; EJ). The heatmap in panel (b) shows the eigengene adjacency AIJ = (1 + cor(EI; EJ))/2.
這里解釋了這幅圖表示模塊與模塊,模塊與性狀weight(體重)之間的關系。
1)圖a衡量相似性用的是cor(EI;EJ),即模塊I與模塊J的eigengene值的相關性,然后用1-cor(EI;EJ)來表示兩個模塊之間的距離(非相似度),表現在聚類樹的高度(y軸的值),高度越短,兩個模塊越相似(負相關)。
2)圖b使用的刻度是 (1 + cor(EI; EJ))/2,這個值越大兩個模塊越相似(正相關)。
官方說明2:
The eigengene dendrogram and heatmap identify groups of correlated eigengenes termed meta-modules. For example, the dendrogram indicates that red, brown and bluw modules are highly related; their mutual correlations are stronger than their correlations with weight. On the other hand, the salmon module, which is also significantly correlated with weight, is not part of the same meta-module as the red,brown and blue modules, at least if meta-modules are defined as tight custers of modules (for example, modules with a correlation of eigengenes of at least 0.5).
解讀:
模塊與模塊之間高度相關可以形成meta-modules,meta-modules定義的條件是這個超級模塊內模塊與模塊之間的相關性至少要達到0.5。
從這個圖可以看出,這里有三個meta-module,如red, brown and blue模塊形成了一個meta-modules,它們內部之間的相關性比它們與性狀weight體重的相關性還要大。
今天就說到這里,歡迎大家留言討論。我們圖文詳解教程總共有7期,今天到這里就在結束了~。圖的解說說來說去也就那些意思,這次的重點是下個專題內容的預告:
后面我們針對這個WGCNA還會出一個分析過程詳解的專題
包括但不限于以下內容:
1,WGCNA適用于什么分析內容?
2,做WGCNA分析我該使用什么數據,是NGS中基因表達的count值還是FPKM,還是都可以?芯片數據的基因水平的表達值?是否需要log轉換?是否需要標準化?
3,我該選取哪些基因進入分析?是全部的基因還是只用差異表達的基因還是經過了某種過濾手段后選取的一部分合理(為什么合理)的基因?
4,多少樣本量合適呢?怎么檢測異常(離群樣本),這些樣本是刪除還是可以進入后續分析?會給分析結果帶來怎樣的影響?
5,如何選取softpower,在最初構建softpower的時候取值范圍如何選擇,用1-20還是什么?為什么?
6,如何選取模塊以及模塊中的Hub基因?
7,分類變量的表型變量應該如何合理的數值化?
8,......................等等更多精彩解說。
參考資料:
1,https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/
2,A General Framework for Weighted Gene Co-Expression Network Analysis, Stat Appl Genet Mol Biol. "Statistical applications in genetics and molecular biology.") 2005;4:Article17. Epub 2005 Aug 12