還是老習慣,給出官網教程,至于你是看還是不看,它就在那里,等著你的深入研究~
https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/
往期教程:
WGCNA分析圖文詳解專題中要解釋的第四張圖,這張圖有點不好理解啊。
官方注釋:
Figure 2: A scatterplot of Gene Signifificance (GS) for weight vs. Module Membership (MM) in the brown module. There is a highly signifificant correlation between GS and MM in this module.
這張圖是一個相關性結果繪制成的散點圖,雖然只是一個簡單的散點圖,但是理解起來怕是有點費勁喲。曾經有個客戶就在這個圖上糾結理解了好久。也不知道他最后明白了沒有。
圖剖成這幾個部分:
1.橫坐標:Module Membership in brown module,翻譯過來就是:在棕色模塊中的模塊成員。模塊成員是什么鬼?
2.縱坐標:Gene Significance (GS) for weight,關于體重這個性狀的基因顯著性?;蝻@著性又是什么鬼?
3.這個圖是為了說明啥呢?
小面我們來一一解讀。如有理解錯誤,還請各位大俠批評指正。
1.橫坐標:MM
官方定義:
官方說明2:
For each module, we also define a quantitative measure of module membership MM as the correlation of the module eigengene and the gene expression profile.
即:模塊的eigengene和基因表達譜之間的相關性。
說的是啥呢,其實就是所有基因表達譜與這個模塊的eigengene的相關性(cor)。最后是一個具有所有用來做WGCNA分析基因數長的向量,每一個值代表這個基因與模塊之間的關系。如果這個值的絕對值接近0,那么這個基因就不是這個模塊中的一部分,如果這個值的絕對值接近1,那么這個基因就與這個模塊高度相關。
一般,每個模塊中的基因都會與被分配到的模塊高度相關,表明了模塊內部高度的連接性。
其實這個值與后面hub基因的選擇相關,這里以后再講。
2.縱坐標:GS
官方定義:
官方說明2:
We quantify associations of individual genes with our trait of interest (weight) by defining Gene Significance GS as?(the absolute value of) the correlation between the gene and the trait.
GS為:基因和表型性狀比如體重之間的相關性的絕對值。
總的來說,就是為了將表型特征信息與共表達網絡聯合起來,比如體重與哪個模塊高度相關。
詳細一點專業一點就是:每一個基因的表達值與表型性狀之間的相關性的絕對值。0表示這個基因與這個性狀不相關,1表示高度相關。如果一個模塊中的基因都有這個性狀高度相關,那么這個模塊也就與這個性狀高度相關。
3.圖中的每一個點
那么計算MM與GS的相關性是為了說明什么呢?
官方教程以體重和棕色模塊進行了舉例說明,就是本文中的那張圖片,解釋如下:
Clearly, GS and MM are highly correlated, illustrating that genes highly significantly?associated with a trait are often also the most important (central) elements of modules associated with the trait.?The reader is encouraged to try this code with other significance trait/module correlation (for example, the magenta,?midnightblue, and red modules with weight).
圖中的每一個點代表一個基因,應該有3600個點。橫坐標值表示基因與模塊的相關性,縱坐標值表示基因與表型性狀的相關性,這里可以看出與性狀高度顯著相關的基因往往是與這個性狀顯著相關的模塊中的重要元素。
大家可以去驗證一下自己的結果,如果一個性狀與模塊顯著相關,那么這里GS與MM也會顯著相關。
重點!!!實例說明
下圖是小編自己做WGCNA分析時的一個結果,第三期教程中的那張圖片顯示,Blue模塊與F-48小時高度相關。
下圖展示了F-48小時性狀的GS值與blue模塊MM值的相關性,這里可以看出來是高度相關。與模塊高度相關的那些點(右上角)同時也是與性狀高度相關的基因;而左下角,與模塊相關性不高的那些基因同時也是與性狀不相關的那些基因,他們的相關性一致,這里才會出現GS與MM值高度相關。
??????????????????????????? 今天就說到這里,歡迎大家留言討論。我們下期再見~
參考資料:
1.https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/
2.A General Framework for Weighted Gene Co-Expression Network Analysis, Stat Appl Genet Mol Biol.?2005;4:Article17. Epub 2005 Aug 12