成全电影大全免费观看完整视频,与亲女洗澡时伦了视频,欧美黑人XXXX高潮猛交

前面簡單介紹過基因矩陣轉置文件格式（* .gmt），并且也展示了如何使用R讀取gmt文件，今天我們來看看如何做GSEA（Gene Set Enrichment Analysis，基因集富集分析）以及GSEA的結果如何解讀。

? ? 首先我們需要了解一下GSEA跟傳統的基因富集分析有什么區別，有什么優勢。我相信大家在做傳統的基因功能富集分析的時候肯定遇到這樣的情況，一條富集到的通路中，既有上調的差異表達基因，也有下調的差異表達基因，那么這條通路總體是被抑制還是被激活呢？那么這條通路中的基因表達水平在實驗組相比于對照組究竟是上升了呢，還是下降了呢？

? ? 在傳統的富集分析時，我們其實根本不關心這些差異表達的基因究竟是上調還是下調。這是因為傳統的富集分析根本不考慮基因表達量的變化趨勢，其算法的核心只關注這些差異表達基因的分布是否跟隨機抽樣得到的分布一致，即使在后續可視化時，我們在通路圖上用不同顏色標記了上調和下調的基因，但是由于沒有采用有效的統計學方法去分析這條通路中所有差異基因的總體變化趨勢，這使得傳統的富集分析結果無法回答上述的問題。

即使有些文章里面根據差異表達基因的上下調將差異表達基因分成兩組分別進行基因富集分析，這樣得到的結果也會有失偏頗，并不能反應差異表達基因的整體情況。有時甚至會出現自相矛盾的情況，上調的基因和下調的基因富集到相同的一條通路中，這時就很難解釋結果了。

GSEA（Gene Set Enrichment Analysis），該方法發表于2005年的Gene set enrichment analysis: a knowledge-based approach forinterpreting genome-wide expression profiles，是一種基于基因集的富集分析方法，在對基因表達數據分析時，首先確定分析的目的，即選擇MSigDB中的一個或多個功能基因集進行分析（基因矩陣轉置文件格式（* .gmt）中已經介紹過），然后基于基因表達數據與表型的關聯度（也可以理解為表達量的變化）的大小進行排序。然后判斷每個基因集內的基因是否富集于表型相關度排序后基因列表的上部或下部，從而判斷此基因集內基因的協同變化對表型變化的影響。以上其實就是GSEA的分析原理。下面我們就借助一張圖來幫助大家更好的理解GSEA的分析原理。

GSEA的輸入是一個基因表達量矩陣，其中的樣本分成了A和B兩組，找到兩組之間差異表達的基因，然后根據foldchange進行排序，用來表示基因在兩組間表達量的變化趨勢。排序之后的基因列表其頂部可以看做是上調的差異基因，其底部是下調的差異基因。GSEA分析的是一個基因集下的所有基因是否在這個排序列表的頂部或者底部富集，如果在頂部富集，我們可以說，從總體上看，該基因集是上調趨勢，反之，如果在底部富集，則是下調趨勢。

以上就是GSEA的分析原理，那么進行GSEA的結果怎樣解讀呢？

GSEA分析結果最常見的是下圖：