基因集富集分析GSEA(gene-set enrichment analysis)。這個操作并不難,主要就是準備符合GSEA要求的數據文件(本地的話4個),關于文件準備,可細見官方說明。若有時間我稍后整理以前資料,單獨成一篇GSEA數據文件準備。最主要的還是GSEA結果解讀。
另外,GSEA我們可能更多的用的是它的富集功能,而實際上它還有其他非常好用的功能,看自己怎么活學活用了,具體來說,就我用的多的有以下幾個:(歡迎大家補充)
- 1 當然是最常用的基因集富集分析,這個不用多加解釋
- 2 如果你自己有N個gene在不同樣本或不同時間點的表達值,你想知道和其中某個你感興趣的gene的表達模式一致(也就是共表達)的有哪些gene,并且這些gene富集在哪條信號通路,GO,染色體,受哪個miRNA調控等的話,可以用GSEA實現,并且通過cytoscape可以畫出圖
- 3 有沒有哪個(些)genes在富集到的GO或kegg里出現次數最多(意味它可能很關鍵,連接很多信號通路或生理過程等),這個功能通過leading edge analysis實現。
- 4 相對復雜一點的,按照GSEA要求的格式,做自己的GO或KEGG文件(異想天開的比如:你發現了一個新的信號通路,或作用機制,你可以把這些gene做成自己命名的信號通路,然后把你證明這個信號通路存在的數據在這個信號通路去富集。)(另外,你也可以自己重新優化適合自己的GO:BP或KEGG),這樣就像是自己的百科全書。
- 5 通過4,有沒有發現,自己可以天馬行空的制作自己覺得好玩的非生物學的小玩件。。。。