前言
很多人問我有沒有關(guān)于全基因組關(guān)聯(lián)分析(GWAS)原理的書籍或者文章推薦。
其實(shí)我個(gè)人覺得,做這個(gè)分析,先從跑流程開始,再去看原理。
為什么這么說呢,因?yàn)閷?duì)于初學(xué)者來說,跑流程就像一個(gè)大黑洞,學(xué)習(xí)原理就像一個(gè)小黑洞。
很多人花了好幾個(gè)月的時(shí)間在看原理,一旦丟給他數(shù)據(jù)去分析,依舊束手無策。
不會(huì)跑流程,內(nèi)心依舊會(huì)很恐慌。就像從來沒有入門一樣。
所以,我的建議是咱們先不去管原理,直接從分析入手。
等把數(shù)據(jù)跑出來了,整個(gè)流程的技能點(diǎn)滿了,再去看看它的原理。
入門:學(xué)習(xí)GWAS的在線網(wǎng)站:
對(duì)于沒有編程基礎(chǔ)的人來說,建議先從一個(gè)在線的網(wǎng)站走一遍GWAS流程。
這樣就能知道完成GWAS需要多少個(gè)步驟,心里大概有個(gè)底。
easygwas網(wǎng)站提供了公共數(shù)據(jù),可以直接開始分析GWAS。整個(gè)流程按照網(wǎng)站提示,很簡(jiǎn)單。
網(wǎng)址:https://easygwas.ethz.ch/
進(jìn)階備選1:在linux下學(xué)習(xí)GWAS的實(shí)操數(shù)據(jù)
由于我們最終還是需要拿著自己的數(shù)據(jù)完成GWAS分析,不必避免的需要一定的編程基礎(chǔ)。
在線網(wǎng)站只是一個(gè)提供理解GWAS流程的網(wǎng)站,因此,我們還是需要在linux系統(tǒng)下拿一些數(shù)據(jù)練練手。學(xué)會(huì)最基本的命令行。
在這里,我推薦一個(gè)提供linux下學(xué)習(xí)GWAS的教程:GWA_tutorial.
網(wǎng)址:https://github.com/MareesAT/GWA_tutorial/
網(wǎng)站分為四個(gè)教程:1)GWAS的數(shù)據(jù)QC; 2)處理群體分層; 3)關(guān)聯(lián)分析(GWAS); 4)多基因風(fēng)險(xiǎn)得分分析(Polygenic risk score analyses)
示例數(shù)據(jù)都有了,就等你自己上手了。
我敢保證,當(dāng)你能完整的跑完這個(gè)流程的時(shí)候,你對(duì)GWAS的理解少說也有70% ,下一個(gè)在群里幫我解答問題的大神就是你了(申請(qǐng)進(jìn)群方式見公眾號(hào)菜單欄)。
進(jìn)階備選2:使用R語言做GWAS分析
有些人對(duì)R語言可能比較熟悉,這里提供了一個(gè)用R語言分析GWAS的流程。
該流程有:GWAS的QC,PCA分析,Manhattan圖,QQ圖,候選位點(diǎn)的功能分析
感興趣的看這個(gè):Genome-wide association studies in R
網(wǎng)址:https://www.r-bloggers.com/genome-wide-association-studies-in-r/
進(jìn)階備選3
0 原理
啊,全基因組關(guān)聯(lián)分析(GWAS)的計(jì)算原理,了解一下?
1 分析流程
2 數(shù)據(jù)處理
2.1 數(shù)據(jù)質(zhì)量過濾
GWAS基因芯片數(shù)據(jù)預(yù)處理:質(zhì)量控制(quality control)
2.2 正負(fù)鏈翻轉(zhuǎn)(stand flip)
2.3 基因型數(shù)據(jù)填補(bǔ)(imputation)
soga,網(wǎng)頁版的基因型填充可以這么做(genotype imputation)
2.4 群體分層校正
GWAS群體分層 (Population stratification):利用plink對(duì)基因型進(jìn)行PCA
3 關(guān)聯(lián)分析
GWAS: 曼哈頓圖,QQ plot 圖,膨脹系數(shù)( manhattan、Genomic Inflation Factor)
4 meta分析
只用一行命令,就可以學(xué)會(huì)全基因組關(guān)聯(lián)分析(GWAS)的meta分析
5 條件分析
GWAS條件分析(conditional analysis):作用,步驟,結(jié)果解讀
6 基因多效性
啊啊救救我,為何我的QQ圖那么飄(全基因組關(guān)聯(lián)分析)
7 GWAS后續(xù)分析
GWAS:拒絕假陽性之case和control數(shù)量比例嚴(yán)重失衡的解決方案(SAIGE模型的應(yīng)用)
利用GCTA工具計(jì)算復(fù)雜性狀/特征(Complex Trait)的遺傳相關(guān)性(genetic correlation)
GWAS系列分析:多基因風(fēng)險(xiǎn)評(píng)分(Polygenic Risk Score)的計(jì)算
有相關(guān)性就有因果關(guān)系嗎,教你玩轉(zhuǎn)孟德爾隨機(jī)化分析
LD SCore計(jì)算基因多效性、遺傳度、遺傳相關(guān)性
查詢、下載GWAS目錄數(shù)據(jù)的R包(gwasrapidd)
DEPICT實(shí)現(xiàn)基因優(yōu)化、gene set富集分析、組織富集分析(tissue enrichment)
8 相關(guān)文獻(xiàn)閱讀
什么!GWAS研究中case和control的比例是有講究的?
阿爾茲海默癥和代謝指標(biāo)在大規(guī)模全基因組數(shù)據(jù)的遺傳共享研究
GWAS文獻(xiàn)解讀:The stability of educational achievement
全基因組關(guān)聯(lián)分析(GWAS)掃不出信號(hào)怎么辦(文獻(xiàn)解讀)
補(bǔ)充
GWAS其他教程:
www.transplantdb.eu/sites/transplantdb.eu/files/HandsOnTutorialtoGWAS_Seren-030715.pdf
https://doc.goldenhelix.com/SVS/tutorials/snp_gwas/index.html
ccbb.jnu.ac.in/IUBDDJan2015/workshop_files/GWAS Tutorial.pdf
https://www.r-project.org/conferences/useR-2009/slides/Zhao+Tan.pdf
users.du.se/~lrn/NOVAComputerExercises/NOVA_GenABEL_tutorial.pdf
gsea4gwas-v2.psych.ac.cn/docs/tutorial.jsp
www.montefiore.ulg.ac.be/~kvansteen/GeneticEpi-UA2/Class5/Introduction to GenABEL.pdf
看看文獻(xiàn),加深對(duì)GWAS的理解:
A tutorial on conducting genome‐wide association studies: Quality control and statistical analysis