全基因組關(guān)聯(lián)分析學(xué)習(xí)資料(GWAS tutorial)

前言

很多人問我有沒有關(guān)于全基因組關(guān)聯(lián)分析(GWAS)原理的書籍或者文章推薦。

其實(shí)我個(gè)人覺得,做這個(gè)分析,先從跑流程開始,再去看原理。

為什么這么說呢,因?yàn)閷?duì)于初學(xué)者來說,跑流程就像一個(gè)大黑洞,學(xué)習(xí)原理就像一個(gè)小黑洞。

很多人花了好幾個(gè)月的時(shí)間在看原理,一旦丟給他數(shù)據(jù)去分析,依舊束手無策。

不會(huì)跑流程,內(nèi)心依舊會(huì)很恐慌。就像從來沒有入門一樣。

所以,我的建議是咱們先不去管原理,直接從分析入手。

等把數(shù)據(jù)跑出來了,整個(gè)流程的技能點(diǎn)滿了,再去看看它的原理。

入門:學(xué)習(xí)GWAS的在線網(wǎng)站:

對(duì)于沒有編程基礎(chǔ)的人來說,建議先從一個(gè)在線的網(wǎng)站走一遍GWAS流程。

這樣就能知道完成GWAS需要多少個(gè)步驟,心里大概有個(gè)底。

easygwas網(wǎng)站提供了公共數(shù)據(jù),可以直接開始分析GWAS。整個(gè)流程按照網(wǎng)站提示,很簡(jiǎn)單。

網(wǎng)址:https://easygwas.ethz.ch/

進(jìn)階備選1:在linux下學(xué)習(xí)GWAS的實(shí)操數(shù)據(jù)

由于我們最終還是需要拿著自己的數(shù)據(jù)完成GWAS分析,不必避免的需要一定的編程基礎(chǔ)。

在線網(wǎng)站只是一個(gè)提供理解GWAS流程的網(wǎng)站,因此,我們還是需要在linux系統(tǒng)下拿一些數(shù)據(jù)練練手。學(xué)會(huì)最基本的命令行。

在這里,我推薦一個(gè)提供linux下學(xué)習(xí)GWAS的教程:GWA_tutorial.

網(wǎng)址:https://github.com/MareesAT/GWA_tutorial/

網(wǎng)站分為四個(gè)教程:1)GWAS的數(shù)據(jù)QC; 2)處理群體分層; 3)關(guān)聯(lián)分析(GWAS); 4)多基因風(fēng)險(xiǎn)得分分析(Polygenic risk score analyses)

示例數(shù)據(jù)都有了,就等你自己上手了。

我敢保證,當(dāng)你能完整的跑完這個(gè)流程的時(shí)候,你對(duì)GWAS的理解少說也有70% ,下一個(gè)在群里幫我解答問題的大神就是你了(申請(qǐng)進(jìn)群方式見公眾號(hào)菜單欄)。

進(jìn)階備選2:使用R語言做GWAS分析

有些人對(duì)R語言可能比較熟悉,這里提供了一個(gè)用R語言分析GWAS的流程。

該流程有:GWAS的QC,PCA分析,Manhattan圖,QQ圖,候選位點(diǎn)的功能分析

感興趣的看這個(gè):Genome-wide association studies in R

網(wǎng)址:https://www.r-bloggers.com/genome-wide-association-studies-in-r/

進(jìn)階備選3

0 原理

啊,全基因組關(guān)聯(lián)分析(GWAS)的計(jì)算原理,了解一下?

1 分析流程

GWAS分析基本流程及分析思路

2 數(shù)據(jù)處理

2.1 數(shù)據(jù)質(zhì)量過濾

GWAS基因芯片數(shù)據(jù)預(yù)處理:質(zhì)量控制(quality control)

2.2 正負(fù)鏈翻轉(zhuǎn)(stand flip)

數(shù)據(jù)合并,踩不完的坑

2.3 基因型數(shù)據(jù)填補(bǔ)(imputation)

soga,網(wǎng)頁版的基因型填充可以這么做(genotype imputation)

2.4 群體分層校正

GWAS群體分層 (Population stratification):利用plink對(duì)基因型進(jìn)行PCA

EIGENSTRAT除了用來計(jì)算PCA,還可以干嘛

群體遺傳分析分層校正,該選用多少個(gè)PCA?

3 關(guān)聯(lián)分析

GWAS: 曼哈頓圖,QQ plot 圖,膨脹系數(shù)( manhattan、Genomic Inflation Factor)

4 meta分析

只用一行命令,就可以學(xué)會(huì)全基因組關(guān)聯(lián)分析(GWAS)的meta分析

5 條件分析

GWAS條件分析(conditional analysis):作用,步驟,結(jié)果解讀

6 基因多效性

啊啊救救我,為何我的QQ圖那么飄(全基因組關(guān)聯(lián)分析)

7 GWAS后續(xù)分析

SNP在世界地圖上的頻率分布

GWAS:拒絕假陽性之case和control數(shù)量比例嚴(yán)重失衡的解決方案(SAIGE模型的應(yīng)用)

GWAS后續(xù)分析:LocusZoom圖的繪制

利用GCTA工具計(jì)算復(fù)雜性狀/特征(Complex Trait)的遺傳相關(guān)性(genetic correlation)

GWAS系列分析:多基因風(fēng)險(xiǎn)評(píng)分(Polygenic Risk Score)的計(jì)算

有相關(guān)性就有因果關(guān)系嗎,教你玩轉(zhuǎn)孟德爾隨機(jī)化分析

LD SCore計(jì)算基因多效性、遺傳度、遺傳相關(guān)性

查詢、下載GWAS目錄數(shù)據(jù)的R包(gwasrapidd)

DEPICT實(shí)現(xiàn)基因優(yōu)化、gene set富集分析、組織富集分析(tissue enrichment)

SNP功能注釋網(wǎng)站合集

8 相關(guān)文獻(xiàn)閱讀

常見變異影響常見疾病,罕見變異影響罕見疾?。?/a>

什么!GWAS研究中case和control的比例是有講究的?

阿爾茲海默癥和代謝指標(biāo)在大規(guī)模全基因組數(shù)據(jù)的遺傳共享研究

GWAS文獻(xiàn)解讀:The stability of educational achievement

全基因組關(guān)聯(lián)分析(GWAS)掃不出信號(hào)怎么辦(文獻(xiàn)解讀)

補(bǔ)充

GWAS其他教程:

www.transplantdb.eu/sites/transplantdb.eu/files/HandsOnTutorialtoGWAS_Seren-030715.pdf

https://doc.goldenhelix.com/SVS/tutorials/snp_gwas/index.html

ccbb.jnu.ac.in/IUBDDJan2015/workshop_files/GWAS Tutorial.pdf

https://www.r-project.org/conferences/useR-2009/slides/Zhao+Tan.pdf

users.du.se/~lrn/NOVAComputerExercises/NOVA_GenABEL_tutorial.pdf

gsea4gwas-v2.psych.ac.cn/docs/tutorial.jsp

www.montefiore.ulg.ac.be/~kvansteen/GeneticEpi-UA2/Class5/Introduction to GenABEL.pdf

看看文獻(xiàn),加深對(duì)GWAS的理解:

A tutorial on conducting genome‐wide association studies: Quality control and statistical analysis

Genome-wide association studies and beyond

Genome-wide association studies

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,578評(píng)論 6 544
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,701評(píng)論 3 429
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 178,691評(píng)論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,974評(píng)論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 72,694評(píng)論 6 413
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 56,026評(píng)論 1 329
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,015評(píng)論 3 450
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 43,193評(píng)論 0 290
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,719評(píng)論 1 336
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 41,442評(píng)論 3 360
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,668評(píng)論 1 374
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,151評(píng)論 5 365
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,846評(píng)論 3 351
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,255評(píng)論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,592評(píng)論 1 295
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 52,394評(píng)論 3 400
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,635評(píng)論 2 380

推薦閱讀更多精彩內(nèi)容