精細定位——降低 GWAS的復雜度

今天跟大家分享的是16年1月發表在Cell Cycle(IF=3.530)上的一篇perspective前瞻性文章?Reducing GWAS Complexity (https://doi.org/10.1080/15384101.2015.1120928

一句話總結:用精細定位來縮小候選功能SNPs的范圍

關鍵詞:GWAS; SNP; Cancer; chromatin; non-coding DNA; enhancer; fine-mapping

隨著測序成本的不斷降低和meta分析的應用,復雜表型相關的GWAS在大樣本數據的處理中越來越強大,越來越多MAF很低的SNPs被鑒定出來。這些候選risk SNPs之間由于LD相互關聯,使得給定locus的關聯分析變得復雜,更何況超過90%的risk SNPs位于非編碼的DNA序列中。

為了解決以上問題,作者結合染色體的生物特征(chromatin biofeatures)去確認GWAS最初發掘的SNPs的潛在功能。這些SNP被稱為索引SNP (index SNPs),之后由r2計算LD后得到的SNPs,被稱為替代SNP (surrogate SNPs)。許多軟件FunciSNP RegulomeDB, Haploreg, Annovar, IGV以及最新的FunSeq8和motifbreakR9 可以根據染色體的注釋信息對risk SNPs進行重新定位,這會大大減少SNP的數目(表1)。在過去的幾年里,作者把這個注釋方法成功運用到前列腺癌和乳腺癌的risk regions篩選中。

盡管此方法把候選SNP數目從50,000篩到了500,再到平均10個(中位數是5)和前列腺癌相關的risk SNPs,但這10個SNP仍需要一一進行詳細和全面的濕實驗驗證。精細定位(fine-mapping) 的新方法可以解決這個問題(來減少實驗量)。

除了p值,有許多新的分析方法來統計篩選候選SNP,比如貝葉斯和重新采樣(re-sampling approaches)方法(原文如下,不太好翻譯,但是很重要

“These methods include Bayesian and re-sampling approaches that formally incorporate the uncertainty in estimation and ranking, model selection approaches to condition on multiple SNPs in the region using either individual-level data or marginal test statistics, and approaches that formally incorporate prior information, such as SNP annotation, into the final inference.”

最近,作者和他人合作,使用多種族人群、單一大型歐洲人群數據對前列腺癌風險區進行了精細定位,降低了每個區域候選risk SNP的數量(表1)。FunciSNP3注釋的功能和2個精細作圖研究,進一步減少了共同候選SNP的數量,平均每個區域只有大約2個SNP(表1)。這意味著,如果沒有功能性的注釋或精細定位,每個位點都有大量的假陽性結果,從而導致與risk無關的功能分析。Ultimately SNPs must be func- tional to be causal, but not all functional SNPs are inevitably involved in risk.

然而,即使有精細作圖的數據在手,當多個功能性SNP位于單一基因座上且其中只有一個對疾病有主效作用時,下游分析也會變得復雜。也可能是多個變異位點效應互補,亦或是某一特定疾病位點的病因靶組織位于原發組織的外部。

舉個例子,除了前列腺上皮細胞的失調,前列腺癌可能還受到免疫細胞的影響。這可以解釋,為什么現有的前列腺上皮表觀基因組學數據中大約1/3的風險位點 (risk loci)?沒有功能。此外,漿液性卵巢癌中精細作圖的risk SNP 富集在FTSE (fallopian tube serous epithelium)?原生代細胞系而并非卵巢漿液性上皮細胞系,表明該組織是由FTSE起源而來的,因此作者預計多個候選組織(或所有已知細胞類型)之間的比較將成為該領域的標準。Thus, in the midst of so much uncertainty, it is essential that biological assays give repeatable and reliable measures of these complex interactions。必須強調的是,單獨的功能注釋顯然不是全面的,其他與染色質有關的未知功能在將來也會被考慮。最終目標是在每個risk位點鑒定出真正的功能/致病性SNP(具有超過1個SNP或多個causal等位基因)。實現這一目標需要開發特定的檢測方法,一旦相應的表觀基因組(或其他)的變異功能得到驗證,即可檢測等位基因對對癌癥進程的影響。The eventual utility from this will be the compilation of more informative nomograms for risk assess- ments and the identification of risk mechanisms.

參考文獻:

見原文

擴展閱讀:

GWAS – Science topic

What is the Perspectives? ?From New Journal of Chemistry

Perspectives are brief reviews giving the personal viewpoint of a leading scientist in their area of research, setting it in the context of the work of others and looking forward to future developments.

In some cases, pairs of collaborating scientists from different disciplines are invited to each give their perspective on their common field of research in order to demonstrate the benefits of collaborative research and facilitate dialogue between communities.

The majority of Perspectives are invited by the editorial office, however suggestions of suitable Perspectives in the form of a brief synopsis and biography of the author, are welcome.

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 古代雜交事件為慈鯛科魚類的適應輻射提供動力 Ancient hybridization fuels rapid c...
    智取鳥氨酸閱讀 4,682評論 0 5
  • 往事濃淡,色如清,已輕。 經年悲喜,凈如鏡,已凈。
    云兒暖閱讀 173評論 0 0
  • 原本打算在家宅一天,在小姐妹兒召喚,勤快的洗了個頭,因為一個女生如果愿意洗頭再出門見人,這是對這個人極大的尊重,像...
    多如艾米閱讀 288評論 4 2
  • 發丘印,摸金符,搬山卸嶺尋龍訣; 人點燭,鬼吹燈,勘輿倒斗覓星峰; 水銀斑,養明器,龍樓寶殿去無數; 窨沉棺,青銅...
    遇見青丘閱讀 77,477評論 3 26