今天跟大家分享的是16年1月發表在Cell Cycle(IF=3.530)上的一篇perspective前瞻性文章?Reducing GWAS Complexity (https://doi.org/10.1080/15384101.2015.1120928)
一句話總結:用精細定位來縮小候選功能SNPs的范圍
關鍵詞:GWAS; SNP; Cancer; chromatin; non-coding DNA; enhancer; fine-mapping
隨著測序成本的不斷降低和meta分析的應用,復雜表型相關的GWAS在大樣本數據的處理中越來越強大,越來越多MAF很低的SNPs被鑒定出來。這些候選risk SNPs之間由于LD相互關聯,使得給定locus的關聯分析變得復雜,更何況超過90%的risk SNPs位于非編碼的DNA序列中。
為了解決以上問題,作者結合染色體的生物特征(chromatin biofeatures)去確認GWAS最初發掘的SNPs的潛在功能。這些SNP被稱為索引SNP (index SNPs),之后由r2計算LD后得到的SNPs,被稱為替代SNP (surrogate SNPs)。許多軟件FunciSNP RegulomeDB, Haploreg, Annovar, IGV以及最新的FunSeq8和motifbreakR9 可以根據染色體的注釋信息對risk SNPs進行重新定位,這會大大減少SNP的數目(表1)。在過去的幾年里,作者把這個注釋方法成功運用到前列腺癌和乳腺癌的risk regions篩選中。
盡管此方法把候選SNP數目從50,000篩到了500,再到平均10個(中位數是5)和前列腺癌相關的risk SNPs,但這10個SNP仍需要一一進行詳細和全面的濕實驗驗證。精細定位(fine-mapping) 的新方法可以解決這個問題(來減少實驗量)。
除了p值,有許多新的分析方法來統計篩選候選SNP,比如貝葉斯和重新采樣(re-sampling approaches)方法(原文如下,不太好翻譯,但是很重要)
“These methods include Bayesian and re-sampling approaches that formally incorporate the uncertainty in estimation and ranking, model selection approaches to condition on multiple SNPs in the region using either individual-level data or marginal test statistics, and approaches that formally incorporate prior information, such as SNP annotation, into the final inference.”
最近,作者和他人合作,使用多種族人群、單一大型歐洲人群數據對前列腺癌風險區進行了精細定位,降低了每個區域候選risk SNP的數量(表1)。FunciSNP3注釋的功能和2個精細作圖研究,進一步減少了共同候選SNP的數量,平均每個區域只有大約2個SNP(表1)。這意味著,如果沒有功能性的注釋或精細定位,每個位點都有大量的假陽性結果,從而導致與risk無關的功能分析。Ultimately SNPs must be func- tional to be causal, but not all functional SNPs are inevitably involved in risk.
然而,即使有精細作圖的數據在手,當多個功能性SNP位于單一基因座上且其中只有一個對疾病有主效作用時,下游分析也會變得復雜。也可能是多個變異位點效應互補,亦或是某一特定疾病位點的病因靶組織位于原發組織的外部。
舉個例子,除了前列腺上皮細胞的失調,前列腺癌可能還受到免疫細胞的影響。這可以解釋,為什么現有的前列腺上皮表觀基因組學數據中大約1/3的風險位點 (risk loci)?沒有功能。此外,漿液性卵巢癌中精細作圖的risk SNP 富集在FTSE (fallopian tube serous epithelium)?原生代細胞系而并非卵巢漿液性上皮細胞系,表明該組織是由FTSE起源而來的,因此作者預計多個候選組織(或所有已知細胞類型)之間的比較將成為該領域的標準。Thus, in the midst of so much uncertainty, it is essential that biological assays give repeatable and reliable measures of these complex interactions。必須強調的是,單獨的功能注釋顯然不是全面的,其他與染色質有關的未知功能在將來也會被考慮。最終目標是在每個risk位點鑒定出真正的功能/致病性SNP(具有超過1個SNP或多個causal等位基因)。實現這一目標需要開發特定的檢測方法,一旦相應的表觀基因組(或其他)的變異功能得到驗證,即可檢測等位基因對對癌癥進程的影響。The eventual utility from this will be the compilation of more informative nomograms for risk assess- ments and the identification of risk mechanisms.
參考文獻:
見原文
擴展閱讀:
What is the Perspectives? ?From New Journal of Chemistry
Perspectives are brief reviews giving the personal viewpoint of a leading scientist in their area of research, setting it in the context of the work of others and looking forward to future developments.
In some cases, pairs of collaborating scientists from different disciplines are invited to each give their perspective on their common field of research in order to demonstrate the benefits of collaborative research and facilitate dialogue between communities.
The majority of Perspectives are invited by the editorial office, however suggestions of suitable Perspectives in the form of a brief synopsis and biography of the author, are welcome.