iMETHYL : 整合了DNA甲基化, SNP和RNA_seq的多組學(xué)聯(lián)合數(shù)據(jù)庫

在NGS飛速發(fā)展的時代,有大量研究通過GSWA的方法,闡述了SNP于疾病之間的關(guān)聯(lián); 也有學(xué)者利用WGBS,RRBS, 甲基化芯片等方式研究DNA甲基化與疾病之間的關(guān)系。不過是對于SNP和DNA甲基化,都有許多獨立的數(shù)據(jù)庫存儲和整理相關(guān)信息,但是卻缺乏公開的整合了SNP和DNA甲基化等多組學(xué)數(shù)據(jù)的數(shù)據(jù)庫。

從近100名志愿者中提取3種類型的細胞,并分別進行WGS, WGBS, RNA_seq測序分析,將最終的數(shù)據(jù)存儲到iMETHYL 數(shù)據(jù)庫中。iMETHYL整合了SNP, DNA甲基化和RNA表達譜的數(shù)據(jù),并進行了兩兩之間的關(guān)聯(lián)分析。

網(wǎng)址如下:

http://imethyl.iwate-megabank.org/index.html

STATISTICS頁面,提供了兩個基本信息。

3種組學(xué)數(shù)據(jù)的分布

可以看到志愿者的性別,年齡的基本情況,以及DNA甲基化,基因表達和SNV的匯總信息。

在上面這個表格中,常染色體的CpG個數(shù)值得注意,個數(shù)為23M 左右, 而甲基化芯片為450K或者850K, 可以明顯看到WGBS相對甲基化芯片的優(yōu)勢。

CpG位點在各染色體的分布

這里只給出了常染色體上的分布,可以看到1號染色體上的CpG位點是最多的

HOME頁面,提供了3種檢索方式

  1. Gene Symbol

  2. dbSNP rsID

  3. chr Position

檢索的結(jié)果通過基因組瀏覽器進行展示:

看下DNA甲基化,轉(zhuǎn)錄組數(shù)據(jù)和SNV數(shù)據(jù)在基因組瀏覽器中的展示方式。
IMM:3 cell-types用于顯示每個細胞系甲基化,基因表達量和SNV的結(jié)果

RNA_seq的數(shù)據(jù),通過FPKM進行展示,在基因組瀏覽器中會給出每種細胞,檢測到的轉(zhuǎn)錄本

SNV的結(jié)果采用點來展示,每個|代表一個SNV位點

鼠標懸停之后,可以看到對應(yīng)的rs編號和堿基的突變情況

甲基化位點的展示方式和SNV類似

對于3種組學(xué)的數(shù)據(jù),imethy還通過QTL分析兩兩之間的關(guān)聯(lián)。

基因型和基因表達譜之間的關(guān)聯(lián)分析通過cis-eQTL來實現(xiàn); DNA甲基化和基因表達譜之間的關(guān)聯(lián)分析通過cis-eQTM來實現(xiàn),DNA甲基化與基因型之間的關(guān)聯(lián)分析通過cis-mQTL來實現(xiàn)。


eQTLmQTL都是列出于該基因相關(guān)聯(lián)的SNP位點,eQTM列出與基因相關(guān)聯(lián)的甲基化位點。

iMETHYL數(shù)據(jù)庫代表的是一種趨勢,多組學(xué)數(shù)據(jù)整合分析的趨勢。隨著測序成本降低和分析技術(shù)的成熟,單組學(xué)的數(shù)據(jù)大量涌現(xiàn),但是生命活動這么復(fù)雜的事件,其影響因素必然是多個方面的。多組學(xué)數(shù)據(jù)的整合分析允許我們多方位,更全面,更深入的進行研究和探索,必然是一個趨勢。

這個數(shù)據(jù)庫也給我們做了一個示例,DNA甲基化可以與轉(zhuǎn)錄組,基因組SNV的數(shù)據(jù)進行聯(lián)合分析,分析的具體方法可以參考和借鑒該數(shù)據(jù)庫,使我們的研究結(jié)果更加的豐富。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容