ENCODE轉(zhuǎn)錄因子靶基因數(shù)據(jù)庫(kù)

歡迎關(guān)注”生信修煉手冊(cè)”!

ENCODE數(shù)據(jù)庫(kù)中包含了許多轉(zhuǎn)錄因子的chip-seq數(shù)據(jù),通過(guò)對(duì)chip-seq數(shù)據(jù)進(jìn)行分析,可以預(yù)測(cè)得到該轉(zhuǎn)錄因子對(duì)應(yīng)的靶基因數(shù)據(jù)。

通過(guò)整合多個(gè)轉(zhuǎn)錄因子的分析結(jié)果,就可以構(gòu)建一個(gè)轉(zhuǎn)錄因子靶基因數(shù)據(jù)庫(kù),網(wǎng)址如下

http://amp.pharm.mssm.edu/Harmonizome/dataset/ENCODE+Transcription+Factor+Targets

該數(shù)據(jù)庫(kù)中包含181種轉(zhuǎn)錄因子的靶基因數(shù)據(jù),每種轉(zhuǎn)錄因子的靶基因?qū)?yīng)一個(gè)數(shù)據(jù)集,示意如下

以轉(zhuǎn)錄因子ARID3A為例,結(jié)果如下

從截圖中也可以看到,雖然chip-seq數(shù)據(jù)有實(shí)驗(yàn)證據(jù)的支持,但是由于peak-calling的假陽(yáng)性等問題,最終得到的靶基因的數(shù)量是非常多的,這其中的假陽(yáng)性率不言而喻。

該網(wǎng)站的數(shù)據(jù)不僅可以瀏覽,也可以下載。對(duì)于單個(gè)轉(zhuǎn)錄因子的靶基因數(shù)據(jù),可以通過(guò)如下API進(jìn)行下載

http://amp.pharm.mssm.edu/Harmonizome/api/1.0/gene_set/ARID3A/ENCODE+Transcription+Factor+Targets

上述鏈接可以下載轉(zhuǎn)錄因子ARID3A對(duì)應(yīng)的靶基因數(shù)據(jù),對(duì)于其他的轉(zhuǎn)錄因子,只需要替換掉對(duì)應(yīng)的TF的名字即可。API返回的是JSON格式的數(shù)據(jù),需要一定的編程技巧才可以得到類似excel的文件形式。

對(duì)于整個(gè)數(shù)據(jù)庫(kù),可以通過(guò)如下API獲得全部轉(zhuǎn)錄因子對(duì)應(yīng)的數(shù)據(jù)的鏈接

http://amp.pharm.mssm.edu/Harmonizome/api/1.0/dataset/ENCODE+Transcription+Factor+Targets

然后就可以下載到整個(gè)數(shù)據(jù)庫(kù)了。整個(gè)數(shù)據(jù)庫(kù)中的信息簡(jiǎn)單直接,缺點(diǎn)就是假陽(yáng)性率高。在線檢索功能非常方便,但是下載數(shù)據(jù)庫(kù)的話需要一定的編程技巧進(jìn)行處理。

·end·

—如果喜歡,快分享給你的朋友們吧—


掃描關(guān)注微信號(hào),更多精彩內(nèi)容等著你!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容