KEGG數(shù)據(jù)庫:查找某個(gè)通路上的所有基因

1.kegg數(shù)據(jù)庫下載

通常我們?nèi)绻阎硞€(gè)基因,想對這個(gè)基因做通路很簡單,直接用kegg的網(wǎng)頁注釋就可以;如果想知道某個(gè)通路里相關(guān)的所有基因列表,要找全的話只能從數(shù)據(jù)庫里調(diào)了。數(shù)據(jù)庫下載方式,參考本文:什么?KEGG數(shù)據(jù)你竟然還不會(huì)下載!!

人類的kegg注釋文件下載https://pan.baidu.com/s/1o7XseDG.

A,B開頭分別代表KEGG的分類;

C開頭代表代謝通路,pathway;

D開頭代表該通路里邊的基因,其中第二列為ncbi_entrez_id和gene?Symbol;


2.kegg數(shù)據(jù)庫各前綴含義

參考KEGG Map基礎(chǔ)概念(一)

1)?K+num,表示在所有同源物種中具有相似結(jié)構(gòu)或功能的一類同源蛋白;(注:K大寫)---如,K04456 = 絲氨酸/蘇氨酸蛋白激酶;

2)ko+num,表示代謝通路名稱,表示一個(gè)特定的生物路徑;(注:ko小寫)?---如,ko04151 = PI3K-Akt信號通路;

3)M+num,表示模塊名稱?;---如,M00676 = PI3K-Akt信號模塊;

4)map+num,表示KEGG中通用?代謝通路圖;無色;

5)hsa+num,表示KEGG中某特定物種代謝通路圖;該類通路圖中通常有綠色方框,表示該方框?qū)儆谠撐锓N;hsa是人類的代號,若是別的物種,該代號會(huì)變更;

6)?C+num,表示化合物名稱;如C00533 = NO (一氧化氮)

7)-.-.-.- ,表示酶的名稱;如EC2.7.11.1 = 絲氨酸/蘇氨酸激酶(即K04456,AKT);在代謝通路圖中,方框中通常會(huì)有-.-.-.-的數(shù)字,即表示酶;

8)R+num,表示反應(yīng)名稱;

9)RC+num,表示反應(yīng)類型;

10)RP+num,表示反應(yīng)物質(zhì)對。?


3. 各種ID轉(zhuǎn)換 ?

HGNC數(shù)據(jù)庫下載頁面,下載protein-coding gene.txt這個(gè)文件,里邊有各數(shù)據(jù)庫之間的ID對應(yīng)關(guān)系,可輕松應(yīng)對各種轉(zhuǎn)換。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲(chǔ)服務(wù)。