如何使用KAAS進行KEGG注釋

使用KAAS做KEGG注釋

標簽: KEGG, RNAseq, bioinformatics

什么是KEGG

中文名: 京都基因與基因組百科全書
外文名: koyto Encyclopedia of Genes and Genomes

簡介 百度百科
KEGG(京都基因與基因組百科全書)是基因組破譯方面的數據庫。在后基因時代一個重大挑戰是如何使細胞和有機體在計算機上完整的表達和演繹,讓計算機利用基因信息對更高層次和更復雜細胞活動和生物體行為作出計算推測。為達到此目的,人們建立了一個在相關知識基礎上的網絡推測計算工具。在給出染色體中一套完整的基因的情況下,它可以對蛋白質交互(互動)網絡在各種細胞活動起的作用作出預測。 KEGG 的PATHWAY 數據庫整合當前在分子互動網絡(比如通道,聯合體)的知識,KEGG 的GENES/SSDB/KO 數據庫提供關于在基因組計劃中發現的基因和蛋白質的相關知識,KEGG 的COMPOUND/GLYCAN/REACTION數據庫提供生化復合物及反應方面的知識。

準備工作

  1. KAAS官網
  2. 蛋白質序列 cottonFGD提供各個棉種的protein sequence
  3. 自己的郵箱

步驟

  1. 對于已知基因組的物種進行全基因組的KEGG注釋選擇<font color=red>Complete or Draft Genome</font>選項中的KAAS job request(BBH-method).BBH-method表示bi-directional best hit,雙向的匹配,準確率更高。
    KAAS主頁
  2. 比對方法有三種:BLAST,GHOSTX,GHOSTZ,各有各的優缺點,其中BLAST結果更加準確,但是好像對輸入的數據大小有要求,如果條目太多返回郵件會提示刪減條目,可以輸入的數據可以是核酸序列也可以是蛋白序列。在query name地方可以自己命名這次注釋工作。 然后填寫自己的郵箱
    方法選擇及數據輸入
  3. GENES data set這個項目中存在預設的參考物種信息,可以發現其中提供的各個門類,物種的多樣性特別高,有動物,植物,微生物的,如果我們直接用默認的物種進行注釋,可以得到很全面的注釋,但是在后來做enrichment的時候會發現很多會富集到疾病等代謝通路上,在植物研究中這些明顯不具有參考價值,所以可以手動的選擇Manual selection,其中提供了大量植物的background,總共我們可以選擇40個。
    GENE data set
    Maual selection for plant
  4. 選擇雙向匹配,然后開始。
    start computing

結果

根據輸入數據大小,網速等需要等待一段時間,好了以后會收到一封郵件,然后會給兩個鏈接,首先要確認開始

Job Request
An email has been sent to xxx@xx.com for confirmation.
Please click on the link in the email to submit your KAAS job.
Automatic Annotation Server Ver. 2.1


KAAS - Job request accepted
KEGG Automatic Annotation Server Ver. 2.1
Your request ID is 1537237762.

Please click on the link below to submit your job.
https://www.genome.jp/kaas-bin/kaas_main?mode=submit&id=Num.&key=PP_DnQbB (Submit)

https://www.genome.jp/kaas-bin/kaas_main?mode=cancel&id=Num.&key=PP_DnQbB (Cancel)

If no action is taken within 7 days, your request will be deleted.

Best regards
GenomeNet Team


Request IDNum. is submitted.

The URL of your result page will be following address.
https://www.genome.jp/kaas-bin/kaas_main?mode=user&id=Num&key=PP_DnQbB


KAAS - Accepted
KEGG Automatic Annotation Server Ver. 2.1
Your request ID is Num。

The URL of your result page will be following address
https://www.genome.jp/kaas-bin/kaas_main?mode=user&id=Num.&key=PP_DnQbB

Best regards
GenomeNet Team


query list page

當服務器運算結果出來以后會郵件通知,結果又兩種形式,一種是網頁版,他會列出所有注釋到的信息,然后每個信息對應的通路圖,還會提供geneID2KUM,每個基因對應的kegg的K號(直系同源)


result

參考來源及推薦閱讀

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。