motif與domain
motif(模體)是蛋白中較小的保守序列片段,概念比domain小。
PROSITE是專門搜索蛋白motif的數據庫,其中signature seqs是最重要的motif信息。
domain(結構域)是在較大的蛋白質分子中形成的某些在空間上可以辨別的結構,若干motif可以形成一個domain。
Pfam可以搜索某段序列中的domain,并以圖形化表示出來。用法:在搜索欄輸入蛋白的swissprot的序列號。
展示基因家族的結構域
-
MEME適合挖掘motif,不適合展示基因家族的結構域
MEME以motif為單位,在序列中,往往一個結構與會包含一個以上的motif。 -
NCBI CDD數據庫,鑒定基因保守結構域
NCBI conserved domain database(CDD),是收錄大量NCBI官方矯正過的結構域模型,同時也提供一部分結構域的3D結構和功能說明。一般做基因家族,或者基因結構域鑒定的時候會用到。 - 批量化繪制一個基因家族的結構域圖片
1)序列下載:http://planttfdb.cbi.pku.edu.cn/download_seq.php?sp=Ath&fam=ARF
2)提交到NCBI的CDD batch search:https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi
3)下載結果
4)使用TBtools可視化Batch-CDD結果
Others->Redraw Motif Pattern (from NCBI Batch-CDD)
來自:生信札記