Ontology and pathway

本體論(ontology):給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語和關(guān)系,以及利用這些術(shù)語和關(guān)系構(gòu)成的規(guī)定這些詞匯外延規(guī)則的定義。可以把它當作是領(lǐng)域(領(lǐng)域的范圍可以是特定應(yīng)用中,也可以是更廣的范圍。)內(nèi)部不同主體(人、機器、軟件系統(tǒng)等)之間進行交流(對話、互操作、共享等)的一種語義基礎(chǔ),即由Ontology提供一種共識。而且Ontology提供的這種共識更主要的是為機器服務(wù),機器并不能像人類一樣理解自然語言中表達的語義,目前的計算機也只能把文本看成字符串進行處理。因此,在計算機領(lǐng)域討論Ontology,就要討論如何表達共識,也就是概念的形式化問題。

常見ontology數(shù)據(jù)庫:Gene Ontology ,Anatomical Entity OntologyDisease Ontology ,Sequence Ontology, System Biology Ontology

Gene Ontology 為了描述基因和基因產(chǎn)物,定義了三個大的類別,即分子功能(Molecular function)、所參與的生物過程(Biological Process)、所處的亞細胞的定位(Cellular Component)。

Gene Ontology (GO)中關(guān)系描述:1、?"B is a A"是指B is a subtype of A. 2、 "B is part of A" 。3、B regulates A ,又細分為兩個subrelationship,一個是positive regulates,另一個是negative regulates。

GO的注釋有三種:1、人工查閱文獻,將實驗研究出來的分子功能和生物過程錄入該數(shù)據(jù)庫。

2、?利用BLAST類似的方法把沒有實驗證據(jù)的基因通過序列相似性連接到與它相似的功能已知的基因,也需要人工查閱。

3、完全通過計算自動生成,證據(jù)相對較弱一些。

biological pathway定義:通過細胞內(nèi)分子間一系列行為,產(chǎn)生某種產(chǎn)物或?qū)е录毎l(fā)生某種改變。主要就有三大類通路,一個就是metabolic pathways,Gene regulation pathways,signal transduction pathways。

目前流行的pathway數(shù)據(jù)庫有:KEGG, BioCarta, BioCyc,Panther,PID和Reactome。

KEGG也是結(jié)構(gòu)化的格式(同GO),KEGG包含的interaction(關(guān)系)有:蛋白-蛋白關(guān)系、基因表達關(guān)系、酶-酶關(guān)系。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容