用GOsemsim包來比較不同gene或者gene set之間的相似性

有時候會有這樣的分析需求,拿到兩個基因,或者兩個基因list,雖然它們是不同的基因的,但是可以提一個問題,它們之間的功能注釋上有沒有相似性呢?

特別是,我以前比較兩個基因List,只是看它們之間有多少overlap,如果overlap小,則說明這兩個gene list很不一樣。但是實際上并不是這樣的。有可能這兩個gene list中的基因是有著相似的功能,只不過是gene ID不相同罷了。這時候,GOsemsim包就派上用場了。

GOsemsim: semantic similarity measurement based on Gene ontology,也就是用基因注釋的方法來分析不同的基因或者基因list的相似性。

主要函數如下:

  1. goSim and mgoSim
    Calculate semantic similarity between two GO terms and two sets of GO terms

  2. geneSim and mgeneSim
    Calculate semantic similarity between two gene products and among multiple gene products

  3. clusterSim and mclusterSim
    Semantic similarity between two gene lists and multiple gene lists

下次再比較不同gene或者gene list的時候,就可以用這個包試試,算出的值越傾向于1,則表明這兩個gene list或者gene越相似。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容