有時候會有這樣的分析需求,拿到兩個基因,或者兩個基因list,雖然它們是不同的基因的,但是可以提一個問題,它們之間的功能注釋上有沒有相似性呢?
特別是,我以前比較兩個基因List,只是看它們之間有多少overlap,如果overlap小,則說明這兩個gene list很不一樣。但是實際上并不是這樣的。有可能這兩個gene list中的基因是有著相似的功能,只不過是gene ID不相同罷了。這時候,GOsemsim包就派上用場了。
GOsemsim: semantic similarity measurement based on Gene ontology,也就是用基因注釋的方法來分析不同的基因或者基因list的相似性。
主要函數如下:
goSim
andmgoSim
Calculate semantic similarity between two GO terms and two sets of GO termsgeneSim
andmgeneSim
Calculate semantic similarity between two gene products and among multiple gene productsclusterSim
andmclusterSim
Semantic similarity between two gene lists and multiple gene lists
下次再比較不同gene或者gene list的時候,就可以用這個包試試,算出的值越傾向于1,則表明這兩個gene list或者gene越相似。