transvar變異坐標轉換 - 在線web篇

本文是“transvar變異坐標轉換 - Linux篇”http://www.lxweimin.com/p/0aa5cb6eefe2的姊妹篇,專門寫給不熟悉Linux軟件的童鞋~

坐標轉換困境

一些公開發表的論文中及很多數據庫中經常提到變異,一般變異的表現形式有三種:1)基因組坐標:2)cDNA 坐標;3)蛋白氨基酸坐標。舉個例子TP53上的某個變異的基因組坐標是g.chr17:74026C>A,cDNA坐標是c.1001G>T,蛋白氨基酸坐標是p.G334V。在數據分析的過程中經常會遇到這三種坐標相關轉換的情況,例如你從文獻或者某個數據庫中收集到了幾百個腫瘤靶向藥的用藥位點,而你在你樣本中檢測到了很多變異,想知道你的樣本中包含多少收集到的已知的用藥位點。但通常文獻或者數據庫會以第二種或者第三種形式表示變異,而我們自己檢測的變異通常會以vcf格式存儲,這樣就無法直接匹配。當然可以對vcf格式的變異進行ANNOVAR注釋,然后對cDNA或者蛋白氨基酸坐標形式的變異進行比較,但嘗試過的人都表示特別痛苦:需要考慮的規則太多!嘗試兩次,還是放棄了:一是匹配規則不通用;二是總擔心有沒有考慮到過的情況。所以急需一個能完成這種坐標轉換的工具。15年發表在NATURE METHODS上的題為:TransVar: a multilevel variant annotator for precision genomics的文章中推出了一款名為TransVar的軟件成了解決不同層面變異坐標轉換的神器。下面小編就介紹一下這款軟件(Linux版),沒有Linux基礎的也不用擔心,后續會寫一篇基于Web版TransVar進行注釋(坐標轉換)的文章。

TransVar軟件簡介

Transvar 是一款多種方向的突變/坐標轉換工具,它支持基因組坐標、cDNA 坐標以及蛋白氨基酸坐標之間的轉換。


image.png

如上圖所示,該軟件的功能可細分為下面3種:
1)正向注釋:對于基因組坐標的變異進行mRNA(cDNA)和蛋白注釋,這款工具會提供所有的可能結果;
2)反向注釋:將mRNA(cDNA)坐標和蛋白坐標的變異轉換成所有可能基因組坐標形式的變異;
3)等價注釋:對于某一給定的蛋白坐標的變異,搜索所有可能的與其為相同基因組坐標,但在不同轉錄本上的蛋白坐標變異。

網址

https://bioinformatics.mdanderson.org/transvar/
首頁如下:

image.png

使用介紹

1.正向注釋

所謂的“正向”就是將基因組坐標形式的變異作為檢索詞進行檢索,我們以chr7:55259515T>G為例:


image.png

簡單介紹一下,1區域選擇哪種注釋方式;2區域選擇參考基因組版本;3區域選擇轉錄本注釋數據庫,可以選單個或者多個;4區如果需要批量注釋把檢索詞放到文件里,一行一個變異,然后上傳;5區如果單個或少量位點進行檢索,就在該區域直接書寫;6都寫好了點submit提交。
如果不清檢索詞格式,可以下拉主頁面,會有檢索詞示例:


image.png

檢索結果如下:
image.png

image.png

其中第一列為輸入的檢索詞;第2列為轉錄本名;第3列基因名;第4列表上該轉錄本是在正鏈還是負鏈;第5列就是具體的突變信息,有基因坐標的,cDNA坐標的以及蛋白氨基酸坐標的,可以看出基因坐標和我們檢索詞一致;第6列表示該變異在基因上的位置;第7列展示了其他信息,其中最后一個字段source=XXX對應檢索頁面的數據庫;

2.反向注釋

反向注釋包括以cDNA坐標為檢索詞和以蛋白氨基酸坐標為檢索詞兩種:


image.png

數據庫等其他選擇與正向一致,在這里就不贅述了。需要強調的一點是檢索詞的格式,cDNA的示例如下:


image.png

蛋白的示例如下:
image.png

3.等價注釋

等價注釋就是這里的codon search:


image.png

檢索詞還是要蛋白格式的,示例如下:


image.png

例如我們以“CDKN2A:p.R87P”為檢索詞,結果如下:


image.png
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。