tags: tophat-fusion
tophat-fusion 報錯
RNA-seq 數據檢測融合基因,在 tophat-fusion 這一步報錯:
./SeqAn-1.4.2/seqan/basic/basic_exception.h:236 FAILED! (Uncaught exception of type St12out_of_range: basic_string::substr)
第一次運行的是 tophat 報這個錯,然后換用 tophat2 重新運行,還是報這個錯。
google 之后發現 biostar 有人給出了解決辦法,很簡單,用tophat2.1.0這個版本就好了!我檢查了一下自己的 tophat2 是 2.1.1 的,重新下載 tophat2.1.0 然后安裝重跑,浪費了我半天時間的 bug 就解決了。
為什么 tophat1 和 tophat2.1.1 都在這里出問題,而唯獨 tophat2.1.0 順利跑完了……
tophat-fusion-post 數據庫配置
從 tophat-fusion 官方站點下載 ensGene.txt 和 refGene.txt,以及 blast 數據庫中的 human*, nt*, other* ,這些數據庫一個都不能少。
更新一個注意事項
tophat-fusion-post 是用來過濾 tophat-fusion 得到的融合基因初步位點,由于 tophat-fusion-post 這一步用的數據庫是 hg18, hg19, hg38 這一系列的,因此在前一步 tophat-fusion 必須也使用 hg 系列來作參考基因組,否則經過過濾之后得不到任何結果,0 位點輸出,而且軟件并不會給出任何錯誤提示。
想必很多用 tophat 分析融合基因的人都被這個點坑過,我分析很有可能是跟參考基因組的染色體名稱是否有 chr 有關系 ……
要規避 phred-33 和 phred-64 之坑,還要規避參考基因組的染色體名稱有無 chr 前綴之坑,真是讓人哭笑不得。