使用Cufflinks里面的工具gffread
執行命令:?gffread **.gff?-T -o **.gtf? ?
??????????????????? gffread merged.gtf -o- > merged.gff3
cufflinks詳細用法參考:陳連福的生信博客
問題挺好:
junction:剪接接頭
博主師兄您好, 我剛開始學習RNA-seq數據分析,樓主的文章給我收獲很多,謝謝。 有幾個問題想請教。
我根據12年Nature Protocol 的文章,用Tophat和cufflinks處理數據。
1. 我的數據是細菌,基因組是剛測序完的草圖。自己根據網上的格式介紹嘗試做了一個.gtf 的文件,做Tophat時,發現警告“Warning: TopHat did not find any junctions in GTF file”。不知是.gtf 弄錯了,還是細菌本來就沒有junction.
我的gtf是這樣的:
scaffold1majorCDS933254.–0gene_id “orf00001”; transcript_id “transcript_orf00001”;
scaffold1majorexon933254.–0gene_id “orf00001”; transcript_id “transcript_orf00001”;
scaffold1majorCDS933254.–0gene_id “orf00001”; transcript_id “transcript_orf00001”;
scaffold1majorstart_codon9395.–0gene_id “orf00001”; transcript_id “transcript_orf00001”;
scaffold1majorstop_codon32523254.–0gene_id “orf00001”; transcript_id “transcript_orf00001”;
2. Cufflinks的結果里只有FPKM,如果想要RPKM用什么軟件做呢?還是cufflinks能算RPKM 只是我沒找到。我看了manual,找不到北。
3. 我每個條件只有一組RNAseq, 沒做生物重復。cuffdiff 能做出結果,但是這樣的結果能用嗎? 有沒有其他軟件能做? (你文中說“結果中沒有差異表達基因”)
1.細菌本來就沒有junction。junction是對于真核生物含有內含子的基因來說的。
2.Cufflinks應該是不能用于計算RPKM的,現在公認的是FPKM,RPKM算是過時的。
3.沒有生物重復,則需要使用cufflinks 2.0版本的。高版本貌似必須有重復。