之前用hisat2嘗試處理RNA-seq數(shù)據(jù),這里使用tophat2
1.使用前建立index
使用bowtie2建立index
bowtie2-build genome.fa bowtie2index/genome
genome.fa是基因組fasta文件?
bowtie2index 是index存儲目錄
genome是index的前綴、
注意:程序運(yùn)行完后genome.fa文件要放在bowtie2index目錄中,tophat2軟件才能正確運(yùn)行。
2.將readmapping到參考基因組
tophat2 -p 8 -G genes.gtf -o . bowtie2index/genome ${i}.QC.1.fq.gz ${i}.QC.2.fq.gz | samtools view -h -q 10 -@ 20 | samtools sort -@ 20 -m 1G -o q10.bam
-p :指定線程數(shù)
-G :指定已有的基因組注釋信息,gtf或gff文件;
-o :指定輸出目錄,默認(rèn)為”./tophat_out“;
后面加上索引文件:與前面的bowtie2建立的索引相對應(yīng),只取前綴名。
最后加上fastq文件:filename.fq;如果是雙端測序則是filename_1.fq和filename_2.fq 兩個(gè)文件。
3.我喜歡用featurecount計(jì)算count數(shù)目
featureCounts -p -t exon -g gene_id -M -T 8 -a genes.gtf -o featurecounts.txt q10.bam
4.差異表達(dá)使用DESeq2 流程見RNA-seq數(shù)據(jù)分析 09:DESeq2差異表達(dá)分析 - 知乎 (zhihu.com)
參考:
[轉(zhuǎn)載]RNAseq: TopHat2 + Cufflinks分析流程 - 簡書 (jianshu.com)
RNA-seq數(shù)據(jù)分析 09:DESeq2差異表達(dá)分析 - 知乎 (zhihu.com)
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請注明出處。