常規的質控和過濾數據是fastqc+trimmomatic,據說fastp更快,而且一次完成質控過濾和出圖。
fastp的github
fastp的出版地址
1.Fastp 軟件安裝
wget http://opengene.org/fastp/fastp
chmod a+x ./fastp
./fastp
本地路徑/home/chaim/disk/soft/fastp/fastp
添加環境變量
vim ~/.bash_profile
export PATH=$home/disk/soft/fastp:PATH
之后即可全局調用fastp。
2.使用參數
2.1 快速處理
單端測序single end(SE)
fastp -i in.fq -o out.fq
雙端測序paired end(PE)
fastp -i in.R1.fq.gz -I in.R2.fq.gz -o our.R1.fq.gz -O out.R2.fq.gz
參數設定:
-w 8 設置進程數8,默認2,max=16,或者是--thread 8
-z 5 設置gzip壓縮級別,默認4,1~9 1快-9小
--json 設置輸出json文件名
--html 設置輸出html文件名
2.2 使用循環批量處理
注意:一定要修改默認的輸出文件名,不然后面的輸出會覆蓋前面的默認文件名
#!/bin/bash
for i in 71 72 75 76 78 79;do
{
fastp -i ~/RNAseq/SRR190242${i}_1.fastq.gz -o SRR190242${i}_1.fastq.gz -I ~/RNAseq/SRR190242${i}_2.fastq.gz -O SRR190242${i}_2.fastq.gz -w 8 --html ${i}.html --json ${i}.json
}
done