這里是佳奧!
獲得了比對的bam文件,生成了index的bai文件,生成了比對結果stat文件。
##可以先multiqc看一下結果
multiqc ./
合并bam文件和去除PCR重復沒有嚴格先后順序,是否必要根據文章決定
1 合并bam文件
需要回文章看
是同一個樣本的多個測序、還是多個生物學重復。(一個樣本測了兩次,還是兩次實驗同一個樣本)
因為一個樣品分成了多個lane進行測序,所以在進行peaks calling的時候,需要把bam進行合并。
## 如果不用循環 格式:輸出 兩個輸入
samtools merge control.merge.bam Control_1_trimmed.bam Control_2_trimmed.bam
## 通常我們用批處理
mkdir mergeBam
cd /home/kaoku/chipseq/mouse_project/align
ls *.bam| sed 's/_[0-9]_trimmed.bam//g' |sort -u | while read id; do samtools merge ../mergeBam/$id.merge.bam $id*.bam ; done
##合并以后
(chipseq) root 16:05:07 /home/kaoku/chipseq/mouse_project/mergeBam
$ ls -lh
總用量 9.6G
-rw-r--r-- 1 root root 836M 8月 11 15:57 Control.merge.bam
-rw-r--r-- 1 root root 1.3G 8月 11 15:58 H2Aub1.merge.bam
-rw-r--r-- 1 root root 1.6G 8月 11 15:59 H3K36me3.merge.bam
-rw-r--r-- 1 root root 1.3G 8月 11 16:00 Ring1B.merge.bam
-rw-r--r-- 1 root root 1.1G 8月 11 16:01 RNAPII_8WG16.merge.bam
-rw-r--r-- 1 root root 1.5G 8月 11 16:02 RNAPII_S2P.merge.bam
-rw-r--r-- 1 root root 1.4G 8月 11 16:03 RNAPII_S5P.merge.bam
-rw-r--r-- 1 root root 215M 8月 11 16:04 RNAPII_S5PRepeat.merge.bam
-rw-r--r-- 1 root root 713M 8月 11 16:04 RNAPII_S7P.merge.bam
2 去除PCR重復
##使用軟件samtools(后臺運行,top查看后臺)
ls *merge.bam | while read id ; do ( samtools markdup -r $id $(basename $id ".bam").rmdup.bam & );done
##把去除重復的bam文件再次建立索引,查看比對效果
ls *.rmdup.bam | xargs -i samtools index {}
ls *.rmdup.bam | while read id ; do ( samtools flagstat $id > $(basename $id ".bam").stat & );done
##結果如下,去除重復前后比較
(chipseq) root 20:58:44 /home/kaoku/chipseq/mouse_project/mergeBam
$ ls -lh
總用量 18G
-rw-r--r-- 1 root root 836M 8月 11 15:57 Control.merge.bam
-rw-r--r-- 1 root root 743M 8月 11 20:57 Control.merge.rmdup.bam
-rw-r--r-- 1 root root 1.3G 8月 11 15:58 H2Aub1.merge.bam
-rw-r--r-- 1 root root 1.1G 8月 11 20:58 H2Aub1.merge.rmdup.bam
-rw-r--r-- 1 root root 1.6G 8月 11 15:59 H3K36me3.merge.bam
-rw-r--r-- 1 root root 1.5G 8月 11 20:58 H3K36me3.merge.rmdup.bam
-rw-r--r-- 1 root root 1.3G 8月 11 16:00 Ring1B.merge.bam
-rw-r--r-- 1 root root 1006M 8月 11 20:58 Ring1B.merge.rmdup.bam
-rw-r--r-- 1 root root 1.1G 8月 11 16:01 RNAPII_8WG16.merge.bam
-rw-r--r-- 1 root root 984M 8月 11 20:58 RNAPII_8WG16.merge.rmdup.bam
-rw-r--r-- 1 root root 1.5G 8月 11 16:02 RNAPII_S2P.merge.bam
-rw-r--r-- 1 root root 1.2G 8月 11 20:58 RNAPII_S2P.merge.rmdup.bam
-rw-r--r-- 1 root root 1.4G 8月 11 16:03 RNAPII_S5P.merge.bam
-rw-r--r-- 1 root root 775M 8月 11 20:58 RNAPII_S5P.merge.rmdup.bam
-rw-r--r-- 1 root root 215M 8月 11 16:04 RNAPII_S5PRepeat.merge.bam
-rw-r--r-- 1 root root 210M 8月 11 20:57 RNAPII_S5PRepeat.merge.rmdup.bam
-rw-r--r-- 1 root root 713M 8月 11 16:04 RNAPII_S7P.merge.bam
-rw-r--r-- 1 root root 610M 8月 11 20:57 RNAPII_S7P.merge.rmdup.bam
##查看一下比對成功率
$ grep 'N/A' *.stat | grep '%'
Control.merge.rmdup.stat:12330969 + 0 mapped (85.16% : N/A)
H2Aub1.merge.rmdup.stat:17516222 + 0 mapped (96.82% : N/A)
H3K36me3.merge.rmdup.stat:22685679 + 0 mapped (98.51% : N/A)
Ring1B.merge.rmdup.stat:24901367 + 0 mapped (93.46% : N/A)
RNAPII_8WG16.merge.rmdup.stat:23397509 + 0 mapped (94.84% : N/A)
RNAPII_S2P.merge.rmdup.stat:26655659 + 0 mapped (95.36% : N/A)
RNAPII_S5P.merge.rmdup.stat:13680963 + 0 mapped (90.78% : N/A)
RNAPII_S5PRepeat.merge.rmdup.stat:3997567 + 0 mapped (82.22% : N/A)
RNAPII_S7P.merge.rmdup.stat:9759486 + 0 mapped (77.96% : N/A)
RNAPII_S7P.merge.rmdup.stat:9759486 + 0 primary mapped (77.96% : N/A)
去除PCR重復和不去除PCR重復的樣本都找一次peaks看一下。
我們拿到兩批文件:合并的bam文件,去除PCR重復的合并bam文件。
下一步就是使用macs2尋找peaks了!
我們下一篇再見!