【ChIP-seq 實戰(zhàn)】七、可視化(IGV部分)

這里是佳奧!

獲得了peaks之后我們導入IGV檢查。

1 deeptools初探

##安裝
conda install -c bioconda/label/cf201901 deeptools

bamCoverage的基本用法

source activate chipseq
bamCoverage -e 170 -bs 10 -b ap2_chip_rep1_2_sorted.bam -o ap2_chip_rep1_2.bw
# ap2_chip_rep1_2_sorted.bam是前期比對得到的BAM文件

得到的bw文件就可以送去IGV/Jbrowse進行可視化。 這里的參數僅使用了-e/--extendReads-bs/--binSize即拓展了原來的read長度,且設置分箱的大小。其他參數還有

  • --filterRNAstrand {forward, reverse}: 僅統(tǒng)計指定正鏈或負鏈
  • --region/-r CHR:START:END: 選取某個區(qū)域統(tǒng)計
  • --smoothLength: 通過使用分箱附近的read對分箱進行平滑化

如果為了其他結果進行比較,還需要進行標準化,deeptools提供了如下參數:

  • --scaleFactor: 縮放系數
  • `--normalizeUsingRPKMReads``: Per Kilobase per Million mapped reads (RPKM)標準化
  • --normalizeTo1x: 按照1x測序深度(reads per genome coverage, RPGC)進行標準化
  • --ignoreForNormalization: 指定那些染色體不需要經過標準化

2.1 首先把bam文件轉為bw文件

##合并的bam文件
cd  mergeBam 

ls  *.bam  |xargs -i samtools index {} 
ls *.bam |while read id;do
bamCoverage --normalizeUsing CPM -b $id -o ${id%%.*}.bw & 
done 

##去除PCR重復的bam
cd dup 

ls  *.bam  |xargs -i samtools index {} 
ls *.bam |while read id;do
bamCoverage --normalizeUsing CPM -b $id -o ${id%%.*}.rm.bw & 
done 

好像原本chipseq環(huán)境是python2的,deeptools有些不兼容,我新建了一個python3的chipseq2環(huán)境試一試。


QQ截圖20220812113829.png

這一次跑起來了。

##合并的bam文件
(chipseq2) root 11:48:09 /home/kaoku/chipseq/mouse_project/mergeBam
$ ls *.bw
Control.bw  H2Aub1.bw  H3K36me3.bw  Ring1B.bw  RNAPII_8WG16.bw  RNAPII_S2P.bw  RNAPII_S5P.bw  RNAPII_S5PRepeat.bw  RNAPII_S7P.bw

##去除PCR重復的bam
(chipseq) root 14:11:18 /home/kaoku/chipseq/mouse_project/dup
$ ls *.bw
Control.rm.bw  H3K36me3.rm.bw  RNAPII_8WG16.rm.bw  RNAPII_S5PRepeat.rm.bw  RNAPII_S7P.rm.bw
H2Aub1.rm.bw   Ring1B.rm.bw    RNAPII_S2P.rm.bw    RNAPII_S5P.rm.bw

2 IGV可視化

以H2Aub1這個樣本(去除PCR重復)為例

-rw-r--r-- 1 root root  926M  8月 11 22:20 H2Aub1_rmdup_control_lambda.bdg
-rw-r--r-- 1 root root   77K  8月 11 22:16 H2Aub1_rmdup_model.r
-rw-r--r-- 1 root root   86K  8月 11 22:20 H2Aub1_rmdup_peaks.narrowPeak
-rw-r--r-- 1 root root   98K  8月 11 22:20 H2Aub1_rmdup_peaks.xls
-rw-r--r-- 1 root root   59K  8月 11 22:20 H2Aub1_rmdup_summits.bed
-rw-r--r-- 1 root root  1.1G  8月 11 22:20 H2Aub1_rmdup_treat_pileup.bdg

我們把下列文件導入IGV:File——Load from File


QQ截圖20220812122910.png
QQ截圖20220812123016.png

QQ截圖20220812132114.png
QQ截圖20220812132122.png

我們再來對比一下去除PCR重復的和沒去出的H2Aub1有什么區(qū)別

參考基因組選擇mm10

QQ截圖20220812135444.png

選擇基因BRCA1


QQ截圖20220812140838.png

可以看到這里去除PCR重復有效果


QQ截圖20220812140927.png

重新導入一批
QQ截圖20220812141709.png

2號染色體中間的peaks是老鼠染色體特有的。

回到Linux看一下跑完了的peaks目錄,這些是軟件認為的peaks。

(chipseq) root 14:24:26 /home/kaoku/chipseq/mouse_project/peaks
$ head H2Aub1_rmdup_summits.bed
chr1    4492669 4492670 H2Aub1_rmdup_peak_1     3.99494
chr1    4493158 4493159 H2Aub1_rmdup_peak_2     8.99601
chr1    4493469 4493470 H2Aub1_rmdup_peak_3     3.99494
chr1    4496552 4496553 H2Aub1_rmdup_peak_4     3.60380
chr1    4497092 4497093 H2Aub1_rmdup_peak_5     5.04333
chr1    4497408 4497409 H2Aub1_rmdup_peak_6     3.99494
chr1    5916554 5916555 H2Aub1_rmdup_peak_7     5.04333
chr1    5917020 5917021 H2Aub1_rmdup_peak_8     5.94642
chr1    12991930        12991931        H2Aub1_rmdup_peak_9     3.13457
chr1    14506458        14506459        H2Aub1_rmdup_peak_10    2.69568

##IGV可識別的格式
$ awk '{print $1":"$2"-"$3}' H2Aub1_rmdup_summits.bed | head
chr1:4492669-4492670
chr1:4493158-4493159
chr1:4493469-4493470
chr1:4496552-4496553
chr1:4497092-4497093
chr1:4497408-4497409
chr1:5916554-5916555
chr1:5917020-5917021
chr1:12991930-12991931
chr1:14506458-14506459

可以清晰看到第一個peaks:chr1:4492669-4492670


QQ截圖20220812143007.png

單擊Refseq Genes一欄可以看到窗口


QQ截圖20220812143303.png

SOX17

總結:

  • H2Aub1_rmdup_summits.bed生成peaks的位置信息。

  • 把文件導入IGV查看。

       H2Aub1.bw
    
      Control.bw
    
      H2Aub1.merge.bam
    
      H2Aub1.merge.rmdup.bam
    
      H2Aub1_rmdup_summits.bed
    
      IGV內選擇小鼠參考基因組mm10
    
  • 結合背景Control.bw與H2Aub1.bw比較。

  • 判斷是否是真的peaks。

下一篇我們繼續(xù)學習deeptools在可視化的應用。

我們下一篇再見!

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,363評論 6 532
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 98,497評論 3 416
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 176,305評論 0 374
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,962評論 1 311
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,727評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,193評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,257評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,411評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體,經...
    沈念sama閱讀 48,945評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,777評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,978評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,519評論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,216評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,642評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,878評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,657評論 3 391
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,960評論 2 373

推薦閱讀更多精彩內容