ATAC-seq指南(一) ATAC-seq Guidelines(1)

寫在前面(19.11.14,11.19)

最近需要寫一份博士研究計(jì)劃,感覺最近單細(xì)胞RNA-seq(scRNA-seq)和單細(xì)胞ATAC-seq(scATAC-seq)聯(lián)合分析很火,想著在碩士研究的基礎(chǔ)上蹭一下熱度,單細(xì)胞水平達(dá)不到,可以用bulk cells嘛。 但是,作為一個(gè)生信小白,怎么才能寫出一篇看起來是那么回事的研究計(jì)劃呢? 之前在jimmy大神的生信技能樹中看過很多關(guān)于ATAC-seq數(shù)據(jù)分析的文章,對理論知識(shí)和流程有所了解,但是就是處于光說不練瞎把式的狀態(tài),所以只能硬著頭皮比著葫蘆畫瓢看看怎么寫。 詳細(xì)信息可以參見生信技能樹的實(shí)操系列教程目錄

ATAC-seq指南

意外的發(fā)現(xiàn)

在google一下的時(shí)候,突然發(fā)現(xiàn)了Harvard FAS的一篇文章 ATAC-seq Guidelines,感覺這篇文章講的框架非常好,比較適合我這種急功近利對ATAC-seq做一個(gè)全面了解的人,因此我特地把我的一些收獲寫出來。不是單純的翻譯,只是記錄一些學(xué)習(xí)過程。 ##ATAC-seq 概況 我的理解:基因在進(jìn)行調(diào)控時(shí),其上游染色質(zhì)是屬于開放的狀態(tài),探究這種開放的情況可以獲得該狀態(tài)下整體的基因調(diào)控情況。T5轉(zhuǎn)座酶是可以插入到開放的區(qū)域并切割DNA片段,因此將T5轉(zhuǎn)座酶連接上特異性的 adapters,再將片段收集測序,就能得到全基因度尺度上處于開放狀態(tài)的染色質(zhì)區(qū)域。詳細(xì)知識(shí)參考ATAC-seq基礎(chǔ)知識(shí) 文獻(xiàn):https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4374986/

ATAC-seq overview

實(shí)驗(yàn)設(shè)計(jì)

具體參見detailed protocol

一些注意事項(xiàng):(太長不看版)

  1. 重復(fù):一般兩個(gè)足夠。

  2. 對照:一般不用,可以使用不加轉(zhuǎn)座酶,然后加上接頭的片段化DNA。

  3. PCR擴(kuò)增:建庫過程中少進(jìn)行PCR擴(kuò)增,可能會(huì)影響后續(xù)分析。

  4. 測序深度:取決于基因組大小和染色質(zhì)開放程度,人類樣本5千萬reads。

  5. 測序模式:推薦雙端測序。

  6. 線粒體:最好去除,方法見 Omni-ATAC method

一些注意事項(xiàng):(婆婆媽媽版)

  1. 重復(fù) 重復(fù)可以確保你的樣品產(chǎn)生的數(shù)據(jù)是由生物效應(yīng)引起的,而不是某個(gè)特定樣本的特性或其處理過程造成的。 (這里我想到一個(gè)問題,像我研究的真菌是含有細(xì)胞壁的,酶解是去除細(xì)胞壁而又不傷害細(xì)胞核的方法,可以方便后續(xù)提取細(xì)胞核,但是酶解對細(xì)胞會(huì)產(chǎn)生一定的影響,尤其是如果實(shí)驗(yàn)處理就是溫度處理的話,估計(jì)影響會(huì)很大。)

  2. 對照

    我的理解就是,分析的時(shí)候就可以把沒有處理的作為對照,似乎不太需要單獨(dú)做一個(gè)純陰性對照。

  3. PCR擴(kuò)增

    主要是關(guān)于PCR重復(fù)的問題,關(guān)于為什么會(huì)產(chǎn)生重復(fù),重復(fù)會(huì)對后續(xù)分析產(chǎn)生哪些影響?

    可以參考以下幾篇文章,都很有趣,值得學(xué)習(xí)。

    How PCR duplicates arise in next-generation sequencing試論NGS數(shù)據(jù)的Duplication問題 關(guān)于二代測序中的duplication如何去除二代測序數(shù)據(jù)中的PCR duplication才科學(xué)?

    我的理解就是建庫加接頭或者儀器讀取過程中會(huì)產(chǎn)生PCR重復(fù),而重復(fù)會(huì)對Peak calling產(chǎn)生影響,因此需要去除。

    Genrich 中,-r 可以進(jìn)行PCR重復(fù)的移除。

  4. 測序深度:

    暫時(shí)不知道咋寫

  5. 測序模式:

    雙端測序的優(yōu)勢:

    1)有助于提高重復(fù)序列比對的準(zhǔn)確性,參見 單端測序與雙末端測序問題- 簡書[序列拼接] 雙端測序,原理+ 拼接(Pandaseq) - 知乎

    2)雙端測序可以獲得更多的關(guān)于轉(zhuǎn)座酶插入位置的信息。

    3)單端測序中只要5‘ 端一樣就會(huì)被認(rèn)定為duplication,會(huì)產(chǎn)生假陽性的結(jié)果,也有可能去除了不該去除的序列,而雙端測序避免了這種情況。

  6. 線粒體:

    ATAC-seq 中含有很大一部分線粒體DNA,參見this discussion

    而我們關(guān)注的只是核DNA,因此要對線粒體DNA進(jìn)行去除,一般可以從實(shí)驗(yàn)方法和分析方法兩個(gè)方面進(jìn)行去除(同時(shí)進(jìn)行)。

    實(shí)驗(yàn)方法去除可參見:Omni-ATAC methodATAC-seq Assay with Low Mitochondrial DNA Contamination from Primary Human CD4+ T Lymphocytesusing CRISPR to reduce mitochondrial contamination

    分析方法:Genrich中可以使用 -e chrM命令來去除線粒體的reads

總結(jié)

分析部分后續(xù)再寫吧,還打算以一篇文章進(jìn)行實(shí)戰(zhàn)Chromatin Accessibility-Based Characterization of the Gene Regulatory Network Underlying Plasmodium falciparum Blood-Stage Development 另外,該指南還有一個(gè)舊版本,還沒仔細(xì)看,目前新版本分析Peak-caliling中沒有使用Macs2,而是用的Genrich,走M(jìn)acs2流程的話請參見老版本

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容