CUT-Tag概述
所有發生在真核生物 DNA 上的動態過程都發生在染色質中,包括核小體及其修飾、轉錄因子和染色質相關復合物。各種染色質特征標記了活躍和沉默轉錄調控元件和染色質區域的位點,這些位點在細胞類型之間不同,并且在發育過程中發生變化。
染色質特征全基因組的圖譜傳統上是使用染色質免疫共沉淀(ChIP: chromatin immunoprecipitation)進行的,其中染色質是交聯和溶解的,對蛋白質的抗體或感興趣的修飾是用來免疫沉淀結合的 DNA。自從 35 年 前首次描述芯片以來,芯片通常的表現方式幾乎沒有改變,而且仍然充滿了信號噪聲和人為因素問題。另一種可供選擇的染色質譜分析策略是在原位酶栓( enzyme tethering in situ ),即染色質蛋白或感興趣的修飾被抗體或融合蛋白靶向。然后,潛在的 DNA 被標記或裂解,在過去的二十年里,一系列的 enzyme-tethering 方法被引入。Cleavage Under Targets & Tagmentation (CUT&Tag) 是一種使用 protein-A-Tn5( pA-Tn5 ) 轉座體融合蛋白的連接方法。在 CUT&Tag 中,通透性細胞或細胞核與特定染色質蛋白的抗體孵育,然后負載嵌鑲末端接頭的 pA-Tn5 被連續地連接到抗體結合位點。通過添加鎂離子激活轉座體,導致接頭整合到附近的 DNA。然后這些基因被擴增,生成測序庫。基于 Antibody-tethered Tn5-based 的方法由于 pA-Tn5 系結后嚴格的樣品清洗和接頭連接效率高,因此具有很高的靈敏度。相對于 ChIP-seq 而言,改善的信噪比意味著繪制染色質特征所需的 測序量減少了一個數量級,允許樣本池 (通常高達 90 個樣本) 通過文庫的 條形碼 barcoded PCR 在 Illumina NGS 測序儀上進行配對末端測序。
CUT&Tag目前的價格比較穩定,如果你有數據分析能力,即可自己購買試劑盒建庫,再交由測序公司進行擴增測序,自己再對原始數據進行分析,將會剩下一大筆費用。
CUT-Tag下機數據處理
1.下機數據
CUT-Tag本質上是對轉錄因子所下拉得DNA序列進行二代測序,因此下機數據和轉錄組的所類似為fsatq序列。
2.質量控制
此步和轉錄組一樣,對下機數據進行質量控制
mkdir -p ${projPath}/fastqFileQC/${histName}
$projPath/tools/FastQC/fastqc -o ${projPath}/fastqFileQC/${histName} -f fastq ${projPath}/fastq/${histName}_R1.fastq.gz
$projPath/tools/FastQC/fastqc -o ${projPath}/fastqFileQC/${histName} -f fastq ${projPath}/fastq/${histName}_R2.fastq.gz
3.與參考序列進行對比
本次分析的物種是小鼠,因此首先構建了小鼠的索引。
###===構建小鼠索引===###
wget http://hgdownload.cse.ucsc.edu/goldenPath/mm10/bigZips/chromFa.tar.gz
tar -zxvf chromFa.tar.gz
cat *.fa > mm10.fa
bowtie2-build mm10.fa mm10
###===序列對比===###
bowtie2 --end-to-end --very-sensitive --no-mixed --no-discordant --phred33 -I 10 -X 700 -p 1 -x ref/mm10 -1 1.0_Raw/WTC-FH-1_1.fq.gz -2 1.0_Raw/WTC-FH-1_2.fq.gz -S bowtie2/sam/WTC-FH_bowtie2.sam &> bowtie2/bowtie2_summary/WTC-FH_bowtie2.txt
#Tips:這步比較耗時,因此推薦后臺運行,連接斷開不會影響程序運行。
#后臺運行代
nohup bowtie2 --end-to-end --very-sensitive --no-mixed --no-discordant --phred33 -I 10 -X 700 -p 1 -x ref/mm10 -1 1.0_Raw/WTC-FH-1_1.fq.gz -2 1.0_Raw/WTC-FH-1_2.fq.gz -S bowtie2/sam/WTC-FH_bowtie2.sam &> bowtie2/bowtie2_summary/WTC-FH_bowtie2.txt 2>out2.txt 2>&1 &
4.文件轉化
## 篩選和保留比對上的雙端 reads
samtools view -bS -F 0x04 bowtie2/sam/WTC-ZZQ_bowtie2.sam >bowtie2/bam/WTC-ZZQ_bowtie2.mapped.bam
nohup samtools view -bS -F 0x04 bowtie2/sam/WTC-FH_bowtie2.sam > bowtie2/bam/WTC-FH_bowtie2.mapped.bam 2>bowtie2/bam/bam.output.txt 2>&1 &
## Convert into bed file format
#轉化文件格式
bedtools bamtobed -i $projPath/alignment/bam/${histName}_bowtie2.mapped.bam -bedpe >$projPath/alignment/bed/${histName}_bowtie2.bed
## Keep the read pairs that are on the same chromosome and fragment length less than 1000bp.
#保留那些在同一條染色體且片段長度小于 1000bp 的雙端 reads
awk '$1==$4 && $6-$2 < 1000 {print $0}' $projPath/alignment/bed/${histName}_bowtie2.bed >$projPath/alignment/bed/${histName}_bowtie2.clean.bed
## Only extract the fragment related columns
#只提取與片段相關的列
cut -f 1,2,6 $projPath/alignment/bed/${histName}_bowtie2.clean.bed | sort -k1,1 -k2,2n -k3,3n >$projPath/alignment/bed/${histName}_bowtie2.fragments.bed
5.生成bigwig文件
生成的bigwig文件可在IGV軟件上進行查看,如圖所示:
mkdir -p $projPath/alignment/bigwig
samtools sort -o bowtie2/bam/WTC-ZZQ_bowtie2.sorted.bam bowtie2/bam/WTC-ZZQ_bowtie2.mapped.bam
samtools index bowtie2/bam/WTC-ZZQ_bowtie2.sorted.bam
bamCoverage -b bowtie2/bam/WTC-ZZQ_bowtie2.sorted.bam -o bowtie2/bigwig/WTC-ZZQ_raw.bw
因本次實驗僅僅是一個預實驗,沒有設置重復,也沒有進行其他的分析,只是初步的看下實驗和對照有無差異。如果想進行完整的CUT-Tag分析,可以通過其官網上進行學習(PS:學習任何一種技術,最便捷的方法就是通過其官網進行學習)