ChIP-Seq

#從ncbi下載數(shù)據(jù),GEO-GEO號/SRA-SRA號/SRA-SRP號,找到最終的SRP號,

#在搜索界面send to file:Runinfo,內(nèi)含https下載鏈接

#或send to file:accession list,記下每一行值,補全鏈接為:

#ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR(前三位)/SRR(全名)/SRR(全名).sra

#下載目前使用idm和迅雷下載,prefetch下載太慢,ascp又不能用,后拷貝至分析端


0.環(huán)境準備(針對win10 ubuntu子系統(tǒng))

#linux清密碼

#apt換源(清華源)

#sudo apt-get update

#sudo apt-get upgrade

#安裝圖形界面(不裝fastqc老是報錯)

#安裝中文語言包(隨意)

#安裝miniconda3,手動激活環(huán)境變量,更換源,更換python版本為3.6(3.7版有個東西用不了,啥東西暫時忘了)

#apt裝fastqc,bwa,samtools,bamtools,trimmomatic,tree,pandoc,unzip,axel,aria2(zsh,oh-my-zsh)

#conda裝sra-tools,multiqc,bowtie2

#手動安裝aspera


1. sra轉(zhuǎn)為fastq

fasterq-dump -3 -e 8 -p -o 輸出路徑 sra文件

#(-e 指定線程數(shù),-3<=>--split-3,-p 嘮叨模式)

rename 's/.sra//' 輸入文件(去除文件名中的.sra)


2.質(zhì)檢

#將所有的數(shù)據(jù)進行質(zhì)控,得到zip的壓縮文件和html文件

fastqc -o 輸出路徑 -t 8 fastq文件1 fastq文件2 ... fastq文件n(-t 指定線程數(shù))

multiqc -t default -o 輸出路徑 -f 輸入路徑(-t 輸出格式為默認)


3.比對

bowtie2 --local?-3 整型-5 整型 -p 6 -x index位置 -U fastq文件 | samtools sort -o 輸出的排過序的bam文件路徑及名稱

# --local表示使用local模式,在這種模式下,Bowtie2不要求整個讀取從一端到另一端對齊。相反,為了達到最大可能的對齊分數(shù),可以從末端省略一些字符(“軟裁剪”)

#(-p 指定線程數(shù), -U 表示單端測序,-3或-5 表示從3‘端或5端’某個堿基位置開始修剪)?


4.peak calling

macs callpeak -c 對照的bam文件 -t 實驗的bam文件 -q 0.05 -f BAM -g mm -n suz12

#(-q FDR值,-f 輸入文件格式,-g 基因組類別,-n 輸出文件的前綴名)

#narrowPeak結(jié)尾的文件可導入進行分析

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容