#從ncbi下載數(shù)據(jù),GEO-GEO號/SRA-SRA號/SRA-SRP號,找到最終的SRP號,
#在搜索界面send to file:Runinfo,內(nèi)含https下載鏈接
#或send to file:accession list,記下每一行值,補全鏈接為:
#ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR(前三位)/SRR(全名)/SRR(全名).sra
#下載目前使用idm和迅雷下載,prefetch下載太慢,ascp又不能用,后拷貝至分析端
0.環(huán)境準備(針對win10 ubuntu子系統(tǒng))
#linux清密碼
#apt換源(清華源)
#sudo apt-get update
#sudo apt-get upgrade
#安裝圖形界面(不裝fastqc老是報錯)
#安裝中文語言包(隨意)
#安裝miniconda3,手動激活環(huán)境變量,更換源,更換python版本為3.6(3.7版有個東西用不了,啥東西暫時忘了)
#apt裝fastqc,bwa,samtools,bamtools,trimmomatic,tree,pandoc,unzip,axel,aria2(zsh,oh-my-zsh)
#conda裝sra-tools,multiqc,bowtie2
#手動安裝aspera
1. sra轉(zhuǎn)為fastq
fasterq-dump -3 -e 8 -p -o 輸出路徑 sra文件
#(-e 指定線程數(shù),-3<=>--split-3,-p 嘮叨模式)
rename 's/.sra//' 輸入文件(去除文件名中的.sra)
2.質(zhì)檢
#將所有的數(shù)據(jù)進行質(zhì)控,得到zip的壓縮文件和html文件
fastqc -o 輸出路徑 -t 8 fastq文件1 fastq文件2 ... fastq文件n(-t 指定線程數(shù))
multiqc -t default -o 輸出路徑 -f 輸入路徑(-t 輸出格式為默認)
3.比對
bowtie2 --local?-3 整型-5 整型 -p 6 -x index位置 -U fastq文件 | samtools sort -o 輸出的排過序的bam文件路徑及名稱
# --local表示使用local模式,在這種模式下,Bowtie2不要求整個讀取從一端到另一端對齊。相反,為了達到最大可能的對齊分數(shù),可以從末端省略一些字符(“軟裁剪”)
#(-p 指定線程數(shù), -U 表示單端測序,-3或-5 表示從3‘端或5端’某個堿基位置開始修剪)?
4.peak calling
macs callpeak -c 對照的bam文件 -t 實驗的bam文件 -q 0.05 -f BAM -g mm -n suz12
#(-q FDR值,-f 輸入文件格式,-g 基因組類別,-n 輸出文件的前綴名)
#narrowPeak結(jié)尾的文件可導入進行分析