本期內容為[跟著NC做基因組數據分析],這是你需要的教程,對你一定有幫助。
前言
今天花費找文章,看到一篇關于基因組,組裝的文章,主要是里面的圖吸引了我的關注。后面仔細一看,作者竟然提供了分析的代碼流程,還是比較詳細的。提供的代碼,基本是可以滿足大部分初學者的需求,作為初學者的你還不仔細看看呢??
原文
--
詳細代碼:
僅比對的流程就有6個,包括有參、無參比對
1-Genome analysis
Hista-samtools 流程
#!/bin/bash
genome=$1
index=${genome%.*}
rna_1_fq=`cat $2|grep 1P|sed ":a;N;s/\n/,/g;ta"` #1.fq path list
rna_2_fq=`cat $2|grep 2P|sed ":a;N;s/\n/,/g;ta"` #2.fq path list
#echo $index
hisat2-build -p 20 $genome $index
hisat2 -x $index \
-1 $rna_1_fq\
-2 $rna_2_fq\
--threads 20 \
--min-intronlen 20 \
--max-intronlen 20000 \
--dta \
--score-min L,0.0,-0.4 \
-S ${index}.sam
samtools sort -@ 20 \
-o ${index}.sorted.bam \
-O BAM \
${index}.sam
Trinty Denovo流程
#!/bin/bash
#conda activate trinity
export PATH="$PATH:/usr_storage/jcf/.conda/envs/trinity"
rna_1_fq="cat $1|sed ":a;N;s/\n/,/g;ta"" #1.fq path list
rna_2_fq="cat $2|sed ":a;N;s/\n/,/g;ta"" #2.fq path list
bam="$3" #sorted.bam from hisat
out=${bam%.*}
Trinity --left $rna_1_fq \
--right $rna_2_fq \
--seqType fq \
--max_memory 100G \
--no_normalize_reads \
--CPU 20 \
--bflyCalculateCPU \
--output trinity_denovo_$out
Trinity --genome_guided_bam $bam \
--genome_guided_max_intron 10000 \
--max_memory 100G \
--no_normalize_reads \
--CPU 20 \
--bflyCalculateCPU\
--output trinity_GG_$out
--
此外,還有Indel、SNP和SV的分析。
...........................
...........................
...........................
干活滿滿,就看你自己如何來學習。
--
獲得代碼,請回復正確的關鍵詞!!
--
歡迎大家關注我的公眾號!!
小杜的生信筆記 ,主要發表或收錄生物信息學的教程,以及基于R的分析和可視化(包括數據分析,圖形繪制等);分享感興趣的文獻和學習資料!