hifiasm組裝

參考hifiasm網頁代碼: https://github.com/chhylp123/hifiasm
ssh 進入一個登錄節點
從subreads 里提取hifi數據 利用ccs軟件

ccs m64033_210412_083226.subreads.bam m64033_210412_083226.ccs.bam
ccs m64083_210501_064735.subreads.bam m64083_210501_064735.ccs.bam

數據壓縮、合并

gzip m64033_210412_083226.ccs.fastq m64083_210501_064735.ccs.fastq
cat  m64033_210412_083226.ccs.fastq.gz  m64083_210501_064735.ccs.fastq.gz > GX.HiFi.fq.gz

運行hifiasm

hifiasm -o test -t32 -f0 GX.HiFi.fq.gz 2 > test.log

-o:定義輸出文件的文件名前綴, -t:線程數

get primary contigs in FASTA
提取數據

awk '/^S/{print ">"$2;print $3}'  GX.HiFi.fq.gz > test.p_ctg.fa  

下載fasta文件 test.p_ctg.fa 與基因組文件比對

homozygous genomes
Assemble inbred/homozygous genomes (-l0 disables duplication purging)
hifiasm -o CHM13.asm -t32 -l0 CHM13-HiFi.fa.gz 2> CHM13.asm.log

一般用:f0參數
基因型是雜合的時候參數:l0

minimap比對

參考:[GitHub - lh3/minimap2: A versatile pairwise aligner for genomic and sload/v2.24/minimap2-2.24_x64-linux.tar.bz2 | tar -jxvf -
./minimap2-2.24_x64-linux/minimap2
方法1
(1):index

minimap2 -d ref.mmi R64.fna         

-d FILE: dump index to FILE []
生成索引文件ref.mmi
(2)alignment

nohup minimap2 -a ref.mmi ~/WGS/SY14/pacbio/fastq1/SRR6823435.fastq.gz > alignment1.sam 

在minimap2命令行中用索引文件替換引用序列文件
方法2

nohup minimap2 -ax map-pb R64.fna ~/WGS/SY14/pacbio/fastq1/SRR6823435.fastq.gz > alignment2.sam 

參數設置:
-a: output in the SAM format (PAF by default)
-x STR: preset (always applied before other options; see minimap2.1 for details) []
- map-pb/map-ont - PacBio CLR/Nanopore vs reference mapping
- map-hifi - PacBio HiFi reads vs reference mapping

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容