前言:nanopolish是開源的綜合性分析軟件,集成了非常多的三代測序數據分析小工具。
1.軟件安裝:
通過Github源碼安裝:
git clone --recursive https://github.com/jts/nanopolish.git
cd nanopolish
make
或者,通過conda安裝:
conda install nanopolish
2.主要功能:
call-methylation:識別甲基化信號
eventalign:序列比對
extract:堿基識別
index:建立索引
phase-reads:相位分析,定位序列來自二倍體父本還是母本
polya:估計RNA直接測序polyA尾巴長度
variants:檢測SNP等突變
vcf2fasta:生成一致性序列
3.使用方法
首先,下載測試數據
wget http://s3.climb.ac.uk/nanopolish_tutorial/methylation_example.tar.gz
tar -xvf methylation_example.tar.gz
cd methylation_example
構建索引
nanopolish index -d fast5_files/ output.fastq
與參考基因組比對
minimap2 -a -x map-ont reference.fasta output.fastq | samtools sort -T tmp -o output.sorted.bam
samtools index output.sorted.bam
利用nanopolish檢測甲基化位點
nanopolish call-methylation -t 8 -r output.fastq -b output.sorted.bam -g reference.fasta -w "chr20:5,000,000-10,000,000" > methylation_calls.tsv
對結果進行過濾
scripts/calculate_methylation_frequency.py methylation_calls.tsv > methylation_frequency.tsv