img
FASTQ with Emoji = FASTQE ??
表情版的FASTQC,適用于Illumina 1.8+/Sanger format
img
使用
安裝 使用conda 或者pip
$ pip install fastqe
$ conda install -c bioconda fastqe
測試數據下載
$ wget https://zenodo.org/record/3977236/files/female_oral2.fastq-4143.gz
默認是給出平均值,計算fastq文件中的序列最大值和最小值,需要加參數--max,--min
$ fastqe female_oral2.fastq-4143.gz --max --min
輸出
[圖片上傳失敗...(image-a004b-1642129204222)]
我們知道fastq文件中質量值以ASCII字符來表示,fastqe 運行時,加上--scale參數,會給出每個表情對應的ascii字符。
#scale for fastqe
# 0 ! ??
# 1 " ?
# 2 # ??
# 3 $ ??
# 4 % ??
# 5 & ??
# 6 ' ??
# 7 ( ??
# 8 ) ??
# 9 * ??
# 10 + ??
# 11 , ??
# 12 - ??
# 13 . ??
# 14 / ??
# 15 0 ??
# 16 1 ??
# 17 2 ??
# 18 3 ??
# 19 4 ??
# 20 5 ??
# 21 6 ??
# 22 7 ??
# 23 8 ??
# 24 9 ??
# 25 : ??
# 26 ; ??
# 27 < ??
# 28 = ??
# 29 > ??
# 30 ? ??
# 31 @ ??
# 32 A ??
# 33 B ??
# 34 C ??
# 35 D ??
# 36 E ??
# 37 F ??
# 38 G ??
# 39 H ??
# 40 I ??
# 41 J ??
若我們只是簡單關心下序列質量好壞程度得一個范圍,我么可以用--bin參數。它將一個范圍內的質量值以一個表情來表示
$ fastqe female_oral2.fastq-4143.gz --min --max --scale --bin
#scale for fastqe
# 0 ! ??
# 1 " ??
# 2 # ??
# 3 $ ??
# 4 % ??
# 5 & ??
# 6 ' ??
# 7 ( ??
# 8 ) ??
# 9 * ??
# 10 + ??
# 11 , ??
# 12 - ??
# 13 . ??
# 14 / ??
# 15 0 ??
# 16 1 ??
# 17 2 ??
# 18 3 ??
# 19 4 ??
# 20 5 ??
# 21 6 ??
# 22 7 ??
# 23 8 ??
# 24 9 ??
# 25 : ??
# 26 ; ??
# 27 < ??
# 28 = ??
# 29 > ??
# 30 ? ??
# 31 @ ??
# 32 A ??
# 33 B ??
# 34 C ??
# 35 D ??
# 36 E ??
# 37 F ??
# 38 G ??
# 39 H ??
# 40 I ??
# 41 J ??
[圖片上傳失敗...(image-ba505c-1642129204222)]
看,平均值,序列數據有一半是警告或者狗屎。。。
biomojify
將你的序列數據以Emoji來展示,
安裝也是pip
$ pip install biomojify
將DNA ATCG序列 轉為 ????????:
img
fastq數據也可以轉
$ zcat female_oral2.fastq-4143.gz | head -n 4 > test.fq
[圖片上傳失敗...(image-bead3b-1642129204222)]
查看其幫助文檔, 蛋白質序列,vcf也可以轉
$ biomojify -h
usage: biomojify [-h] [--version] [--log LOG_FILE] {fasta,fasta_protein,fastq,vcf} ...
Read one or more FASTA or FASTQ files, and convert them to emoji.??
positional arguments:
{fasta,fasta_protein,fastq,vcf}
sub-command help
fasta fasta --help
fasta_protein fasta_protein --help
fastq fastq --help
vcf vcf --help
optional arguments:
-h, --help show this help message and exit
--version show program's version number and exit
--log LOG_FILE record program progress in LOG_FILE