【fastqe】有趣的表情包版fastqc

img

FASTQ with Emoji = FASTQE ??

表情版的FASTQC,適用于Illumina 1.8+/Sanger format

img

使用

安裝 使用conda 或者pip

$ pip install fastqe

$ conda install -c bioconda fastqe

測試數據下載

$ wget https://zenodo.org/record/3977236/files/female_oral2.fastq-4143.gz

默認是給出平均值,計算fastq文件中的序列最大值和最小值,需要加參數--max,--min

$ fastqe female_oral2.fastq-4143.gz --max --min

輸出
[圖片上傳失敗...(image-a004b-1642129204222)]

我們知道fastq文件中質量值以ASCII字符來表示,fastqe 運行時,加上--scale參數,會給出每個表情對應的ascii字符。

#scale for fastqe
#  0 ! ??
#  1 " ?
#  2 # ??
#  3 $ ??
#  4 % ??
#  5 & ??
#  6 ' ??
#  7 ( ??
#  8 ) ??
#  9 * ??
#  10 + ??
#  11 , ??
#  12 - ??
#  13 . ??
#  14 / ??
#  15 0 ??
#  16 1 ??
#  17 2 ??
#  18 3 ??
#  19 4 ??
#  20 5 ??
#  21 6 ??
#  22 7 ??
#  23 8 ??
#  24 9 ??
#  25 : ??
#  26 ; ??
#  27 < ??
#  28 = ??
#  29 > ??
#  30 ? ??
#  31 @ ??
#  32 A ??
#  33 B ??
#  34 C ??
#  35 D ??
#  36 E ??
#  37 F ??
#  38 G ??
#  39 H ??
#  40 I ??
#  41 J ??

若我們只是簡單關心下序列質量好壞程度得一個范圍,我么可以用--bin參數。它將一個范圍內的質量值以一個表情來表示

$ fastqe female_oral2.fastq-4143.gz --min --max --scale --bin
#scale for fastqe
#  0 ! ??
#  1 " ??
#  2 # ??
#  3 $ ??
#  4 % ??
#  5 & ??
#  6 ' ??
#  7 ( ??
#  8 ) ??
#  9 * ??
#  10 + ??
#  11 , ??
#  12 - ??
#  13 . ??
#  14 / ??
#  15 0 ??
#  16 1 ??
#  17 2 ??
#  18 3 ??
#  19 4 ??
#  20 5 ??
#  21 6 ??
#  22 7 ??
#  23 8 ??
#  24 9 ??
#  25 : ??
#  26 ; ??
#  27 < ??
#  28 = ??
#  29 > ??
#  30 ? ??
#  31 @ ??
#  32 A ??
#  33 B ??
#  34 C ??
#  35 D ??
#  36 E ??
#  37 F ??
#  38 G ??
#  39 H ??
#  40 I ??
#  41 J ??

[圖片上傳失敗...(image-ba505c-1642129204222)]
看,平均值,序列數據有一半是警告或者狗屎。。。

biomojify

將你的序列數據以Emoji來展示,

安裝也是pip

$ pip install biomojify

將DNA ATCG序列 轉為 ????????:


img

fastq數據也可以轉

$ zcat female_oral2.fastq-4143.gz | head -n 4 > test.fq

[圖片上傳失敗...(image-bead3b-1642129204222)]

查看其幫助文檔, 蛋白質序列,vcf也可以轉

$ biomojify -h
usage: biomojify [-h] [--version] [--log LOG_FILE] {fasta,fasta_protein,fastq,vcf} ...

Read one or more FASTA or FASTQ files, and convert them to emoji.??

positional arguments:
  {fasta,fasta_protein,fastq,vcf}
                        sub-command help
    fasta               fasta --help
    fasta_protein       fasta_protein --help
    fastq               fastq --help
    vcf                 vcf --help

optional arguments:
  -h, --help            show this help message and exit
  --version             show program's version number and exit
  --log LOG_FILE        record program progress in LOG_FILE

參考

https://github.com/fastqe/biomojify
https://fastqe.com/

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容