bismark 識別甲基化位點-比對篇

bismark ?軟件根據序列的比對情況就可以識別甲基化位點,首先需要對基因組建立索引,建好索引之后,就可以開始比對了。

我用的軟件自帶的單端測序的數據集進行測試, 命令如下

bismark hg19_bismark_db/ ?test_data.fastq -o test

第一個參數為bismark_genome_preparation命令構建的基因組索引所在的目錄,第二個參數為需要比對的序列, -o參數指定輸出的目錄

bismark的參數很多,通常情況下,采用默認參數就好。其他參數全部默認的情況下:bismark 比對的過程分為以下幾步:

1 . 將輸入序列進行C->T的轉換

軟件在運行過程中的log信息如下:

Input file is in FastQ format
Writing a C -> T converted version of the input file test_data.fastq to test_data.fastq_C_to_T.fastq
Created C -> T converted version of the FastQ file test_data.fastq (10000 sequences in total)
Input file is test_data.fastq_C_to_T.fastq (FastQ)

2 . 將C-> 轉換好的序列分別與 C->T 轉換的基因組和G->A 轉換的基因組進行比對

Now starting the Bowtie 2 aligner for CTreadCTgenome
Using Bowtie 2 index: hg19_bismark_db/CT_conversion/BS_CT
Using Bowtie 2 index: hg19_bismark_db/GA_conversion/BS_GA

我用的是 1.9.0 版本的bismark, 現在絕大多數的BS-seq的文庫構建都是采用illumina提供的的標準protocol, 構建出來的文庫都是鏈特異性的文庫,所以從0.7.0版本之后的bismark, 默認只做兩次比對,但是這個默認情況只適合鏈特異性文庫,如果你的文庫不是鏈特異性的,那么就需要添加--non_directional選項。

何為鏈特異性文庫,就是說鏈是由方向性的。對于普通的文庫,測序的插入片段都是雙鏈,但是鏈特異性文庫是單鏈。通過在反向互補時添加特定的標記,在雙鏈合成后,將第二條鏈去除,最后用于測序的就只有一條鏈了。如果一個甲基化位點發生在基因組的正鏈上,那么這段區域在測序時插入序列就只有正鏈上的序列,如果發生在負鏈上,則只有負鏈作為插入序列。

bismark中,將基因組的正鏈定義為top strand , 簡稱OT, 負鏈定義為bottom strand, 簡稱OB; 亞硫酸氫鹽處理后,正負鏈之間并不是完全的反向互補的,將OT鏈的反向互補鏈定義為CTOT, 將OB鏈的反向互補鏈定義為CTOB

對于鏈特異性文庫而言,由于插入序列為單鏈,只需要比對OTOB兩條鏈即可,大大減少了運算量,所以目前illumina的標準BS-seq protocol構建的文庫都是鏈特異性文庫,新版的bismark默認的運行方式也是針對鏈特異性文庫的。

放一張bismark的原理圖:

圖中展示了bismark比對的過程, 包括了原始序列轉換和比對兩個過程:
原始序列轉換包括兩種方式:

  1. C->T 的轉換

  2. G->A 的轉換


比對也包括兩種基因組:

  1. C->T 轉換的基因組

  2. G->A 轉換的基因組


所以每條reads 最多會有 2 X 2 = 4 種比對情況,對于鏈特異性的文庫,只有C->T ?轉換,所以只有2種比對情況。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 參考學習《R語言與Bioconductor生物信息學應用》第六章 前言 Y叔的公眾號biobabble發過一篇【聽...
    王詩翔閱讀 13,759評論 0 49
  • tags: Trimmomatic NGS fastq NGS 原始數據過濾對后續分析至關重要,去除一些無用的序列...
    wangpeng905閱讀 100,528評論 27 198
  • 第十章 使用序列數據 生物信息學的核心問題之一是處理大量的(通常定義糟糕或模糊)文件格式。久而久之,一些特定的簡單...
    yangliunk1987閱讀 5,083評論 3 53
  • 我和沈熹趁著中秋放假去了一趟北京。他家司機開車送我們去的省城,然后去機場坐飛機。 那是我第一次坐飛機,卻不是我第一...
    廣電1701B梁賽賽閱讀 400評論 0 0
  • 這幾年,大家越來越喜歡回憶青春了。尤其到了六七月份,一批人高考了,一批人畢業了,剩下一批人就開始集體回憶了。我雖然...
    姜三瘋閱讀 453評論 0 51