二代測序原理(Illumina)

雖然三代測序現(xiàn)在已經(jīng)商用,但是目前的主流還是二代測序,尤其是Illumina公司的測序方式更是大行其道。那么,下面我們從四個方面來說說illumina家的二代測序是怎么得到的生物數(shù)據(jù)。

0、 基本原理

基于可逆終止的,熒光標(biāo)記dNTP,做邊合成邊測序
分為三步:

  • 樣本準(zhǔn)備 Sample Prep
  • 成簇 Cluster Generation
  • 測序 Sequencing
  • 數(shù)據(jù)分析 Data Analysis

1、樣本準(zhǔn)備 Sample Prep

通過不同實驗方法得到的樣品,需要先提取樣本基因組中的DNA,用超聲波將其隨機打斷。然后使用酶將兩端補平,使用 Klenow 酶在3‘ 端加一個 A 堿基(用于連接接頭序列)。為了后續(xù)擴增,測序分析,需要為這些DNA片段添加特定的接頭序列。接頭序列是已知的,大概有三種:

mark
  • sequencing binding site(綠)
  • index(紅,黃)
  • 流動池引物互補的序列(藍(lán),紫)

添加完接頭序列后的DNA片段集合叫DNA文庫 (DNA library),這樣就完成了樣品準(zhǔn)備工作。

2、成簇 Cluster Generation

成簇是DNA片段被擴增的過程,該過程在流動池 (Flowcell) 中完成。它是一片帶有8條通道(lanes)的玻璃載玻,每個通道內(nèi)表面附有兩種DNA引物。

mark

首先,引物會與樣品中的DNA片段的接頭序列互補配對,固定在通道表面

mark

通過聚合酶生成雜交片段的互補片段,然后加入NaOH堿溶液后,雙鏈分子變性,原始模板鏈(左邊的鏈)被流動池中的液體洗去

mark

加入中性液體用于中和堿溶液,剩下的單鏈拷貝鏈另一端的接頭就會與通道表面的引物結(jié)合,形成單鏈橋。

mark

同樣的,在聚合酶參與下,生成互補鏈,最終形成雙鏈橋

mark

通過變性,DNA分子線性化,變?yōu)閮蓚€單鏈拷貝

mark

它們又分別與自己配對的引物結(jié)合

mark

重復(fù)這個循環(huán),同時形成數(shù)百萬的簇。在這個過程中,所有的DNA片段都會被克隆擴增。

mark

橋式擴增后,反向鏈會被切斷洗去,僅留下正向鏈。為防止特異性結(jié)合重新形成單鏈橋,3‘端被封鎖

mark

3、測序 Sequencing

首先,在Flowcell中加入熒光標(biāo)記的dNTP和酶,由引物起始開始合成子鏈。但是dNTP存在 3’端疊氮基會阻礙子鏈延伸,這使得每個循環(huán)只能測得一個堿基。合成完一個堿基后, Flowcell 通入液體洗掉多余的dNTP和酶,使用顯微鏡的激光掃描特征熒光信號。

mark

熒光發(fā)射波長與信號強度一起決定了堿基的讀出,所有的DNA片段的一個堿基會被同時讀取。在大規(guī)模并行的過程中,機器讀取的圖像類似下面這樣

mark

加入化學(xué)試劑將疊氮基團與熒光基團切除,然后 Flowcell 再通入熒光標(biāo)記的dNTP和酶,由引物起始開始合成一個堿基。不斷重復(fù)這個過程,完成第一次讀取。

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-0jKF4uPB-1570876048855)(C:\Users\ADMINI~1\AppData\Local\Temp\1545892612561.png)]

由于測序儀每次測序時的通量比較大,所以每次測得的序列可能不止一個樣本。為了去區(qū)分每個樣本及正負(fù)鏈,科學(xué)家構(gòu)建DNA文庫時,在接頭序列加入了的不同 index(或 barcode)來區(qū)分來源。

首先,在完成第一次讀取后,復(fù)制出的鏈會被洗去

mark

index 片段引物被引入并與模板雜交,完成序列讀取后被洗去。這樣讀取到的序列與開始時已知的index比對后就可以給測得的序列貼上標(biāo)簽,方便后續(xù)分析。

mark

Paired-end測序已經(jīng)是現(xiàn)在的主流,它提高了測序長度的同時,又可以為結(jié)構(gòu)變異分析提供新方法。要完成雙末端測序,首先要將模板鏈3’去保護,模板折疊,index片段引入

mark

在聚合酶參與下形成雙鏈橋

mark

然后變性,恢復(fù)為單鏈。注意,這次是將正向鏈切除并洗去,只留下反向鏈

mark

反向鏈以測序引物為起始,與正向鏈類似,經(jīng)過多個循環(huán)后完成讀取。

mark

數(shù)據(jù)分析 Data Analysis

測序完成后會產(chǎn)生數(shù)百萬個 reads,基于在樣品準(zhǔn)備時構(gòu)建的 index 分類來自不同樣本的序列。對于每個樣品來說,具有相似延伸的堿基被聚在一起。正向和反向read配對生成連續(xù)序列。這些序列通過與參考基因組匹配后,實現(xiàn)完整序列的構(gòu)建。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容