歡迎關注公眾號:oddxix
自從二代測序技術出現,把一次實驗測許多條DNA序列的這個難題解決之后,一次把一個人的全基因組給測出來,最極限的情況,就是樣本量就是少到一個細胞,就要測出整個基因組的序列信息。
三個難題
要實現從一個細胞樣本測出全基因組的DNA序列,至少要克服以下3個難題:
第1個難題,就是如何實現均勻擴增,用傳統的隨機引物PCR的方法來擴增不同擴增片段的擴增效率多少會有一些差異,這些擴增效率的差異會隨著擴增循環數的增加,呈現出指數放大的效果。其結果就是會發生嚴重的覆蓋不均一,極少數區段的DNA被大量擴增,測序后它深度非常深,但在大多數區段只有很低的覆蓋,甚至沒有覆蓋。那么我們就無法有效地判斷那些低擴增效率區段的基因序列的情況。
第2個難題,就是 全基因組覆蓋問題。常規的、用大量DNA進行建庫的方法,因為打斷、補平、加A、加接頭等一長串的操作,每一步都會有DNA片段的損失。結果就是初始DNA中很大一部分會被浪費掉,而沒有形成有效的文庫分子。
在單細胞測序中,丟失大部分的起始DNA,是不可接受的。單細胞測序要求幾乎所有的原始基因組片段都得到擴增,并且在后續的測序過程中被測序測到。這就要求幾乎所有的片段,都會被得到擴增,而不只是少數片段得到有效擴增。
- 第3個難題,是這種方法要有較高的擴增效率。建好的文庫,在HiSeq測序儀上機的時侯,大約每上機2萬個文庫分子,只有1個文庫分子,是能夠在測序的Flowcell表面生成簇,并且被測序測到的,剩下的大多數文庫分子,在上機的時侯是被水沖走的。所以,單細胞基因組擴增的方法,還要有較高的擴增效率。至少要有上萬倍到幾十萬倍的擴增效率,才能保證在全基因組測序的時侯,大部分的片段都被測序測到。
兩種方法
為了解決上述的難題,科學家想了許多的辦法。到目前為止,大家比較認可的方法有兩種:第一種是MALBAC方法。第二種是MDA方法。
- MALBAC方法
我們先來說這個MALBAC方法。它的全稱是:MultipleAnnealing and Looping-Based Amplification Cycles。是謝曉亮教授發明的方法
這張圖是MALBAC方法的示意圖。這個黑色的線條,就是基因組模板DNA,這些紅顏色的線條就是擴增引物,擴增引物的5’端有27個堿基的通用序列,這些通用序列會作為未來的PCR通用擴增引物的結合序列。擴增引物的3’端有8個隨機序列的堿基,這8個堿基可以隨機地雜交到基因組DNA的互補序列上。
這些灰色的橢園是Phi 29 DNA聚合酶,Phi 29 DNA聚合酶有一個特點,它不僅可以生成新的DNA鏈,它還能把之前已經合成好的DNA鏈給解鏈開。
再形成自己的新鏈,這個特點能夠把每個循環所能合成的DNA新鏈的數量提高幾倍、甚至幾十倍、上百倍。接下來,就是做5個MALBAC循環,請注意,這里每個循環的最后一步是58度退火。我們后面要詳細解釋這一步58度退火的作用。
第一個循環下來,得到的是一批5’端有通用擴增序列的DNA片段。
在第二個循環完成后,所產生的擴增產物中,大部分是5’端有通用序列。而3’端,有與通用序列互補的序列的這些片段。
圖中的這4個步驟,一共重復5次,這樣做的巧妙之處,就是要解決我們剛才所說的3個難題。
第一、是要均勻擴增
第二、是要全基因組覆蓋
第三、是要有高的擴增效率
這個MALBAC方法的巧妙之處,就是在每個循環的最后,加了一步58度退火,這一退火過程,它讓完整擴增的產物,它的兩端發生鏈內雜交。這樣,3’端的序列就不能與新的、游離的引物發生雜交。這也就不會引新的、發起始于3’端的擴增,這樣,就避免了完整擴整的產物的自我指數擴增。
現在,還是8個隨機序列的引物在模板上隨機地找結合位置,所有的位點都有一樣的機會被擴增。那么,這樣實際得到的產物分2種:
第1種,就是m* n 個“完整擴增產物”,這是最主要的產物。這里“m”就是循環的次數, “n”是一個循環中,有多少個擴增,引物可以粘到一個模板上。
第2種擴增產物,就是(m+1)* n個“半擴增產物”,第3種DNA,就是那個原始的DNA模板,這里完整產物的數量是“m*n ”,也就是說,擴增產物(的數量)與擴增的循環次數“m”成正比,而不是與m的平方成正比。更不是與2 的M次方成正比。
這也就是達到了,我們想要的“線性擴增”的目的。也就是說擴增產物(的數量)與擴增的次數成線性關系。這就達成了我們單細胞測序當中第1個要求“線性擴增”。
再利用Phi 29聚合酶的能一次在模板上聚合出多個新鏈的功能來解決“全基因組覆蓋”。
在5輪的擴增之后,每個模板都會有5*n^2個擴增片段。這樣,就可以保證建庫時大多數的基因組區域可以被建成文庫,最后,可以被(測序)測到。
第3個要解決“高效率擴增”。還是利用了這個Phi 29酶的一次得到多個擴增片段的這個效果,來達成的。
上面所說的,就是MALBAC單細胞擴增技術的基本原理、和它的巧妙之處.
- MDA方法
目前市場上還有一種單細胞的擴增技術,叫MDA擴增技術。它的全稱是MultipleDisplacement Amplification。MDA方法的技術核心是用Phi 29 DNA聚合酶來進行直接的擴增。
Phi 29酶的特點是,它可以把雙鏈DNA進行解鏈,然后,在常溫條件下,就把原始模板進行大量擴增。
- 兩種方法的比較
把MDA和MALBAC兩種方法進行比較
MDA的優勢在于,它的擴增效率更高,并且,實驗方法更簡單。
MALBAC方法的特點,在于它的擴增均一性更好。但是,它得到的擴增DNA量相對較少,或者說,它的擴增效率相對比較低。
這張圖是:大量細胞測序、MDA方法測序、MALBAC方法測序,這三種測序結果的Lorenz曲線。Lorenz曲線是越接近于對角線,則覆蓋越均一,從圖中,我們可以看出大量細胞測序,它的均一性是最好的。用MALBAC方法測序,它的均一性比大量細胞測序的均一性要差一些,但是要比MDA的方法的均一度要好。
這張圖是用三種方法來測腫瘤細胞中的拷貝數變異。其中橫軸是染色體的序列,縱軸是測序的覆蓋深度,可以明顯地看到,在大量細胞測序的結果中,可以非常直觀地看到拷貝數變異的情況。
而用MALBAC的方法,也還是能夠比較清楚地看到拷貝數變異。但是,它沒有大量細胞測序的結果那么清楚。而用MDA的方法來看拷貝數變異,則不是那么容易看清楚。
- 臨床應用
單細胞測序,有著廣泛的應用前景。目前最主要2個應用:
1.是在胚胎植入前進行基因拷貝數變異檢測。
2.是進行腫瘤的染色體變異研究。
在這里我們介紹一下,單細胞測序在胚胎植入前檢測中的應用,在有習慣性流產的夫婦當中,最常見的病因就是染色體的平衡易位,所謂染色體平衡易位,也就是A染色體,的一段移到了B染色體上。
如果夫妻一方有染色體平衡易位,那么這對夫婦的受精卵中,每4個受精卵,可能只有1個是正常的。剩下3個(不正常的受精卵),很可能會流產。要把這一個正常的受精卵挑出來,目前,最有效的解決手段是做受精卵植入前檢測。
那么具體的操作方法,就是先做人工受精。在受精卵發育到8個細胞的時侯,通過顯微操作,抓一個細胞出來進行測序。在這個測序過程當中,就要用到MDA方法或MALBAC方法進行擴增、建庫、測序。然后測序完成之后,挑出那個好的受精卵,植回到母親的子宮中去。長成一個正常的新生兒。這個,就是受精卵植入前基因檢測。這項技術,是對生殖健康有很大幫助的一項新技術。
歡迎關注oddxix
有趣的靈魂等著你~