近日在 Archives of Pathology & Laboratory Medicine 雜志上發(fā)表了一篇題為Review of Clinical Next-Generation Sequencing(PMID: 28782984),關(guān)于二代測(cè)序在臨床應(yīng)用上的綜述文章。作為一名基因檢測(cè)從業(yè)人員,本人認(rèn)為這是一篇非常專(zhuān)業(yè)、客觀、系統(tǒng)的二代測(cè)序技術(shù)介紹,在這里為大家分享一點(diǎn)體會(huì)。新手上路,請(qǐng)大家多多包涵。本文對(duì)文章前半部分關(guān)于wetlab進(jìn)行摘譯與總結(jié),附個(gè)人觀點(diǎn)。
現(xiàn)在二代測(cè)序已經(jīng)普遍應(yīng)用在遺傳病檢測(cè)與腫瘤變異檢測(cè),但是相對(duì)其他臨床檢測(cè)技術(shù)的發(fā)展歷程二代測(cè)序是在臨床領(lǐng)域中算是非常新的一個(gè)技術(shù),許多臨床檢測(cè)從業(yè)者對(duì)二代測(cè)序的應(yīng)用場(chǎng)景,檢測(cè)技術(shù)方案,以及適用邊界不是很熟悉。這篇文章的作者所在的明尼蘇達(dá)大學(xué)最早在2012年就開(kāi)始使用568基因的panel作為遺傳病研究,并在2014年增加到2484基因的大panel,并且在同年開(kāi)始提供針對(duì)21個(gè)基因的熱點(diǎn)區(qū)域的基于血液腫瘤與實(shí)體瘤的檢測(cè)服務(wù)。目前該實(shí)驗(yàn)室一年處理接近800個(gè)遺傳病二代測(cè)序檢測(cè)以及800個(gè)腫瘤類(lèi)二代測(cè)序檢測(cè),文章的兩位作者加起來(lái)一年簽發(fā)超過(guò)1000個(gè)報(bào)告。
第一章:關(guān)于二代測(cè)序的臨床應(yīng)用
二代測(cè)序作為一種檢測(cè)手段,主要應(yīng)用于基因的胚系變異(遺傳性)與體細(xì)胞變異(獲得性)的檢測(cè)。對(duì)于遺傳病,主要的技術(shù)方案是靶向區(qū)域測(cè)序(targeted panel),全外顯子測(cè)序(whole exome),全基因組測(cè)序(whole genome)和線(xiàn)粒體DNA測(cè)序。
其中,靶向區(qū)域測(cè)序主要針對(duì)明確表型的疾病相關(guān)基因進(jìn)行測(cè)序,常見(jiàn)的panel有:免疫缺陷panel,骨髓衰竭綜合征panel,致盲或致聾缺陷panel,線(xiàn)粒體病panel,腎臟疾病panel,神經(jīng)疾病panel,結(jié)締組織疾病panel,心肌疾病panel和遺傳性腫瘤易感panel等。靶向測(cè)序類(lèi)方案有最大的特點(diǎn)是不同實(shí)驗(yàn)室由于方案制定與panel設(shè)計(jì)的年代局限,檢測(cè)的基因范圍都會(huì)有不一樣。對(duì)于腫瘤類(lèi)檢測(cè),由于針對(duì)的樣本類(lèi)型不一樣,使用場(chǎng)景的設(shè)計(jì)不一樣,更是大多區(qū)分為:1.針對(duì)每個(gè)基因的編碼區(qū)域,或者加上UTR甚至外顯子的邊沿(exon padding,為了更好的發(fā)現(xiàn)剪切體變異--splicing mutation),2.針對(duì)某些臨床證據(jù)或者藥物作用靶點(diǎn)/耐藥位點(diǎn)的特定熱點(diǎn)(hotspot panel)。
另外還有基于胎兒游離DNA的NIPT也是二代測(cè)序在轉(zhuǎn)化醫(yī)學(xué)中非常經(jīng)典的應(yīng)用例子。隨著技術(shù)的成熟,二代測(cè)序也開(kāi)始應(yīng)用于腫瘤游離DNA的檢測(cè),HLA的分型,病原體檢測(cè),轉(zhuǎn)錄組測(cè)序,以及甲基化測(cè)序。但是這些領(lǐng)域的應(yīng)用,特別是對(duì)ctDNA的二代測(cè)序應(yīng)用于腫瘤早篩,學(xué)界仍存在擔(dān)憂(yōu),作者主要是提出兩點(diǎn):1.在正常人的游離DNA中也能檢測(cè)出假陽(yáng)性的驅(qū)動(dòng)變異,2.在某些早期階段的腫瘤,ctDNA NGS的靈敏度可能存在不足(30%~60%)。這兩點(diǎn)可能限制ctDNA用于腫瘤早期篩查的適用性。
我個(gè)人的附注1:
靶向區(qū)域測(cè)序主要針對(duì)明確表型的疾病相關(guān)基因進(jìn)行測(cè)序,是目前臨床上使用最多的方案,有著較高經(jīng)濟(jì)性,較高的陽(yáng)性率,檢測(cè)方案優(yōu)化與質(zhì)量控制更成熟等諸多優(yōu)點(diǎn)。但即使是相同的檢測(cè)項(xiàng)目,根據(jù)美國(guó)國(guó)立疾控中心CDC的PHGKB(Public Health Genomics Knowledge Base)的Tier Table Database數(shù)據(jù),同樣的BRCA基因檢測(cè),對(duì)于乳腺癌/卵巢癌患者以及近親是Tier1的證據(jù)(推薦檢測(cè)),而對(duì)于普通人群篩查是Tier3的證據(jù)(不推薦檢測(cè))。關(guān)于PHGKB的分類(lèi)定義,可以參考以下鏈接 Ref:https://phgkb.cdc.gov/PHGKB/topicFinder.action?Mysubmit=init&query=all
對(duì)于全外顯子測(cè)序,目前主要應(yīng)用場(chǎng)景是當(dāng)靶向測(cè)序無(wú)法獲得與檢測(cè)者表型相符合的陽(yáng)性變異時(shí)的二線(xiàn)選擇。全外顯子測(cè)序通常用于患者以及患者的雙親做家系檢測(cè)(trio testing,獲取共分離證據(jù))以增強(qiáng)檢測(cè)準(zhǔn)確性。
我個(gè)人的附注:2:
梅奧醫(yī)學(xué)院對(duì)他們提供的全外顯子測(cè)序的應(yīng)用定義為,對(duì)特定的遺傳綜合征,當(dāng)靶向測(cè)序的結(jié)果為陰性時(shí)作為患者的二級(jí)檢測(cè),該檢測(cè)的主要目的是:1.明確遺傳病種類(lèi),2.目標(biāo)管理(治療指導(dǎo),疾病管理,具體療法制定),3.對(duì)患者近親的檢測(cè),4.對(duì)患者近親致病的排除,5.疾病風(fēng)險(xiǎn)評(píng)估,6.孕前生殖風(fēng)險(xiǎn)評(píng)估,7.產(chǎn)前檢測(cè)。Ref:https://app.mckessondex.com
第二章:關(guān)于二代測(cè)序的技術(shù)方案
目前二代測(cè)序主要技術(shù)方案,是靶向區(qū)域測(cè)序(panel),從靶向區(qū)域獲取的技術(shù)來(lái)區(qū)分主要分為液相捕獲技術(shù)(采用RNA探針或者DNA探針),以及PCR目標(biāo)區(qū)域捕獲技術(shù)。通常的,液相捕獲是先把DNA片段化為特定的長(zhǎng)度(酶切或者超聲),加入接頭,然后用探針捕獲。而PCR捕獲不需要DNA片段化,直接先PCR把目標(biāo)區(qū)域富集然后再加接頭。
我個(gè)人的附注3:
捕獲技術(shù)主要分液相捕獲與PCR捕獲兩大流派。液相捕獲的特點(diǎn)是可以一次性捕獲更多的目標(biāo)區(qū)域,覆蓋的均一性?xún)?yōu)化更容易,更適合較大目標(biāo)區(qū)域的捕獲(500kb以上),但缺點(diǎn)是成本相對(duì)高,對(duì)DNA的input量一般是200ng以上,特殊區(qū)域如GC過(guò)高,串聯(lián)重復(fù)區(qū)域等探針特異性難以?xún)?yōu)化,而且探針捕獲的雜交時(shí)間較長(zhǎng)一般要數(shù)個(gè)小時(shí)。PCR捕獲相對(duì)的總體實(shí)驗(yàn)時(shí)間會(huì)更短,對(duì)DNA的input量一般只需要最低10ng起步,而且通過(guò)多重PCR的優(yōu)化方案,新一代的捕獲方案可以一次性把引物與接頭等一次性完成,更適合已知熱點(diǎn)區(qū)域的捕獲(如腫瘤熱點(diǎn)panel),缺點(diǎn)是引入引物二聚體,并且引物區(qū)假如發(fā)生SNP會(huì)導(dǎo)致該amplicon丟失等。
而不論是哪種捕獲技術(shù),靶向區(qū)域測(cè)序一般都有以下環(huán)節(jié):DNA提取,文庫(kù)制備,目標(biāo)區(qū)域富集,上機(jī)測(cè)序四大環(huán)節(jié)。
DNA提取
常規(guī)DNA提取一般都能滿(mǎn)足二代測(cè)序的樣本要求。但是對(duì)于腫瘤的FFPE樣本處理起來(lái)要特別小心,特別是對(duì)于陳舊的樣本來(lái)源,DNA損傷與降解非常常見(jiàn),而且FFPE樣本一般要經(jīng)過(guò)顯微切割與脫臘等步驟,也可能造成DNA的得率的下降。DNA提取的一個(gè)很關(guān)鍵的質(zhì)控步驟,一般選擇Qubit來(lái)定量,因?yàn)榈蜐舛菵NA Qubit的測(cè)量值比NanoDrop相對(duì)更靈敏一點(diǎn)。
文庫(kù)制備
文庫(kù)制備是二代測(cè)序的一個(gè)專(zhuān)用術(shù)語(yǔ),一般泛指DNA的片段化與測(cè)序接頭及樣本標(biāo)簽(barcode或index)的連接。其中片段化大小的選擇與所用的測(cè)序方案密切相關(guān),對(duì)于針對(duì)編碼區(qū)的檢測(cè)方案一般選擇更短的片段大小,而對(duì)于非編碼區(qū)目標(biāo)區(qū)域測(cè)序,如對(duì)融合與重排的發(fā)現(xiàn),會(huì)選擇更大的片段大小(如下圖,紅色表示雙向測(cè)序的讀長(zhǎng),虛線(xiàn)表示該片段無(wú)法被測(cè)通的區(qū)域)。
我個(gè)人的附注4:
文庫(kù)質(zhì)量直接影響到測(cè)序結(jié)果的可靠與否,這也是二代測(cè)序中質(zhì)檢以及建庫(kù)試劑質(zhì)量的非常重要的考慮環(huán)節(jié)。其中片段化大小的選擇與所用的測(cè)序方案密切相關(guān),對(duì)于針對(duì)編碼區(qū)的檢測(cè)方案一般選擇更短的片段大小,一般會(huì)根據(jù)測(cè)序讀長(zhǎng)來(lái)匹配相應(yīng)的片段大小,如illumina的PE150一般選擇250bp左右的片段,而對(duì)于PE100一般選擇150bp左右的片段。對(duì)于文庫(kù)index的選擇,推薦使用雙端接頭,因?yàn)閾?jù)報(bào)道,illumina的新測(cè)序平臺(tái)由于改變了原有的bridge PCR方案,假如選擇單端接頭或者雙端重復(fù)接頭可能會(huì)導(dǎo)致同一個(gè)lane上樣本數(shù)據(jù)交叉污染。Ref:http://enseqlopedia.com/2017/04/update-illumina-index-swapping-better-barcode-design/
靶向區(qū)域富集
靶向區(qū)域富集主要分為基于探針的液相捕獲,以及基于PCR的目標(biāo)區(qū)域捕獲。(兩者特點(diǎn)與區(qū)別可以參考我個(gè)人的附注3)這兩者的技術(shù)沒(méi)有絕對(duì)的優(yōu)劣,而是看是否適合特定檢測(cè)的應(yīng)用場(chǎng)景,因?yàn)闆](méi)有任何技術(shù)是通用同時(shí)完美,要有所取舍。
上機(jī)測(cè)序
絕大多數(shù)的臨床二代測(cè)序選用兩大陣營(yíng)的測(cè)序平臺(tái):illumina公司的HiSeq,MiSeq,NextSeq系列,以及l(fā)ife公司的Ion Torrent系列。這兩大陣型的最大區(qū)別在于建庫(kù)試劑方案,檢測(cè)方案。這兩個(gè)平臺(tái)的測(cè)序方案的一個(gè)共同點(diǎn)是都要把準(zhǔn)備好的富集好的靶向區(qū)域的文庫(kù)進(jìn)行信號(hào)放大,但是放大的方案各不相同。
life的ion torrent選用鏈霉素親和磁珠鏈接文庫(kù)分子(每個(gè)磁珠只能連接單一的DNA分子片段,不然就會(huì)造成雜信號(hào)而使這個(gè)磁珠所掉落到的納米孔雜峰信號(hào)失效),然后再進(jìn)行乳液PCR來(lái)進(jìn)行邊合成邊測(cè)序(合成的同時(shí)就會(huì)有信號(hào)放大)。
而illumina平臺(tái)選擇橋式PCR的方法來(lái)放大信號(hào),DNA分子均勻而稀疏地分布在流動(dòng)槽(flow cell)上,然后通過(guò)橋式PCR來(lái)進(jìn)行擴(kuò)增與信號(hào)放大。兩個(gè)平臺(tái)最大的技術(shù)區(qū)別在于檢測(cè)的信號(hào)的方法不一樣,life平臺(tái)檢測(cè)的是不同堿基的電荷數(shù)不一樣,導(dǎo)致磁珠掉落的檢測(cè)洞中的局部離子強(qiáng)度差異(pH),通過(guò)檢測(cè)微弱電流大小來(lái)分辨堿基信號(hào)。而illumina通過(guò)堿基帶有的熒光基團(tuán)不一樣,通過(guò)光學(xué)CCD的方法捕獲不同堿基熒光信號(hào)的差異而分辨堿基信號(hào)。(以上測(cè)序原理可以參考life公司與illumina公司的技術(shù)文檔)
而更重要的是,關(guān)于測(cè)序錯(cuò)誤的問(wèn)題,對(duì)于life平臺(tái)最常見(jiàn)的測(cè)序錯(cuò)誤主要來(lái)自連續(xù)的檢測(cè)檢測(cè)不準(zhǔn)確以及某些indel的檢測(cè)(主要來(lái)自于連續(xù)的電流信號(hào)無(wú)法特別區(qū)分,而且life平臺(tái)的測(cè)序長(zhǎng)度是不能保證固定,因此每個(gè)讀序的長(zhǎng)度都是非固定,無(wú)法使用讀長(zhǎng)這一參數(shù)進(jìn)行校正)。對(duì)于illumina平臺(tái)最主要的測(cè)序錯(cuò)誤來(lái)自于高GC區(qū)域的SNP檢測(cè)錯(cuò)誤。
本人任職在良培基因生物科技(武漢)有限公司,主要從事二代測(cè)序相關(guān)服務(wù)。本文僅代表個(gè)人觀點(diǎn),不代表本人所在公司的立場(chǎng),以上內(nèi)容僅供同行交流與參考。