文獻(xiàn)解讀:Hedlund, E., & Deng, Q. (2018). Single-cell RNA sequencing: technical advancements and biological applications.?Molecular aspects of medicine,?59, 36-46.
1 引言
????????細(xì)胞是機(jī)體的基本組成單位,機(jī)體的每一個細(xì)胞都具有其獨(dú)特性。單細(xì)胞RNA測序(single-cell RNA sequencing method,scRNA-seq)技術(shù)作為一項(xiàng)革命性工具,在揭示細(xì)胞獨(dú)特性上達(dá)到了前所未有的精度。自從第一項(xiàng)scRNA-seq研究發(fā)表以來,這項(xiàng)技術(shù)已經(jīng)被廣泛用于多個方面的生物醫(yī)學(xué)研究,包括腫瘤異質(zhì)性研究、新細(xì)胞類型的鑒定、組織發(fā)育與細(xì)胞分化過程研究、基因調(diào)控網(wǎng)絡(luò)研究、不同等位基因表達(dá)研究等。這篇文章主要針對scRNA-seq技術(shù)的技術(shù)進(jìn)展及其在生物學(xué)研究中的應(yīng)用進(jìn)行介紹。
2 scRNA-seq技術(shù)
????????目前為止研究者們已經(jīng)發(fā)展出了多種不同的scRNA-seq方法,這些方法有著各自不同的優(yōu)勢與適用性。一般來說,scRNA-seq主要包括4個步驟:(1)單個細(xì)胞或單個細(xì)胞核的分離或裂解;(2)逆轉(zhuǎn)錄;(3)cDNA擴(kuò)增;(4)文庫構(gòu)件與測序。
2.1 單細(xì)胞分離與捕獲(參見Fig 1)
????????這一步通常借助于酶解反應(yīng)來完成,也可以通過激光捕獲顯微切割(laser capture microdissection,LCM)和膜片鉗(patch clamping)技術(shù)進(jìn)行輔助分離。酶解反應(yīng)的時(shí)間應(yīng)當(dāng)快速以避免影響細(xì)胞的轉(zhuǎn)錄表達(dá),同時(shí)也不能太短,應(yīng)當(dāng)使得細(xì)胞充分分離。之后需要將得到的單細(xì)胞懸液分離進(jìn)行單個反應(yīng)管之內(nèi)。
????????微吸(Micro-pipetting)技術(shù)主要用來處理稀有細(xì)胞類型。
????????熒光激活細(xì)胞分選(fluo- rescent activated cell sorting,F(xiàn)ACS)和微流控(microfluidic)技術(shù)用來處理大量細(xì)胞。FACS同時(shí)可以針對每種特定細(xì)胞類型進(jìn)行富集,但是會出現(xiàn)更多的doublets現(xiàn)象,而且分選壓力可能會對細(xì)胞造成傷害。微流控技術(shù)對細(xì)胞傷害更少且更加經(jīng)濟(jì),缺點(diǎn)是容易丟失細(xì)胞且受到細(xì)胞大小影響。目前商用的微流控技術(shù)包括Fluidigm C1 system、10X Genomics Chromium、Illumina Biorad SureCell system。
????????微孔板(microwell)技術(shù)能夠克服細(xì)胞大小帶來的偏差,同時(shí)通過顯微觀察能夠排除doublets現(xiàn)象的發(fā)生。
????????應(yīng)當(dāng)注意的是,單細(xì)胞的酶解過程可能是有問題的,尤其是針對粘附性較強(qiáng)的組織而言。酶解反應(yīng)給細(xì)胞帶來的應(yīng)激反應(yīng)可能導(dǎo)致細(xì)胞表面膜蛋白的降解以及內(nèi)部轉(zhuǎn)錄水平的改變。一種可行的替代方法是僅針對細(xì)胞核進(jìn)行分離和測序,目前僅能通過FACS技術(shù)實(shí)現(xiàn)這一目標(biāo)。單細(xì)胞核測序的問題在于細(xì)胞核中含有的RNA含量極少。
2.2 逆轉(zhuǎn)錄(參見Table 1)
????????大部分實(shí)驗(yàn)protocol中使用oligodT priming的方法,主要針對多腺苷RNA和長鏈非編碼RNA進(jìn)行逆轉(zhuǎn)錄。缺點(diǎn)在于排除了非多腺苷RNA,包括多數(shù)非編碼RNA與環(huán)形RNA等。
????????SUPeR-seq可以針對多腺苷和非多腺苷RNA進(jìn)行逆轉(zhuǎn)錄。
????????MATQ-seq可以對基因全長進(jìn)行測序,而且能夠?qū)?xì)胞內(nèi)全部RNA進(jìn)行捕獲。
2.3 cDNA擴(kuò)增
????????首先通過反轉(zhuǎn)錄形成cDNA第一條鏈,第二條鏈可以通過多種方法進(jìn)行合成。一類方法是SMART(switching mechanism at 50 end of RNA template)方法,利用了M-MLV轉(zhuǎn)錄酶(Moloney鼠白血病病毒逆轉(zhuǎn)錄酶)的轉(zhuǎn)移酶和鏈轉(zhuǎn)換活性來整合模板轉(zhuǎn)換寡核苷酸作為下游PCR擴(kuò)增的銜接子。具體方法包括Smart-seq,Smart-seq2,STRT。PCR是用來擴(kuò)增cDNA的常用方法,由于PCR是指數(shù)擴(kuò)增,對斷鏈和GC含量少的DNA鏈來說具有偏性。
????????線性擴(kuò)增的方法則包括CEL-seq,CEL-seq2,MARS-seq。
????????擬線性擴(kuò)增的方法包括MALBAC-RNA。
2.4 如何選擇測序方法與樣本數(shù)量
????????已有的scRNA-seq方法包括十幾種,總的來說可以分成兩大類:全長(full-length)測序與基于標(biāo)簽(tag-based)測序。全長測序即對基因全長進(jìn)行測序,可以對基因的異構(gòu)體(isoform)、剪切事件、SNP等進(jìn)行分析。缺點(diǎn)在于無法將所有樣本混入一個試管中進(jìn)行建庫,因此不適合高通量測序平臺。此外大部分全長測序無法進(jìn)行UMI(unique molecule identifiers)的插入。
????????UMI是一系列堿基順序特異的短序列,在逆轉(zhuǎn)錄時(shí)添加在cDNA末端,這樣所有來自同一cDNA的PCR擴(kuò)增產(chǎn)物帶有相同的UMI分子。對同一基因的不同UMI分子進(jìn)行計(jì)數(shù)就能夠作為基因轉(zhuǎn)錄mRNA含量的量化。最近發(fā)展出的MATQ-seq方法已能夠在進(jìn)行全長測序的同時(shí)進(jìn)行UMI標(biāo)記。
????????多數(shù)測序方法采用基于標(biāo)簽的方法,其中又可以分為基于3’(CEL-seq/CEL-seq2,MARS-seq)或是基于5’(STRT)。基于標(biāo)簽的方法能夠結(jié)合UMI分子進(jìn)行高通量測序,成本較低;缺點(diǎn)在于測序比對的敏感性差,此外僅能用于基因表達(dá)的測定,不能進(jìn)行基因異構(gòu)體分析和剪切事件的鑒定。
????????具體選擇何種測序方法應(yīng)當(dāng)根據(jù)以上特點(diǎn)介紹來進(jìn)行選擇。就研究者對多種方法的比較來看,Smart-seq2在敏感性和可重復(fù)性上都要優(yōu)于其他方法;如果測序的細(xì)胞很多,Drop-seq是一種合適的方法,每個細(xì)胞可測得4000個基因左右。此外,mRNA檢測的敏感性與測序深度也有關(guān)系,如果是僅僅進(jìn)行基因表達(dá)的量化,在測序深度達(dá)到1M reads/sample時(shí)就能達(dá)到帕累托最優(yōu);如果要分析可變剪切,測序深度應(yīng)當(dāng)更高。
????????另一個常見的問題是需要測序的細(xì)胞數(shù)量,這跟待測細(xì)胞的稀有程度有關(guān)。一個用來估計(jì)數(shù)量的式子是:
其中P(d)是檢測效力,s是細(xì)胞頻率,n是所需細(xì)胞數(shù)量。按照這一公式,如果感興趣的細(xì)胞類型在組織細(xì)胞中占比1%,則需要對250個細(xì)胞進(jìn)行測序才能達(dá)到0.9以上的檢測效力。此外為了對測序的假陽性率和假陰性率進(jìn)行控制,一定數(shù)量的生物學(xué)重復(fù)也是必要的。如果感興趣細(xì)胞在轉(zhuǎn)錄組上與其他細(xì)胞存在較大差異,那么測序的細(xì)胞數(shù)量和測序深度都可以適當(dāng)降低要求。
2.5 scRNA-seq中的技術(shù)問題
????????由于單個細(xì)胞中RNA含量很低且存在基因的隨機(jī)表達(dá)特性,scRNA-seq數(shù)據(jù)面臨的一個重要問題就是細(xì)胞間變異性。這種變異性可能來自于技術(shù)誤差(比如RNA捕獲效率不同)或是生物學(xué)誤差(比如基因隨機(jī)表達(dá)、不同的細(xì)胞狀態(tài)、細(xì)胞大小、細(xì)胞周期階段)。
????????此外批次效應(yīng)是在高通量測序過程中常見的一個系統(tǒng)誤差。在細(xì)胞捕獲與測序、不同的試劑使用、多個樣本等處理過程中,都可能引入批次效應(yīng)。通過仔細(xì)規(guī)劃實(shí)驗(yàn)步驟和使用多個生物學(xué)重復(fù)可以減少批次效應(yīng)的影響。但是由于生物樣本間不同的遺傳背景以及不同的捕獲效率而導(dǎo)致的基因檢出率差異是很難控制的。通過PCA降維來觀察不同批次的樣本是否均勻分布是檢查批次效應(yīng)的一種常用方法。
????????為了去除技術(shù)誤差的影響,一種常用的方法是向樣本中加入已知豐度的外源性spike-in RNA(比如有ERCC提供的92 spike-in RNA),根據(jù)spike-in RNA的檢測率來對數(shù)據(jù)進(jìn)行質(zhì)控和標(biāo)準(zhǔn)化。缺點(diǎn)在于spike-in RNA在分子特性上可能與內(nèi)源性RNA存在差異,此外也無法完全避免批次效應(yīng)的影響。
????????因此scRNA-seq技術(shù)的一大挑戰(zhàn)就在于如果避免RNA信息的丟失以及確保數(shù)據(jù)的高保真性。此外,對測序分析結(jié)果進(jìn)行實(shí)驗(yàn)驗(yàn)證也是很有必要的。