應用單細胞測序技術研究科學問題越來越普遍,當下應用最火熱的是10X Genomics公司的解決方案,但是在某些特殊或者少量細胞樣本的單細胞轉錄組研究中,Smart-seq2技術還是一項研究利器。在Smart-seq2技術基礎上衍生的其它單細胞轉錄組測序技術為某些特殊科學問題提供了解決方案,比如最近發表的mRNA poly(A)尾的多態性研究(Liu et al., 2019)。
測序相關的實驗技術創新往往是在以前的實驗基礎上改進而來,或者是幾種實驗加測序技術的組合,蓋成大樓的不是最后一塊磚,每建成一層都能探尋到獨特的風景。通過對某些核心測序實驗技術Step-by-Step的梳理、傳播,我們期望幫助更多的人啟發思考,并繼續拓展創新。
本文將Step-by-Step梳理Smart-seq2技術的實驗原理和文庫組成,對于更細節的實驗條件和處理將不會涉及,如果對這部分有興趣可參考文章的protocol(Picelli et al., 2014)
Smart-Seq簡介
Smart-Seq
(Switching mechanism at 5' end of the RNA transcript)
- 2012年Smart-Seq發表(Ramsk?ld et al., 2012)
- 2013年發表了其改進技術的應用Smart-Seq2 (Picelli et al., 2013)
- 2014年Smart-Seq2 protocol發表 (Picelli et al., 2014)。
Smart-Seq2 對原始的Smart-Seq實驗流程進行了多項改進優化,它不再需要純化步驟,可大大提高產量,最重要的改進是下面兩項:
- TSO 3'端最后一個鳥苷酸替換為鎖核酸LNA(locked nucleic acid)。
LNA單體的熱穩定性增強,其退火溫度增強非模板cDNA的3'延伸能力 - 甜菜堿(一種具有兩個重要作用的甲基供體:它會增加蛋白質的熱穩定性,并通過破壞DNA螺旋來降低甚至消除了DNA熱融變對堿基對組成的依賴性)與較高的MgCl2濃度結合使用。
解決某些RNA形成二級結構(例如發夾或環)由于空間位阻,可能導致酶終止鏈延長的問題
Smart-Seq2 優點和限制
優點
- Smart-seq2利用現成的試劑比廣泛商用的SMARTer kit生產更高質量的文庫,成本便宜~12%,為分析大量細胞提供了可能性
- 相對于截短的cDNAs,M-MLV逆轉錄酶更傾向于選擇全長cDNAs作為其末端轉移酶活性的底物。因此每個轉錄本的所有外顯子都能被檢測到,這使它可以用于檢測可變剪接,還可以在轉錄本層面進行全面的SNP和突變分析,擴大了其應用范圍
- 不同I5、I7 Index組合使其能夠進行多樣品混合測序
- Smart-seq2的方案組分和原理是公開的,讓研究人員可以進一步對其進行改良,目前在這個方案基礎上涌現了許多單細胞測序的新成果
限制
- 由于對聚腺苷酸化的RNA具有選擇性,所以不能分析非poly(A)的RNA
- 測序reads不帶有mRNA鏈特異性
建庫技術原理
我們了解了Smart-seq2的優點和限制,到底怎樣的文庫結構和實驗建庫原理使它有這些特點呢?
這一章節我們將Step-by-step詳細解讀Smart-seq2的文庫構建過程
建庫流程圖總攬
接頭和引物序列
- oligo-dTV
5'- AAGCAGTGGTATCAACGCAGAGTACTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTVN -3'
- Template Switching Oligo (TSO)
5'- AAGCAGTGGTATCAACGCAGAGTACATrGrG+G
-3'
- ISPCR
5′- AAGCAGTGGTATCAACGCAGAGT -3′
- Nextera Tn5 binding site (19-bp Mosaic End (ME))
5'- AGATGTGTATAAGAGACAG -3'
- Nextera N/S5xx primer entry point (s5)
5'- <u>TCGTCGGCAGCGTC
</u> -3'
- Nextera N7xx primer entry point (s7)
5'- GTCTCGTGGGCTCGG -3'
- Illumina P5 adapter
5'- AATGATACGGCGACCACCGAGATCTACAC -3'
- Illumina P7 adapter
5'- CAAGCAGAAGACGGCATACGAGAT -3'
- Nextera (XT) N/S5xx Index primer
5'- AATGATACGGCGACCACCGAGATCTACAC[8-bp i5 index]<u>TCGTCGGCAGCGTC
</u> -3'
- Nextera (XT) N7xx Index primer
5'- CAAGCAGAAGACGGCATACGAGAT[8-bp i7 index]GTCTCGTGGGCTCGG
-3'
- Read 1 sequencing primer
5'- <u>TCGTCGGCAGCGTC
</u>AGATGTGTATAAGAGACAG -3'
- Index 1 sequencing primer
5'- CTGTCTCTTATACACATCTCCGAGCCCACGAGAC
-3'
- Read 2 sequencing primer
5'- GTCTCGTGGGCTCGG
AGATGTGTATAAGAGACAG -3'
8-bp i5 & i7 序列
N/S502 : CTCTCTAT
N/S503 : TATCCTCT
N/S505 : GTAAGGAG
N/S506 : ACTGCATA
N/S507 : AAGGAGTA
N/S508 : CTAAGCCT
N/S510 : CGTCTAAT
N/S511 : TCTCTCCG
N/S513 : TCGACTAG
N/S515 : TTCTAGCT
N/S516 : CCTAGAGT
N/S517 : GCGTAAGA
N/S518 : CTATTAAG
N/S520 : AAGGCTAT
N/S521 : GAGCCTTA
N/S522 : TTATGCGA
N701 : TCGCCTTA
N702 : CTAGTACG
N703 : TTCTGCCT
N704 : GCTCAGGA
N705 : AGGAGTCC
N706 : CATGCCTA
N707 : GTAGAGAG
N710 : CAGCCTCG
N711 : TGCCTCTT
N712 : TCCTCTAC
N714 : TCATGAGC
N715 : CCTGAGAT
N716 : TAGCGAGT
N718 : GTAGCTCC
N719 : TACTACGC
N720 : AGGCTCCG
N721 : GCAGCGTA
N722 : CTGCGCAT
N723 : GAGCGCTA
N724 : CGCTCAGT
N726 : GTCTTAGG
N727 : ACTGATCG
N728 : TAGCTGCA
N729 : GACGTCGA
Step-by-step library generation
首先細胞需要制備成單細胞懸液
Poly(A)+ RNA逆轉錄
oligo-dTVN
經過退火結合到mRNA的poly(A),逆轉錄酶MMLV開始進行逆轉錄。
oligo-dTVN
的3'末端含有VN
,其中N
為A/T/C/G任何堿基,V
為A/C/G。這樣的設計能夠使oligo-dTVN
能夠錨定到poly(A)+RNA的3′-UTR末端,從而在逆轉錄時避免poly(A)尾的逆轉錄。
逆轉錄完成后,MMLV的末端轉移酶活性會在3'末端增加額外的Cs
模板轉換
加入
TSO
引物,TSO
3'末端的rGrG+G結合到第一鏈的CCC,第一鏈(非模版鏈)繼續延伸合成TSO的互補鏈。
TSO
引物的3'末端有2個核糖鳥苷(rG)和一個LNA修飾的鳥苷(+G),這樣的設計使LNA單體的熱穩定性增強,其退火溫度增強非模板cDNA的3'延伸能力
值得注意的是在第一鏈延伸合成TSO互補鏈之后,在3'末端又會添加CCC,這樣可能又會結合一個TSO,造成意外的模版延長,如下第二種情況
(Kapteyn et al., 2010)
要避免這種情況可以使用5'-blocked TSO,或者降低TSO的投入量
10X單細胞的TSO的5' end是被阻斷,所以不存在這個問題
cDNA擴增
添加ISPCR單引物用于cDNA擴增
ps:這步驟得到的是全長的cDNA序列,如果像10X轉錄組那樣在
oligo-dTV
的設計中加入標示細胞的barcode和標示轉錄本的UMI,那么在細胞和DNA量足夠的情況下可以直接應用三代儀器進行單細胞的全長轉錄本測序,這樣得到的每個細胞內的基因檢出數和豐度將很可觀
cDNA片段化
使用Nextera XT樣品制備試劑盒進行cDNA的片段化和標簽標記,試劑盒的標記反應利用Tn5的特性把cDNA打斷的同時,把
s5
s7
整合到打斷后的cDNA片段上上圖為Tn5模式圖,cDNA片段標簽化的產物有以下三種
- 產物1
s5
在片段的兩端,根據semi-suppressiev PCR原理,在后續步驟不會有效擴增 - 產物2
s7
在片段的兩端,根據semi-suppressiev PCR原理,在后續步驟不會有效擴增 - 產物3
s5 s7
在片段的兩端,在后續步驟能夠被有效擴增
被Tn5打斷標簽化之后的文庫片段并不完全是雙鏈互補的,在連接處的插入片段末端帶有gap,這些gap會在Nextera PCR的第一個循環被填補,填補后的文庫組成如下
加入文庫PCR引物進行文庫擴增
加入N/S5xx and N7xx index引物對上一步標簽化的文庫進行擴增
最終上機測序文庫組成
I5/I7 Index序列信息見上一章節,不同的I5/I7組合能夠使來自不同單細胞的文庫混合pooling在Illumina儀器的同一個lane上進行測序,在測序數據下機后能夠根據I5/I7 拆分來自不同單細胞文庫的數據。
參考
- Liu Y, Nie H, Liu H, et al. Poly (A) inclusive RNA isoform sequencing (PAIso? seq) reveals wide-spread non-adenosine residues within RNA poly (A) tails[J]. Nature communications, 2019, 10(1): 1-13.
- Ramsk?ld D, Luo S, Wang Y C, et al. Full-length mRNA-Seq from single-cell levels of RNA and individual circulating tumor cells[J]. Nature biotechnology, 2012, 30(8): 777.
- Picelli S, Bj?rklund ? K, Faridani O R, et al. Smart-seq2 for sensitive full-length transcriptome profiling in single cells[J]. Nature methods, 2013, 10(11): 1096.
- Picelli S, Faridani O R, Bj?rklund ? K, et al. Full-length RNA-seq from single cells using Smart-seq2[J]. Nature protocols, 2014, 9(1): 171.
- https://www.illumina.com.cn/science/sequencing-method-explorer/kits-and-arrays/smart-seq2.html?langsel=/cn/
- https://teichlab.github.io/scg_lib_structs/methods_html/SMART-seq_family.html
- https://scrnaseq-course.cog.sanger.ac.uk/website/introduction-to-single-cell-rna-seq.html
- Kapteyn J, He R, McDowell E T, et al. Incorporation of non-natural nucleotides into template-switching oligonucleotides reduces background and improves cDNA synthesis from very small RNA samples[J]. BMC genomics, 2010, 11(1): 413.