RNA-DNA雜合鏈是在轉錄、DNA 復制和 DNA 修復過程中產生的,是這些進程的關鍵中介體。當RNA-DNA雜合鏈在雙鏈DNA中穩定形成時,游離在外的一條DNA鏈組成稱為R-loop的三鏈結構。R-loops在基因組中廣泛存在并富集在活性轉錄基因上。R-loops在調節基因表達和染色質結構方面具有重要作用,但同時也對基因組穩定性構成威脅,尤其是在DNA復制期間。為了保持基因組穩定,細胞已經進化出一系列機制來防止異常R-loops的積累。盡管R-loops會導致DNA損傷,但它們也被DNA損傷所誘導,充當DNA修復的關鍵中間體,例如在轉錄偶聯修復和RNA依賴性的DNA斷裂修復中。當R-loops的調節出現問題時,病理性R-loops就會積累,從而導致神經退行性變和癌癥等疾病。
R-loops和RNA-DNA雜合鏈的來源以及它們的功能在各細胞、染色體和序列中是不同的。本節將討論R-loops和RNA-DNA雜合鏈如何在整個基因組的轉錄、DNA復制和DNA修復過程中自然形成。 R-loops也在基因組的特定區域分布,如端粒、著絲粒和線粒體DNA (mtDNA) 中。
共轉錄性R-loops
在DNA 轉錄過程中,新生RNA在RNA聚合酶的活性位點內非常短暫地與DNA模板退火,產生短暫的、瞬時的RNA-DNA雜合鏈。當新生的RNA在RNA聚合酶后面短暫地重新退火到模板上時,會形成R-loops結構。在由RNA聚合酶Ⅱ (Pol Ⅱ) 轉錄的基因中,共轉錄性R-loops主要分布在基因的啟動子和轉錄起始位點(TSSs) 以及轉錄終止位點 (TTSs) 。“啟動子”處的R-loops參與轉錄激活;在靠近富含G的序列的“終止子”上,Pol Ⅱ暫停位點處形成的R-loops有助于轉錄終止和基因抑制性染色質的形成。在免疫球蛋白基因上,R-loops也分布于高度重復、富含GC的開關區域中,從而助于“類開關重組”進程。
Pol Ⅱ轉錄增加及Pol Ⅱ暫停都與R-loop積聚有關。Pol Ⅱ轉錄增加產生更多可以形成 R-loops的RNA,而Pol Ⅱ暫停增加了RNA與DNA模板雜交的機會。具有活性的核糖體DNA(rDNA)重復序列被Pol Ⅰ高度轉錄并積聚R-loops,而這在正常條件下也會干擾Pol Ⅰ轉錄——高水平的R-loops,特別是在18S基因的5’區域,與Pol Ⅰ停滯堆積有關。核糖體DNA基因之間的基因間間隔區(intergenic)的Pol Ⅱ轉錄也會產生限制Pol Ⅰ轉錄的R-loops,這與核仁結構相關。由Pol Ⅲ轉錄的5S rRNA基因在正常條件下也易于形成R-loops,而其他Pol Ⅲ基因,如tRNA基因,僅在沒有RNase H的情況下才會積聚R-loops。
端粒和著絲粒R-loops
含有端粒重復的RNA(TERRA)是一種長的非編碼RNA(lncRNA),由Pol Ⅱ從端粒和亞端粒區域轉錄產生。TERRA含有UUAGG重復序列,可與富含C的端粒DNA鏈雜交。在人類細胞中,TERRA與端粒結合,與許多端粒結合蛋白和染色質調節劑相互作用,例如端粒重復結合因子2(TRF2)和ATRX,這對端粒維持很重要。在人類細胞的端粒處檢測到TERRA生成的R-loops。最近的一項研究表明,由UUAGGG重復組成的RNA足以通過RAD51重組酶介導的機制以intrans形成端粒R-loops,并且端粒R-loops的形成增加了端粒的脆弱性。總之,端粒R-loops允許TERRA與端粒相聯并維持端粒,但同時也誘導產生基因組不穩定性。TERRA和端粒R-loops的適當調控可能對端粒的正常功能很重要。
與端粒類似,著絲粒也由Pol Ⅱ轉錄。在人類細胞中檢測到著絲粒和著絲粒周圍衛星DNA的RNA轉錄物。α-衛星重復序列的RNA轉錄物與著絲粒相關,它們會形成incis的R-loops。著絲粒RNA是組蛋白H3樣著絲粒蛋白A (CENPA)和著絲粒蛋白C (CENPC)與著絲粒結合所必需的,這使得這些RNAs成為著絲粒的重要結構成分。在有絲分裂中的染色體上很容易檢測到著絲粒R-loops。絲氨酸/蘇氨酸蛋白激酶ATR在有絲分裂過程中以R-loop依賴性方式招募到著絲粒上,ATR通過CHK1促進Aurora B的激活。這種ATR激活的有絲分裂特異性和著絲粒特異性機制確保了精準的微管-著絲粒附著和忠實的染色體分離。盡管著絲粒R-loops對于著絲粒的組裝和功能很重要,但它們也是復制壓力的來源。在S期,需要CENPA抑制著絲粒的轉錄和R-loops形成,從而保護著絲粒免受DNA損傷。因此,著絲粒R-loops對著絲粒具有雙面影響,并且著絲粒R-loops及其相關蛋白的水平可能在細胞周期中錯綜復雜地變化。
DNA復制時產生的雜交鏈
與復制相關的RNA-DNA雜合鏈最主要來源是滯后鏈復制,在此期間DNA聚合酶-α (Polα)-引物復合物每約200個核苷酸合成一個8-10個核苷酸長度的RNA引物。然而,這些雜合鏈在岡崎片段成熟過程中通常會被去除,此時RNA引物和由他們產生的DNA延伸被DNA Pol δ置換,并且由此產生的flaps被flaps內切酶1 (FEN1) 去除。基于RNA引物的RNA-DNA雜合鏈也可能在繞過DNA損傷和通過Polα-primase或DNA定向引物酶/聚合酶蛋白(PrimPol)重新啟動過程中產生,盡管在這種情況下去除RNA-DNA雜合鏈的機制要少得多。在DNA復制過程中經常產生的另一種RNA-DNA雜合鏈是錯誤摻入的核糖核苷酸。細胞中高濃度的核糖核苷酸導致它們被復制性DNA聚合酶錯誤摻入,估計速率為每7.6kb 一次。錯誤摻入的核糖核苷酸被認為是最常見的基因組病變,需要核糖核苷酸切除修復 (RER) 才能將其去除。
DNA損傷誘導產生的雜交鏈
在人類細胞中,DNA雙鏈斷裂 (DSBs) 位點處能夠檢測到RNA-DNA雜合鏈。這些雜合鏈是通過在DSBs的ssDNA突出末端上的RNA-DNA雜交或通過RNA侵入dsDNA形成的。幾種類型的RNA有助于DSBs的退火雜交。據報道,Dicer和Drosha產生的小RNA在DSBs周圍形成雜合鏈。DNA損傷誘導的lncRNAs (dilncRNAs) 也在DSBs處形成雜交鏈。dilncRNAs的合成與MRE11-RAD50-NBS1(MRN) 復合物募集到DSBs的Pol Ⅱ有關。Pol Ⅲ也有助于DSBs處的RNA合成。這些發現表明,DSBs處RNA從頭合成促進了RNA-DNA雜合鏈的形成。然而,在特定位點誘導DSBs后對RNA-DNA雜交鏈的全基因組圖譜顯示,雜交鏈水平的增加主要發生在轉錄活性區域,這表明預先存在的RNA轉錄物在損傷誘導的RNA-DNA雜交鏈形成中起主要作用。相應地,當由特定染色體位點的活性氧 (ROS) 誘導DSBs和單鏈斷裂 (SSBs) 時,雜交鏈僅在存在局部轉錄的情況下才能檢測到。有人提出DSBs和SSBs引發Pol Ⅱ暫停會導致R-loops的形成;但DSBs和SSBs如何暫停Pol Ⅱ尚不清楚。在活性轉錄基因中R-loops上暴露的ssDNA也可能允許從頭合成RNA,從而有助于在DNA損傷位點形成RNA-DNA雜合鏈。
線粒體R-loops
R-loops也在mtDNA中積累,它由具有不同核苷酸組成的重(H)鏈和輕(L)鏈組成。 在mtDNA的控制區域(即控制RNA和DNA合成的非編碼區)檢測到的R-loops,其中RNA的3′末端與重鏈合成的起始位點(ori-H)重合。在ori-H處形成R-loops取代ssDNA并啟動RNA引導的重鏈合成。在新生的重鏈延伸到ori-L外后,輕鏈的合成從ori-L開始,從而完成mtDNA完全復制。RNaseH1對線粒體中的R-loops加工和DNA復制至關重要。盡管R-loops對mtDNA復制很重要,但高水平的R-loops會導致mtDNA不穩定。由解旋酶SUV3和核糖核酸酶組成的線粒體降解復合物可防止線粒體中病理性R-loops的積累。
基因編輯時產生的R-loops
除了天然存在的R-loops和RNA-DNA雜合鏈之外,R-loops還可以在CRISPR-Cas進行基因組編輯期間人為生成。在CRISPR–Cas系統中,Cas蛋白與小向導 RNA (gRNA) 形成復合物識別并切割目標DNA序列。在識別目標DNA期間,gRNA侵入dsDNA并形成RNA-DNA雜合鏈。由Cas9和gRNA形成的RNA-DNA雜交鏈長約16-20個核苷酸。Cas9-gRNA-dsDNA復合物的晶體結構表明,RNA-DNA雜合鏈大部分埋藏在Cas9蛋白內部。這些RNA-DNA雜合鏈的形成取代了DNA的非靶標鏈,并將RNA-DNA雜合鏈和ssDNA分別定位在Cas9的HNH和RuvC核酸酶結構域的活性位點附近。CRISPR-Cas系統通過形成此類R-loops來識別目標DNA的能力也使它們能夠介導堿基編輯(base editing)和先導編輯(prime editing)。其他Cas蛋白也使用R-loops來識別和切割目標。
參考文獻:Petermann, E., Lan, L. & Zou, L. Sources, resolution and physiological relevance of R-loops and RNA–DNA hybrids.?Nat Rev Mol Cell Biol?23,?521–540 (2022). https://doi.org/10.1038/s41580-022-00474-x