本篇為轉載,原創作者為????AI寫代碼的DNA? ? 義冠????轉座元件對基因調控的作用????謝謝大佬,受益匪淺?? ??
Regulatory activities of transposable elements: from conflicts to benefits
??TE順式調節活性
????1.TE順式調節活性的起源
????自主移動的TE序列通常會編碼一些與自我復制相關的基因,使得它們的擴增不再依賴于宿主基因組。不過,作為基因組的 “寄生蟲”,TE需要宿主的一些生化機制來實現其自身基因的表達。TE能夠模仿宿主的順式調節元件,很多TE進化出了順式調節序列,來模仿宿主的啟動子。在LTR轉座子中,順式調控序列和RNA聚合酶II啟動子就存在于該TE序列的兩端。LINEs轉座子的5'端也存在RNA聚合酶II啟動子。SINEs轉座子存在RNA聚合酶III的結合位點。所以對于整個逆轉座子而言,如果其是一個完整的TE,那么均存在RNA聚合酶的結合位點。
????TE的含量、形態和復制機制在很大程度上影響了其含有啟動子和調控序列。比如,LTR轉座子每次進行轉座插入時,都會在宿主基因組上形成兩個新的長末端重復序列,而這些長末端重復序列往往能夠誘導異位重組(減數分裂過程中未對齊的同源染色體之間發生的不平等交叉引起的復制稱為異位重組)。進而,導致了轉座子中的編碼序列丟失,僅剩下了長末端重復序列(Intact LTR 變成 Solo LTR)。也即LTR的轉座最終的結果是給宿主基因組增添了新的順式調控元件(上圖)。有研究顯示,在人類基因組中內源性病毒(LTR的一種)占了基因組的8%,但是其中的90%都不是完整的TE序列,僅僅是長末端重復序列。
????LINEs類的轉座子占了人類基因組的20%,但是絕大多數的LINEs轉座子也不是完整的序列,而是5'端被截斷的殘存序列(上圖),因而該類轉座子丟失了啟動調控序列。對于DNA轉座子,通常是通過“剪切粘貼”完成轉座的,其轉座的結果往往是形成了微小倒置重復序列(MITEs),這些序列同樣丟失了啟動調控序列(上圖)。所以,不同類型的轉座子其轉座之后,啟動調控序列有的留存,有的丟失。
????TE啟動子活性在空間和時間上表現出一定的差異,這種差異取決于宿主細胞的類型,以及面臨的環境壓力(比如感染等)。
???TE對宿主基因表達的影響不僅局限于生殖系細胞或者早期胚胎中,在體細胞中也同樣存在,TE插入更加傾向于發生在生殖系細胞形成的階段或者胚胎發育早期,在體細胞表達的TE不會進行跨代傳遞,對TE的進化沒有明顯的作用。
????2.TE的非隨機整合
????TE能夠模仿宿主的順式調節元件,那么如果一個TE插入到宿主基因附近,那么其在很大程度上會干擾正常宿主基因的表達。很多TE也進化出了一些機制,使得它們能夠傾向于在某些特定序列進行插入,以此提高TE擴增和擴散的幾率。比如有些TE能夠選擇性的在基因貧乏的區域或者異染色質區進行插入,這些區域猶如避風港,最大程度上減少了TE插入受到的選擇壓力。
????當然, 還有一些TE會選擇在開放轉錄活躍的染色質區進行插入。比如玉米種的Mutator
,水稻中的mPing
,酵母菌中的Tf1
和果蠅中的P
元件等,這些TE傾向于選擇宿主基因的 5’ 端進行插入。在某些逆轉錄病毒中,比如HIV-1
,其會選擇宿主基因中轉錄活躍的區域進行整合插入。一方面,有利于插入序列的擴增,另一個方面,這些插入會干擾臨近基因的表達。對基因表達的干擾不僅是對宿主有害,還有可能會被宿主所用,對宿主產生有利的影響。比如在果蠅中某些CYP450基因的調控序列插入,可以提高基因表達量,有利于抵抗外界殺蟲劑的作用。
? ? 隨著時間的延長,自然選擇和遺傳漂變(小的群體中,由于不同基因型個體生育的子代個體數有所變動而導致基因頻率的隨機波動稱為遺傳漂變)的作用會逐漸顯現,因此會模糊掉TE插入的位點選擇性。
????TE豐富的調控活性
????總體來說,TE表現的更像宿主基因組的寄生蟲,宿主本身也進化出了很多機制來抑制TE的轉錄表達。研究也證實,宿主基因組中的TE的序列,絕大多數都處于靜默非表達狀態。當然,也有很多研究發現了TE通過順式和反式作用來影響宿主基因表達的例子。TE并不像人們想的那樣一直處于靜默狀態。
????通過轉錄組學的分析發現,TE是形成組織特異性啟動子的重要原因。比如,RNA-seq顯示TE來源的啟動子形成的嵌合轉錄占了哺乳動物轉錄組的絕大部分,特別是對于胚胎發育早期的個體。在植物中,TE來源的啟動子也占了絕大部分。
????除了啟動子外,TE還能夠提供很多其他類型的順式調節元件,比如增強子enhancer
,隔離子insulator
和抑制元件等。在哺乳動物中,對于各種不同的轉錄因子,TE能夠提供5%-40%的結合位點(平均20%)。特別是LTR類型的TE,其提供的因子結合位點更多。而且,對于某一類轉錄因子,其結合位點常常來自少數幾類TE(具有一定的特異性)。因而推測,結合位點可能存在于TE的祖先序列,然后通過轉座擴散到整個基因組。
????TE來源的轉錄因子結合位點具有進化分支特異性。比如,對小鼠和人類細胞中26對同源轉錄因子結合位點的分析顯示,絕大多數都具有物種特異性。說明兩個物種自分化之后,其TE在各個物種中進行了大量擴增,形成了靈長類特異性TE和嚙齒類特異性TE。另一原因可能是這些轉錄因子結合位點在各個物種的進化過程中經歷了中性替換(中性學說認為分子水平上的大多數突變是中性或近中性的,自然選擇對它們不起作用,這些突變全靠一代又一代的隨機漂變而被保存或趨于消失,從而形成分子水平上的進化性變化或種內變異),由于不同物種中中性替換的差異導致了物種特異性。不管怎樣,這些研究都說明轉座是哺乳動物進化過程中獲得轉錄因子結合位點的重要機制。
????TE也可以作為隔離子(元件邊界)來發揮作用。這些TE序列能夠把基因組分隔成100Kb-1Mb大小不等的轉錄區段。一些研究顯示,TE序列,特別是SINEs,含有CTCF或者TRIIIC因子結合位點,這些因子具有隔離活性,并參與核結構的形成。有些TE還參與基因組三維結構的形成。總而言之,TE對基因組的染色體的高級結構的形成有重要作用。
????TE除了提供上述一些順式DNA調控元件之外,還貢獻了大量的非編碼調控RNA,比如微小miRNA, IncRNA(Long non-coding RNA)
??
??TE調控活性的生物作用
????上文說明了TE是生物基因調控的重要影響因素。那么這些調控對宿主表型有哪些影響,影響程度有多大呢?
????1.TE和宿主的競合關系
????這兒的競合關系也可以認為是宿主對TE的馴化,使得TE成為有利于宿主的一部分。大量的研究表明,不同物種中同源TE序列在進化上具有相當的保守性,提示這些TE序列可能受到負向自然選擇的作用。此外,這些TE在基因組上的分布也不是隨機均勻分布,而是傾向于分布在轉錄因子基因和發育相關基因附近。在脊椎動物進化過程中,TE為調控序列的形成提供了大量可用的非編碼序列。
????某些SINE家族序列被稱為基因組中的“活化石”。這些SINE序列在四足動物中高度保守。在小鼠中,MIR元件(Mammalian-wide interspersed repeat)插入形成了位于內含子中的增強子,它促進了Foxp3
基因的表達,而該基因又是調節性T細胞形成的重要基因,對懷孕期間母體-胎兒之間的免疫耐受有重要作用。可見該TE元件對小鼠胎盤發育有多么重要。
????此外,兩個古老的TE(MaLR和一個SINE)在哺乳動物進化中起到了下丘腦特異性增強子的作用,調節前促黑激素基因POMC
的表達。
????這些例子都說明了TE在進化中被宿主細胞所馴化,成為宿主重要的一部分。同時,這些被馴化的TE受到負向選擇作用,表現出了一定的保守性。
????2.競合TE的識別
????不同物種間競合TE的保守性意味著這些TE可能具有一定的生物學功能,但是在識別這些TE的時候有一些要注意的問題。首先,該TE必須有足夠長的進化時間,以便其能夠顯現出進化上的保守性。但是這些相對古老的TE在識別上有一定的困難,特別是在一些進化比較快的物種中(比如果蠅),中性替換可能模糊掉TE原本的樣子。在人類和小鼠中,這些相對保守的TE通常不是同源的,而是一些新生的TE插入。判斷這些較新生的TE是否為宿主所馴化就存在一定的困難,由于進化時間較短,難以識別出相應的負向選擇信號。
????盡管如此,還是有很多研究發現了一些和宿主存在競合關系,被馴化了的TE。比如,哺乳動物唾液中的淀粉酶表達源于逆轉錄LTR的插入。此外,還有哺乳動物子宮內膜中催乳素的表達等,也和TE的插入有關。
????下圖總結了幾種TE通過調節表達而影響表型的例子。
另一種用來識別被宿主馴化的TE的方法是通過基因敲除或者基因編輯。
????3.TE介導的順式調節的多樣性
????TE最先發現于玉米中,隨后在更多作物中被發現。事實上,很多人工性選擇的性狀都是通過TE對其附近基因順式調控來實現的。比如,玉米中,Hopscotch逆轉座子作為增強子插入到teosinte branched1基因中,從而改變了玉米的相應的性狀。在血橙中,copia樣的逆轉座子發揮了低溫誘導的增強子的作用,調控ruby基因的表達,從而改變了果實的顏色。
????在人工選擇的動物馴化中,TE同樣發揮了重要作用。比如在家蠶中,Taguchi(LINE)轉座子在EO基因區域的插入抑制了蟬蛹的過早成熟。在狗和家貓的馴化中,比如體型和毛色,也有TE插入的順式調節作用。
????英國蛾子體色的變化是自然選擇的經典案例,最新的研究發現,其體色變化的基礎是一個TE在cortex基因內含子中的插入。(該例子也可以看作是一種人工選擇。)
????這些例子都說明不管在植物中,還是在動物中,TE在人工選擇的過程中都發揮了巨大的作用,TE通過調節基因表達而改變了某些性狀。也提示了,某些人工選擇并非是通過SNP頻率的改變來實現的。
????4.TE和基因調控網的進化
????上文的一些例子都是TE對單個基因表達的影響,實際上TE還可以通過更為復雜的關系影響多個基因,進而影響整個通路。MER20 轉座子累積了很多cAMP介導的增強子位點,對哺乳動物子宮內膜相關基因表達有重要影響,為哺乳動物的形成奠定了基礎。MER130家族的擴增為小鼠帶來了和前腦活動相關的大量增強子,在哺乳動物新皮質層的進化中有重要意義。
????還有一些研究認為支系特異性TE驅動了基因調控網的進化。比如在過去1500萬-2500萬年時間內,小鼠特異性內源性病毒RLTR13給小鼠帶來了數百個胎盤發育相關的特異性增強子,從而促進了哺乳動物胎盤發育的多樣性。
????不過要注意的是,TE插入和基因表達的相關關系并不一定代表因果關系。TE插入到一些原本高表達的基因附近可能會導致其有更多的機會和轉錄因子結合,從而使二者表現較高的相關性。再者,如果TE導致基因表達過于劇烈,可能會受到負向選擇作用,所以那么輕微改變表達的TE可能更有機會留存,使得TE的表達和附近基因的表達水平具有相似性。
????此外,TE還可能參與染色體的劑量補償。對果蠅Drosophia miranda
新形成的X性染色體的研究發現,ISX轉座子在X染色體上提供了大量和劑量補償機制相關的結合位點,對性染色體的形成和進化起到了促進作用。
????TE調控的致病性
????盡管上文提到了很多TE被宿主馴化,成為了有利于宿主的一部分。但是畢竟TE是寄生起源的,具有自私屬性,其對宿主造成的害處也是顯而易見的。
????TE主要通過兩個機制導致宿主得病:插入致突變和染色體重排。
????生殖系細胞中新TE的插入妨礙了正常基因的表達,會導致人類一百多種遺傳病。在體細胞中,轉座和TE介導的染色體重排通常和腫瘤的發生有關。
????1.TE致病調控
????TE插入是人類基因中非常常見的結構變異,通過改變周邊基因的表達提升相關疾病的患病風險。比如C4補體系統和精神分裂癥。研究發現,C4基因內含子中攜帶內源性病毒的個體會有較高的C4表達量,進而會導致神經突觸異常,從而促進了精神分裂癥的發生。
????2.TE重新激活的原因和后果
????盡管人類基因組中含有大量的TE序列,但是大多數都處于休眠狀態。但是在很多癌細胞中,TE的表達水平明顯增高。一般認為,一些環境因素和自然過程,比如感染,細胞應激,衰老等因素會造成基因組表觀標志(如甲基化)不穩定,從而激活了TE的轉錄表達活性。
????一方面,TE的激活導致TE轉座率的升高。比如在人類中,LINE-1的低甲基化和轉錄激活導致了轉座率的升高,從而促進了某些腫瘤的發生(特別是在上皮細胞中)。最新的研究發現,LINE-1的插入是一種致癌因素,其激活了肝臟腫瘤細胞和結直腸癌的腫瘤細胞通路。
????除了插入導致突變,TE還有可能會編碼一些對細胞有害的多肽。比如,過量表達的內源性病毒的包膜蛋白,能夠造成神經元退行性病變和一些自免疫障礙。另外,在細胞質中積累過多的來自TE的核酸序列(雙鏈RNA,cDNA和DNA-RNA雜合體等)可能會有免疫增效劑作用,進而激發自身免疫反應等異常。
????3.對宿主基因的不當調節
????被激活的TE可以通過改變宿主基因的表達而致病。很多TE通過DNA甲基化而失活,但是它們一旦去甲基化激活,便可以通過順式或者反式作用造成宿主基因失調。
????雖然這種TE的異位去甲基化激活并不多見,可能僅僅是一些很小概率的隨機事件,但是一旦被激活,可能就會受到正向自然選擇的作用。比如在腫瘤發生過程中,這些TE可能賦予腫瘤細胞競爭優勢,促使腫瘤細胞大量擴增。
????TE大量表達的非編碼RNA也可能存在致癌屬性。比如BRAF激活的非編碼RNA(BANCR)在黑色素瘤細胞中大量存在,促進了細胞的大量增殖和遷移。在一些腺癌中,EVADR(屬于IncRNA)有大量表達,其來源就是內源性病毒MER48。雖然這些RNA不編碼蛋白,但是對腫瘤的發生有促進作用。
????除了上述在人類中的例子,在油棕櫚中,MANTLED基因的內含子中存在Karma轉座子插入,如果其去甲基化激活,會導致轉錄RNA提前截斷,進而表現出果實的異常。
????4.TE是一把雙刃劍
????對于宿主而言,這些致病性TE會受到負向選擇壓力,在群體中被逐漸清除掉。但是也可能這些TE中只有很小一部分在某些個體中表現出致病性,在其他大部分個體中對宿主適應性影響不大。這種情況下,自然選擇可能不足以將這些致病性TE從群體中清除。還有很多TE被宿主馴化,成為對宿主有利的因子。但是這種TE可能會是一把雙刃劍,稍有不慎就有可能對宿主產生有害的作用。
????比如,在人類中,AIM2基因編碼一些重要的免疫因子,同時也能夠抑制腫瘤的發生。MER41轉座元件能夠使得AIM2基因響應干擾素,對AIM2基因有重要作用。但是某些情況下,MER41轉座元件會被超甲基化,進而變成沉默的TE。此時,AIM2基因的轉錄表達就會發生異常,進而導致腫瘤和自身免疫病的發生。所以對于宿主來說,MER41轉座元件既帶來了有利的一面,也存在潛在的有害風險。
????結論和展望
????過去十余年,人們對TE有了較多的研究,對TE如何影響基因組進化有了進一步的了解。通過在基因組水平上對TE的研究,發現TE涉及到了復雜的機制和生化特性,使得人們認識到TE不僅僅再是基因組的“寄生元件”,而是宿主基因組基因調控的重要部分。TE的插入致突和基因重排可以改變宿主基因表達。不過,我們還需要更多的實驗證據來支持目前的結論。
????此外,通過進化分析和回顧性分析的方法,我們還需要對一些古老的TE進行研究,通過對這些TE的研究能夠加深我們對新生TE的認識,有助于我們理解TE在當代生物中是怎樣影響基因調控網絡的。同時,通過實時進化實驗來觀測TE面對選擇壓力時的表現,這也有助于我們理解TE對基因調控的作用。
????盡管一些例子已經證實了TE的激活和不當調控會造成腫瘤的發生,但實際上,不僅限于腫瘤,很多生理病理過程,如衰老、神經系統疾病、自身免疫病等都和TE的激活有關。但是我們目前對這些過程的理解還不全面。未來技術的進步會促使我們對TE的致病性有更加深入的認識。