可變剪切——可變剪接及其表觀遺傳調控

Original 表觀遺傳學習小組 Epigenetics表觀遺傳學

本文根據 2016 年 8 月復旦大學倪挺教授在「表觀基因組學暑期國際講習班」中的報告整理而成,本文采用第一人稱敘述,文中的“我”皆指倪挺教授。報告原視頻詳見:表觀遺傳系列視頻13 | 復旦倪挺:表觀遺傳調控與基因剪接(附PPT),視頻全長約 2h34min,文字約 1.6 萬字。雖然是四年前的視頻,但內容依然不過時,可幫助我們快速建立對轉錄水平表觀調控的認識。
倪挺博士,復旦大學博士生導師。2000 年獲北京大學生命科學學院生物化學及分子生物學系學士學位,2000-2006 年碩博連讀于北京大學生命科學學院,并于 2006 年獲植物學博士學位。2007-2010 年在美國杜克大學基因組科學與政策研究所從事博士后研究。2010-2012 年在美國國立衛生研究院 (NIH) 擔任助理研究員 (Research Fellow)。2012 年受聘為復旦大學生命科學學院研究員。以下為正文:大家好,今天跟大家分享「表觀遺傳與基因剪接」。我此前的研究主要針對轉錄過程開發一些方法,探究轉錄如何起始、中間調控機制以及 3’-端的加尾,此外還包括 3’-UTR和反義 RNA 的調控等。2012 年來到復旦大學后,我主要選擇了兩個體系:細胞衰老和細胞活化,聚焦 RNA 水平的調控,特別關注內含子保留這種可變剪接類型,及其在 T 細胞活化過程中的功能;此外,還研究選擇性多聚腺苷酸化(alternative polyadenylation),即決定 RNA 在哪個位置加上 Poly(A) 尾巴的機制,從而對 mRNA 的命運產生影響。研究手段主要采用干濕結合,試圖觀察新現象并探討其生物學機制。

圖1. 倪挺研究員的主要研究內容

此前頡偉老師其實已經把 DNA 甲基化和組蛋白修飾之間的關系講得比較清楚了,DNA 甲基化可以影響組蛋白修飾,反過來,組蛋白修飾也可以影響 DNA 甲基化。我們今天講的選擇性剪接,能否與 DNA 甲基化和組蛋白修飾聯系在一起呢?

圖2.可變剪接與表觀遺傳修飾之間的聯系

通過這個課程,希望大家思考圖 2 中的這四個箭頭是否成立?如果成立,證據是什么?可能的機制是什么?這四個問題的內容是: (1) 組蛋白修飾是否可以影響 RNA 剪接?(2) RNA 剪接是否可以影響組蛋白修飾?(3) DNA 甲基化是否會影響 RNA 剪接?(4) RNA 剪接本身對 DNA 甲基化有沒有影響?針對這幾個主要問題,我的課分為以下六個部分: (1) 首先回顧可變剪接的生物學意義;(2) 有了意義之后,我們想要更好地去檢測它,從單基因的層面如何檢測和驗證,以及如何檢測整個基因組的變化;(3) 如果存在這樣的變化,上游的調控機制是什么?是什么東西導致了它的改變?(4) 組蛋白修飾和 (5) DNA 甲基化跟它之間的關系是怎樣的?(6) 染色質修飾與基因轉錄終止的關系。選擇性剪接是中間的環節,mRNA 的加工最后一個環節是加上 Poly(A) 尾巴,必須完成這個過程,mRNA 才能發揮它的作用。

可變剪接的生物學意義

現代的遺傳學主要探究基因型和環境如何相互作用,從而決定生物的表型。在這個框架下,中心法則至關重要,也就是說,基因型是如何通過表達產生蛋白質,從而對表型產生影響。在這個過程中,環境可以通過多種方式發揮作用,比如可能引起 DNA 的改變;除了引起 DNA 的改變,環境更多地只影響基因的表達,那么通過什么方式呢?我們認為,DNA 甲基化和組蛋白修飾以及其他的因素在里面起到非常重要的作用,即可以通過影響中心法則的中間環節影響表型。


圖3. 基因和環境共同作用決定表型

中心法則看起來非常簡單,DNA 通過轉錄產生 RNA,RNA 通過翻譯產生蛋白質。但在這個簡單的過程中,存在非常復雜的調控。在原核和真核生物中,雖然執行的都是中心法則,但調控不一樣。在原核生物中,轉錄和翻譯幾乎是同時進行的,轉錄出來的 RNA 馬上有核糖體結合上去翻譯出蛋白質。但真核生物有細胞核,轉錄出來的 mRNA 需要加工為成熟的 mRNA,被轉移到細胞質中,才能發揮它的作用;在這個過程中,存在位置的調控;另外,mRNA 還面臨著非常復雜的加工。因此,原核和真核生物在遺傳信息的流動和調控上是非常不一樣的。


圖4. 遺傳信息流在原核與真核細胞間的差別

我們仔細看一下真核生物的基因表達調控 (圖5),這是一個多步驟的調控,分為細胞核和細胞質中的調控。在細胞核里面,DNA 甲基化和染色質結構的改變可調控基因轉錄,還存在轉錄的起始和轉錄過程的調控。最初轉錄出來的是初始轉錄本,里面包含內含子,在此后的加工過程中,5’-端需要加上帽子,內含子需要切掉,還需要加上 Poly(A) 尾巴,才能變成成熟的 mRNA。在這個過程中,還有一系列的蛋白結合上去,最后輸出到細胞質中。在細胞質中,會面臨多重命運,一開始會翻譯,翻譯到一定豐度后,還會面臨降解的命運,不同 mRNA 降解的速率也不一樣,這里面也存在一些調控。在蛋白質水平,翻譯出來的多肽也面臨著蛋白質的加工和折疊,以及蛋白質激活(比如磷酸化或去磷酸化)和蛋白質降解。真核生物的基因表達調控是一個多步驟的非常復雜的過程,任何一個環節的失調都可能導致生理的失衡,最終導致疾病。

圖5. 真核生物基因表達是個多步調控過程

舉幾個例子,第一個例子是早衰 (premature),核纖層蛋白基因 LMNA 的可變剪接的失衡是導致早衰最重要的原因。在早期對病理進行檢查時發現,在父母中都沒有出現突變,但是在小孩中出現了突變,即這是一種新發突變 (de novo mutation),這種突變并不是由父代傳給子代的,但這種突變會導致很嚴重的問題,從基因的角度來看,這種突變對轉錄產物造成很嚴重的影響。在正常情況下,LMNA 有三個外顯子形成正常的剪接,翻譯出的蛋白含有 C-端結構域;但是由于突變的存在,導致了剪接方式的改變,這種突變使它發生了 5’-可變剪接位點 (alternative site) 的選擇,使得可翻譯的區域變短了,最后使得蛋白質的 C-端完全不一樣,失去定位的信號,蛋白在細胞核的分布變得紊亂。
圖6. 核纖層結構蛋白基因 *LMNA *突變影響可變剪接,最終導致早衰

核纖層蛋白支撐著細胞的整個架構,如果發生紊亂的話,原來的細胞核構架坍塌。這種變化跟細胞的整體表達有關,核纖層的架構支撐了很多基因的表達,這樣一些關鍵結構蛋白的失衡,導致了核纖層的坍塌,進而影響很多下游基因表達的改變,最終導致了早衰的表型。早衰兒在很早的時候就去世了。在這個例子中,我們可以看到,一個非常關鍵基因的可變剪接的變化就導致了早衰的產生,這提示可變剪接在生物體中十分重要。另一個例子,不是 DNA 層面的突變,而是表達層面的。RBM4 是一個 RNA 結合蛋白,同時參與剪接過程,這個蛋白在很多癌癥病人中是下降的,導致了很多基因剪接方式的改變。如果 RBM4 表達較高,它會讓基因選擇一種比較短的形式進行剪接;如果它的表達量低的話,會讓基因選擇一種比較長的形式,而這種長的形式會抑制細胞的死亡,即讓細胞無限增殖,導致了癌癥的發生和發展。在這個過程中,只有 RBM4 保持合適的數量,基因的剪接才會正常,細胞呈現正常的狀態;基因的表達如果改變的話,會引起下游一系列的變化。
圖7. *RBM4*基因表達量下降促進腫瘤發展和轉移[1]

特別要強調的是,剪接依賴于順式作用元件(DNA 上的序列)和反式作用因子(與這些序列結合的蛋白)。而這兩個例子,一個是可變剪接的順式作用元件的突變,另一個是反式作用因子剪接因子的改變,這兩者都可能導致剪接方式的改變,最終引起疾病??勺兗艚邮堑鞍踪|組豐富度的重要貢獻者,但近來的研究發現,很多基因也存在著很多 Poly(A) 位點的選擇 (alternative cleavage and polyadenylation, APA),這種選擇也很大程度上貢獻了蛋白質組的選擇性。在這個例子中,并沒有改變編碼區的序列,翻譯出來的蛋白質是一樣的,但是由于選擇了近端的 Poly(A)位點,使得多出來的 3’-UTR 不僅被 miRNA 調控,同時也會被特殊的 RNA 結合蛋白調控。miRNA 在 3’-UTR 的結合會切割 mRNA,或者抑制 mRNA 的翻譯,最終使得蛋白水平下降,有些 RNA 結合蛋白也會起到類似的效果。有的是抑制,有的是促進,效果迥異,取決于序列和蛋白本身。通過這種方式,逃脫 miRNA 的調控。


圖8. mRNA 3'-端 Poly(A) 加尾異常可導致癌變 [2]

2009 年的一項研究發現,相對于癌旁細胞,癌細胞中有很多傾向于使用短的 3’-UTR 的轉錄本,即轉錄本是以短的形式存在的,比如 IGF2BP1/IMP-1 因為使用短的 Poly(A) 而逃脫了 miRNA 的調控[3],使得蛋白質水平急劇上升,導致細胞的無限增殖,是引起細胞癌變的重要因素。這個例子說明,RNA 加工過程(特別是可變剪接和末端的加工)的失衡也是引起疾病的重要因素。

可變剪接的檢測及生信分析策略

研究可變剪接和 3’-端的加工具有重要的意義,可以幫我們理解很多重要的生物學事件。既然它們如此重要,那么如何更好地發現和分析呢?這就涉及到可變剪接的檢測及生信分析策略。

可變剪接的類型

大部分基因含有內含子,在編碼的過程中,內含子的信息不需要傳遞給蛋白質。在轉錄完成后形成的初始 mRNA 后,所有的內含子都切掉,這是一種正常的剪接方式,即組成型剪接 (constitutive splicing)。可變剪接 (alternative splicing) 跟它有一定區別,例如在正常情況下,三個外顯子在一起;如果發生了可變剪接,由于某些原因中間的外顯子被跳過,形成的 mRNA 不一樣,這種序列的不一樣可能使蛋白質中間少了一段,或者中間的外顯子不是 3 的倍數的話,那么它會使得后面的蛋白質完全不一樣了,改變了蛋白質的組成。


圖9. 可變剪接的 5 種形式(圖片來自:https://bio.libretexts.org)

可變剪接分為哪幾種類型呢?復雜的話可分為 8 種,簡單的看至少有 5 種比較重要。第一種叫外顯子跳躍 (exon skipping),中間的外顯子可以被跳掉,取決于中間外顯子兩邊的順式作用元件是什么以及有哪些反式作用因子跟它結合。另一種類型,5’-端的選擇,比如我們剛才舉的例子,RBM4 去調控基因剪接,實際上就是通過這種方式。5’-端是看具體選擇哪個位置,取決于位點的強弱。3’-端面臨同樣的情況,到底選擇哪個3’-端,這也就是 alternative 3’ splice site;另一種比較有意思的是互斥外顯子 (mutually exclusive exons),中間有兩個外顯子,但是細胞只會選擇中間的一個來發揮作用,在蛋白質上的體現是,蛋白質的 domain 是換成這個還是那個,從而決定了蛋白質的功能。另一個是內含子保留,在很多時候,那段序列被認為是內含子,被剪切掉了,但是在特殊的情況下,細胞認為這可能是外顯子的信號,在這個過程中會被保留下來,即內含子保留。這幾種方式,從造成的效應上來看,它們改變蛋白的“質”和“量”?!百|”的話,在早衰癥的例子中,蛋白質的 C-端完全不一樣,更多的是改變了蛋白質的“質”;如何理解改變蛋白質的“量”呢,在這幾個例子中,好像都沒有體現。實際上,一個基因可變剪接,并不是切掉或者完全保留,而是有一部分是剪切掉,有一部分是留著的,如果說被剪切掉的 isoform(異構體)沒有功能的話,與最后翻譯出來的另一種剪接形式的異構體形成了競爭關系,原來 100% 都剪接掉了,現在分流給了另一個不翻譯的轉錄本,原來那個翻譯的蛋白的量就相對減少,這就是改變了特定蛋白的量。所以,可變剪接至少可以通過改變蛋白的“質”和“量”對下游產生影響。

可變剪接的鑒定及生信分析策略

如何發現可變剪接?可通過 RNA-seq 和 RT-PCR。最早的時候,大家實際上是在單基因上進行驗證,可通過 RT-PCR 或 Northern Blot 來看;如果要從整個基因組水平來看的話,早期可通過 microarray,設計剪切特異性的探針就能夠達到這個目的。但近年來,通過 RNA-seq 結合一些生信的辦法就可以實現。


圖10. 單基因水平檢測可變剪接

從原理性上講,如果有幾個不同的外顯子,可在不同的外顯子上設計引物,或者說跨外顯子的引物。如果發生了外顯子跳躍,設計類似圖 10 中的引物,兩個不同的 isoform 擴增出來的產物是不一樣的,直接跑膠就可以看到差別。實際上并不是一個有或無,可能是強和弱的關系,這個只是個示意圖。對于 Northern Blot,同樣也是設計 jumping 特異性的探針,跳過外顯子區來設計,這是比較常規的思路。


圖11. 轉錄組水平檢測可變剪接

對于整個基因組,也可以設計一些 jumping 特異的探針,如果你看到有信號的話,說明這個 isoform 存在,信號強弱可以初步反映這個異構體豐度的高低。對于 RNA-seq,它實際上測到的是一個短序列,通過這個短序列去比對到基因組和轉錄組上,其實可以區分。通過這樣一種方式,就可以知道幾個不同的 isoform 之間的比例變化。
圖11. RNA-seq的實驗及生物信息學分析全過程 [4]

目前 RNA-seq 是發現全基因組剪接變化最有效的方法,當然這里面還存在著諸多問題和挑戰。RNA-seq 通常要做兩輪 Poly(A) 選擇,把這些短序列去 mapping,通過分析計算有沒有出現外顯子的跳躍或者其他形式,還可以比較兩個不同組織或者處理前后的改變,幫助你推斷它可能參與的生物學過程。我想強調的一點是,數據產生的好壞對你后面的分析是非常重要的。如果實驗有問題,后面的分析 pipeline 再靠譜也無濟于事。比如說處理正常和疾病的兩組樣本,今天做正常的,明天做疾病的,這個時候再進行比較就可能出問題,因為存在批次效應??勺兗艚臃治錾婕暗倪^程很多,包括怎樣把這些位置 mapping 回去,怎樣組裝轉錄本以及推測其表達量,這個表達量當然是整體的表達量,還要根據 junction 的位置去預測不同 isoform 的表達量,雖然不一定那么準,但可在基因表達比較高時給你一個還不錯的參考,然后還可以進行一些可視化。接下來還有一些對于剪接特異性的分析,有各種不同的軟件,都有它自己的優缺點,一定要非常仔細的去看它的 manual 以及相關文章,還要和作者進行密切的交流。利用 RNA-seq 進行初步的基因表達差異和轉錄本分析,TopHat 目前用的比較多。原理上是怎么區分不同的轉錄本的呢?舉個例子,一個基因有三個轉錄本,A、B 兩個轉錄本的轉錄起始位點是一樣的,但另一個轉錄本 C,用了不同的轉錄起始位點(在內含子區域),對于使用相同的兩個轉錄起始位點的話,它唯一的差別實際上是內含子跳躍與否。對于這樣的三個基因,如果基因表達比較高,測的短序列 reads 比較高,你可以初步地對每個占多少比例進行分析,用的策略是看它特有的 reads。


圖12. 可區分高表達基因的具有明顯特征的不同轉錄本 [5]

比如對于 A、B,如果看到第一個外顯子,你至少可以知道 A、B 兩個轉錄本的總量,那么在這兩個轉錄本中怎樣區分比例多少,就看中間外顯子信號的多少,實際上就是用 isoform 特有的區域來區分;對于轉錄本 C,你可以看到 C 中左邊的信號。通過這樣的比較,你就可以區分不同的特征的比例多少,前提是基因的表達量比較高,基因測序的 reads 分布比較均勻,可以給你大致的線索,然后你再設計一些 isoform 特異性的引物來驗證。有了這些之后,你可以進行初步的推斷。你可以運用一些工具畫出三個或者四個不同轉錄本在不同細胞或者不同時期的變化。如果看到了差別,僅說明轉錄本存在與否,但對于生物學過程來說,這個存在與否的調控看不出來,它沒有動態的改變,而如果特定的轉錄本存在動態改變的話,實際上是對它功能的暗示,在這個過程中,它有可能是參與了這個過程,當然也有可能是一個伴隨的現象,但至少可以給你一些線索。


圖 13. CummeRbund 工具可畫出不同轉錄本的表達動態圖 [5]

在可視化的展示(圖14)中,對 regucalcin基因來講,兩個不同狀態之間基因總體的表達量差了約兩倍,但如果這個基因有四種不同的 isoform,那么是每個 isoform 都增加了兩倍,還是說其中只有幾個 isoform 發生了改變?因為研究功能時要聚焦于不同的 isoform,不同 isoform 翻譯的蛋白可能不一樣,這個時候能夠把不同 isoform 區分開的話,你可能就會發現,實際上其中一個 isoform 占的比例比較大,可能是它增加了兩倍,所以后面的功能驗證或分析就可以集中在這個 isoform 上。通過這樣的可視化,你也知道原來這個 isoform 是真的存在的,通過這樣一個側面的證據可以幫助你更好地去鎖定研究對象。

圖14. 特定基因* regucalcin *的可視化展示

這個實際上是一個很整體很籠統的分析,具體做的時候實際上存在很多的挑戰。相對于基因總體的表達量來說,分析它的可變剪接的難度是相對較高的。以前測的序列比較短,現在雖然測的比較長,但總體上來講仍然不是那么長,比如說能夠覆蓋兩個 exon,但覆蓋不了整個轉錄本,你可能只能發現這個內含子和這個外顯子包括與否,但如果說這邊有一個外顯子跳躍,后面還有一個外顯子跳躍,你無法判斷這兩個外顯子的跳躍是不是在一個轉錄本上,短的序列仍然不能回答。所以以后在讀長上要有突破,包括加強測序質量,測序的時候末端序列不是那么準的,但我們去看 junction reads,通常把它一劈為二,這邊多一點,這邊少一點,mapping 回去;有的地方測序質量比較差的話,mapping 回去也會差,mapping 出來的基因可能也是錯的,這是我們需要注意的。另一個我們需要注意的問題是讀長分布的不均勻。測到的 reads 分布在轉錄本的不同區域,但你去看各種不同的 track 圖時,有的地方特別高,有的地方特別低,原因多種多樣。比如有的地方 GC 含量特別高,就不容易測出來,特別的低也不容易測出來,或者有重復序列。這樣的 reads mapping 回去的時候,它不知道是這個基因的,所有我們就把它過濾掉了,因為沒辦法告訴你是哪個地方來源的。這個時候 junction reads 比較高的地方,你就能夠判斷得比較準,但有的 junction 根本沒有 reads 在這個地方 cover,這時候也會對可變剪切的分析造成影響。這種基因內部分布的不均勻可能是導致 RNA-seq 分析逐漸下降的一個很重要的原因。另外,有些剪切本本身表達量就比較低,意味著 reads 中能夠貢獻到這個地方的量就特別的小。對可變剪切分析而言,你可能只能分析表達量相對比較高的地方,至少可以給你得出一些線索。另外,不同的分析軟件得到的結果是不一樣的,原因多種多樣,可能只能根據技術不停的發展和認識的深入去克服這個問題。但我認為很重要的一個標準是怎樣更好地和實驗結合起來,如果分析的好的話,可能 60-70% 可以驗證;分析不好的話,假陽性特別高,只有 20-30% 能夠驗證。在開始做的時候,我的建議是你寧愿讓標準設的嚴一點,發現的少一點,但讓假陽性低一點,可驗證程度高一點,可能是一個更好的策略。剛才講了不均一性,簡單來講可減少 PCR 的循環數,因為 PCR 循環數減少的話,這種情況稍微得到改善,但最好的是你不做任何的擴增,但除非起始的 RNA 的量特別多,一般 RNA 比較少,尤其像做少量細胞甚至單細胞 RNA-seq 的時候,你必須進行一些擴增,擴增帶來的問題就是不均一性會更強,但實際上這是對你要研究這個問題的妥協,你為了研究它,你只能在目前技術不允許的前提下,你只能用一個相對將就的辦法,但至少可以給你拿到一些新的發現。另外,去開發更高效可靠的分析軟件。當然說起來容易,做起來不一定。另外增加讀長,如果說我們能夠做到一個全轉錄本測序的話,實際上是一個比較好的策略。因為剛開始講的,如果不同的剪接事件在同一個 isoform 上發生的話,存在一些短序列,實際上是沒有辦法解決的,這個可以用三代測序,但這里面也存在著一些問題,因為它雖然能夠測全長,但是錯誤率比較高,價格也非常貴,而且同樣的價格覆蓋的轉錄本是比較少的,所以這個也有賴于技術的進步。

基因可變剪接的調控——順式作用元件和反式作用因子

接下來我們講一下可變剪接的調控,可變剪接的調控是非常復雜的,概括一下我個人認為可以分為三點,一個是順式作用元件,就是 DNA 的序列是什么;第二個是反式作用因子,哪些 RNA 結合蛋白在這個區域與它結合;這兩者之間的組合很大程度上決定了可變剪接是如何發生的;第三是一些表觀遺傳因子可以通過影響順式作用元件和反式作用因子對它整個進行調控。我們對整個調控層面進行理解也可分為三個層面,第一個是 RNA 層面,反式作用因子和順式作用元件怎樣互作,互作的網絡可能是比較復雜的。第二個是轉錄機器層面的調控,就是 RNA 聚合酶的快慢或者所反映出來的延伸速度實際上在很多時候決定了剪接位點。第三個是表觀遺傳層面,不管是染色質結構、DNA 甲基化、組蛋白修飾,甚至 RNA 本身的修飾都會發揮作用。先來講順式作用元件和反式作用因子。順式作用元件里面很重要的一個因素就是剪接位點本身的強弱決定了在這個位置是否會跳掉,如果說它更愿意與后面外顯子結合的話,中間的外顯子就容易被跳掉,所以涉及到位置的競爭。另外,除了序列本身,我們知道不同的 U1 和 U2 以及其他的一些 snRNP 實際上跟特定的序列結合,而這種結合的 pairing 非常重要。


圖15. 順式作用元件:剪接位點本身的強弱 [6]

這里有個概念叫 exon definition,它是怎樣定義呢?如圖 15 所示,如果 5’SS 結合了 U1,3’SS 結合了 U2,這個時候就告訴剪接機器這個位置是外顯子,如果有這樣的信息外顯子是被保留的。但如果是另外一種情況,前一個外顯子的 5’SS 與中間外顯子的 3’SS 形成一個 cap,中間外顯子的 5’SS 與下一個外顯子的 3’SS 形成一個 cap,這個剪切機器會更多地識別這兩個 cap,造成外顯子的跳躍,所以在這個時候,順式作用元件和反式作用因子是一個相互的作用。


圖16. 反式作用因子如何與順式作用元件互作 [6]

總的來看,可變剪接的調控有兩個特征:1.序列依賴性,2.位置依賴性。我們該如何理解呢?很多調控序列在外顯子內或內含子里面,先看一下在外顯子內部的這些序列,包括 ESE 和 ESS,第一個 E 代表 exon,第二個代表 splicing,第三個是 enhancer 或者 silencer,即促進或抑制剪接。對不同的序列本身,有不同的 RNA 結合蛋白結合。通常來講,兩類 RNA 結合蛋白或剪接因子是比較重要的,一個是 SR 蛋白,即絲氨酸和精氨酸富集的蛋白;另外一種是 hnRNP,它們識別的位點不一樣,如果 SR 結合在剪接的 enhancer 上,那么告訴這個位點是需要選擇的,最終會造成圖 16 中上圖的跳躍;如果 hnRNP 結合在 ESS 上,那么告知這個位點不要剪接,這樣造成了外顯子跳躍。所以在 exon 上的序列,其實跟反式作用因子相互作用就能夠決定外顯子的保留與否;當然,問題沒有這么那么簡單,即便對同一個轉錄因子的話,這個時候涉及到位置效應,它結合到不同地方,也能夠調控剪接方向,比如說它結合在上游的 intron 或 exon 里面的話,起到抑制作用;如果結合在下游的 intron 上面,對它產生促進作用,所以這樣導致了即便有序列和剪接因子的話,不同位置的結合,效應是不一樣的。我們可以簡單理解,第一種情況是序列依賴性,第二種情況是位置依賴性,讓調控變得異常復雜。


圖17. 順式作用元件對剪接位點的選擇既可以正向也可以反向 [6]

剛才我們講到了 exon 里面的結合的效應,intron 里面的結合也會有同樣的效應,有的是促進,有的是抑制,即在內含子和外顯子里面都有正向和負向的元件。既然存在這些元件,怎樣才能更好地發現和鑒定這些 DNA 序列到底起到什么作用,這個時候涉及到用 mini 基因進行篩選。


圖18. 如何設計實驗篩選對剪接有促進或抑制作用的順式作用元件 [6]

比如我們想要篩選 ESE,一個簡單的辦法是,把這個地方做成簡單的隨機序列庫,如果說這個序列對于外顯子保留是有作用的話,就能夠看到相應的 isoform,通過隨機序列不停的選擇,最后細胞里面出現更多的保留形式 isoform 的話,那么中間的序列更多的是 ESE。對于外顯子里面的 silencer,用圖 18 右上圖的那個質粒來鑒定,如果外顯子跳躍,兩端正好拼成一個 GFP 序列,找到含有熒光的細胞,然后在細胞里面去看序列是什么,就能夠找到讓外顯子跳躍的序列。如果要找到 intron 去除的序列,可以在圖 18 左下圖中藍色區域設計一個隨機的序列,如果出現 GFP,說明 intron 被很好地切割掉了,那么這個序列就是促進內含子切割的序列。另一個是 exon skipping,怎樣找到下游 intron 上的一些序列,能夠促進 exon 的 skipping,可以在圖 18 右下圖中藍色區域設計,如果出現 GFP,證明確實出現了 exon skip。


圖19. 通過控制核心剪接機器的組裝來調控可變剪接 [6]

除了順式作用元件和反式作用因子,其實剪接調控和剪接體本身也有密切聯系。如果 U1 和 U2 作為 tag 的話,那么中間的序列就定義為 exon。如果說有一些因子能夠在那里進行競爭,那么 U1 不跟它直接結合,這個時候 exon definition 其實就發生了一些改變,中間的外顯子可能被跳躍掉,這種競爭關系也是可以存在的。實際上,不光是外顯子的序列,exon enhancer 和蛋白本身就能夠對剪接進行促進,幾個因素結合在一起發揮作用。圖 19 中的 c 圖,U1 和 U2 形成 pair 以后,如果有一個 ISS,實際上會造成 intron retention,這樣的順式作用元件或招募反式作用因子 PTB,就能夠影響 intron definition,讓它成為一個 exon,剪接機器就不再把這個 intron 給切割掉了,這是 intron retention 的一種機制。還可以對 U1 本身的占位進行調控,如果沒有 U1 的話,intron definition 也就沒有了。通過這樣一種比較復雜的方式,決定了 intron 被切割與否,或外顯子被跳躍與否。這些所有講的都是在 RNA 層面進行的調控,第二個層面是發生在轉錄機器上,具體來講,是 RNA 聚合酶 II 在這個地方跑的快還是慢,研究者在果蠅中發現了一個 RNA Pol II 變慢的突變體,發現在 RNA Pol II 快慢兩種情況下,一些基因的可變剪接是不一樣的。


圖20. RNA 聚合酶 II (Pol II) 的延伸速度可決定特定外顯子的跳躍與否[7]

當 RNA 聚合酶 II 跑的很快時,中間是一個很弱的 3’SS,根本沒有來得及去剪切,這個時候強的 3’SS 占了主導,原來比較弱的位點處發生了 exon skipping,這個過程中并沒有其他反式作用因子來參與。如果轉錄的時候相對比較慢,這個時候剪切機器有足夠的時間來識別比較弱的剪切位點,這樣就可以發生正常的剪切,此時 exon 包含。在這個例子中,弱的剪切信號可以通過 RNA 聚合酶 II 跑的快慢決定包含與否,這是一個最簡單直觀的例子。這個方式聽起來很簡單,也很合理,較慢的 Pol II 延伸速度一定導致外顯子的包含嗎?生物學里面總能找到例外。這個時候,可以把反式作用因子也引進來。Pol II 跑的比較慢的時候,雖然可能發生了正常的剪接,但是 Pol II 上同時還結合了抑制性的反式作用因子的話,可以發生外顯子跳躍。你會發現,后面的很多染色質跟它的調控,無非都是通過這種套路來解釋,有了方向以后,再去找,到底是哪個反式作用因子,是不是真的能解釋這個現象?從原理上,不難提出假說。


圖21. 通過特定信號通路來調控細胞核內的可變剪接 [6]

我們整個組織細胞是一個動態的過程,剪接如何發生以及被調控,可以通過細胞外的信號傳遞進來,這些通路發生改變后,通過級聯反應,可改變特定蛋白的磷酸化和其他修飾,而剪接因子也可以發生很多修飾,這些修飾發生改變,也可以調控細胞核中的剪接事件發生的多少,通過這種方式,就可以將剛才講的剪接方式與外界的因素聯系在一起,在生理或病理情況下,可能就是通過這種形式來體現的。

組蛋白修飾與基因可變剪接

既然我們已經知道了比較基礎的調控方式,怎么樣解釋組蛋白和基因可變剪接的關系?在轉錄過程中,之前我們的模式圖顯示,RNA 離開染色體后單獨加工;如果我們去看實際情況,轉錄出來的 RNA 和各種組蛋白修飾、RNA 聚合酶 II 還是連成了一個整體,在它還沒有從 DNA/染色質中下來的時候,物理空間是相鄰的,而這樣一種相鄰為兩者之間的相互關系提供了一種可能性——RNA 上可以結合一些組蛋白修飾的酶,組蛋白修飾的酶可以對特定的位點加上修飾;反過來,這些修飾可以通過其他方式結合一些剪接因子,有可能作用在 RNA 上,這樣就存在剪接調控。當然,具體是哪些分子參與,哪些組蛋白修飾發揮作用,還需要具體鑒定。


圖22. 轉錄過程中 pre-mRNA 與組蛋白修飾間有物理上的相鄰 [8]

我們從不同組蛋白修飾在基因區域上的分布來看,很多 marker 在啟動子區域,標記基因是否活躍;在活躍基因的內部,還有各種不同的修飾,中間的一些組蛋白修飾與可變剪接關系可能比較緊密。從位置上,我們可以猜測,如果發生修飾的話,中間的修飾對剪接的影響可能更大。舉個例子,染色體中含有一個比較弱的剪接位點,中間有不同的核小體分布,以及組蛋白修飾,這些可以影響 RNA 聚合酶 II 的延伸速度。在比較弱的剪接位點,延伸速度比較快的話,就發生了跳躍;延伸速度比較慢的話,外顯子就能保留。所以,下半部分的機制,完全是借用了 RNA 聚合酶 II 的延伸速度的快慢,唯一需要證明的是,特定組蛋白修飾和核小體分布是否會影響 RNA 聚合酶的快慢。很多機制上的研究,只要把重要的一環證明,這樣一種機制就可能成立。


圖23. 核小體密度決定 RNA Pol II 延伸速度,Pol II 速度決定外顯子跳躍 [9]

另外一種調控方式,特定組蛋白修飾(比如 H3K36me3)的 reader,進一步可以結合剪接因子,可以促進也可以是抑制。如果修飾不存在,或者換成其他修飾了,即便你有splicing factor,這種組蛋白修飾仍然不能對可變剪接進行調控,這樣就造成了外顯子保留。要么在特定位點招募了一些特定蛋白,這個蛋白只要跟剪接調控因子結合在一起,就能夠有效地調控剪接。當然,有個前提是,里面有個位點是比較弱的,因為如果比較強的話,可能根本就不需要調控,或者也沒辦法調控。


圖24. 組蛋白修飾通過招募特定 reader 進而結合剪接因子從而影響可變剪接 [9]

具體來講,文獻中還報道了其他組蛋白修飾的 reader,比如 H3ac、H3K4me3、H3K9me3,也會招募其他剪接因子,在特定的位點調控可變剪接。如何發現組蛋白修飾對可變剪接的影響?從轉錄組層面,如果你關心特定的組蛋白修飾,你可以看它改變前后一些組蛋白修飾酶的改變,可能會影響組蛋白修飾的改變,然后進行 ChIP-seq,就知道組蛋白修飾分布的情況;再做 RNA-seq,看一下 splicing 的改變??磧烧咧g的關聯。進行一些分析和驗證。在單基因水平上驗證,采用 RT-PCR、Northern Blot、ChIP-PCR 等等。這里我們舉一個例子,是藍斐老師他們發現的 H3.3K36me3,通過 BS69 并招募剪接因子復合物,調控特定基因的 intron retention。在正常細胞和 BS69 敲低細胞中做 RNA-seq,進行生信分析,發現 BS69 影響內含子保留。
圖25. 轉錄組水平系統發現 [10]

為什么呢?植物中的 intron retention 是比較多的,而動物中一個因素改變后,更多的是改變其他的可變剪接類型,比如 exon skipping,但他們發現的 intron retention 是改變最顯著的,這樣就可以建立 BS69 與 intron retention 的聯系。而且發現基因表達也出現改變,跟我們的結果也是比較吻合的,而且他們也在單基因水平上進行了驗證。通過這個例子,回答了中間一個環節,組蛋白修飾至少可以通過兩種方式影響 RNA 剪接,那么反過來是不是成立的?RNA 剪接會不會影響組蛋白修飾呢?


圖 26. 剪接抑制劑可顯著改變 H3K36me3 和 Pol II 分布 [11]

如果要驗證可變剪接改變對組蛋白修飾的影響,首先要改變可變剪接,研究者用了化學藥物,抑制可變剪接的效率,后來進一步證明,這樣一種藥物模擬了剪接位點的突變,這樣就改變了可變剪接,然后做 ChIP-seq,發現 H3K36me3 分布顯著改變,而且也發現 RNA 聚合酶 II 的分布也發生了與 H3K36me3 類似的改變,這暗示剪接的改變很可能影響組蛋白修飾,而且很可能與 RNA 聚合酶 II 位置上的變動有關。進一步的機制還不是很清楚,只是提供了中間的線索。但至少證明了一點,可變剪接可能影響組蛋白修飾。


圖27. RNA 結合蛋白可招募組蛋白去乙?;绊懡M蛋白修飾 [12]

在植物中也進一步證明了這一點,RNA 結合蛋白會結合到不同的序列上,Hu 蛋白會招募 HDAC,由于這兩者物理位置上的接近,會對鄰近的組蛋白的乙酰基去掉,通過這種方式對組蛋白修飾產生影響。現在的研究還不是很多,目前的例子也就這些。但已經說明了一點,組蛋白修飾可能影響剪接,剪接也會影響組蛋白修飾。在有機體內,這兩者可能會進一步的相互作用,甚至反饋調控,可能是正反饋也可能是負反饋,從而使機體達到一種穩態。生物體之間存在各種各樣的聯系,關鍵是找到證明其存在的證據以及其背后的邏輯。

DNA 甲基化與基因可變剪接

既然 DNA 甲基化修飾與可變剪接相關,一個簡單的辦法就是對全基因組 DNA 甲基化進行分析。怎么分析呢?分組,分為外顯子和內含子,區別外顯子和內含子數據哪些是一樣的,哪些是不一樣的。有的 GC 含量一樣,有的不一樣。為了避免 GC 含量因素對結果的影響,他們做了一個設定,只分析外顯子和內含子內 GC 含量一樣的組別,這樣得出來的結論消除 GC 含量的影響,結果發現外顯子上有更高的 DNA 甲基化。這個比較有意思,要看兩者之間是否有相互作用,先看有無相關性,有相關性并不代表有因果關系。但通常如果有因果關系,相關性方面應當有些線索;如果什么都沒有,這個事情就變得更困難。進一步分析發現,剪接位點附近的甲基化程度相對于內含子里邊其他的更遠的地方,水平明顯不一樣。這為我們提供了一個很好的線索,如果甲基化會影響 splicing 的話,它在這兩個不同位置的甲基化程度給它的作用提供了一個基礎。進一步再想,如果 DNA 甲基化可以影響選擇性剪接,那么通過什么樣的方式?


圖28. 兩種不同的內含子-外顯子結構 [13]

第一種方式,DNA 甲基化可以間接地通過影響組蛋白的修飾從而影響剪接。這在理論上是成立的,但實際能不能找到這樣的例子還未知。另外一個辦法,我們可以去關注 DNA 甲基化的結合蛋白。大家知道,甲基化有專門的結合蛋白,類似于組蛋白修飾中的 reader,你也可以認為這個結合蛋白是 DNA 甲基化的 reader。但與組蛋白修飾有點不一樣,DNA 甲基化之后,某些蛋白對 DNA 的結合能力不同。有些蛋白質不喜歡甲基化,因此 DNA 甲基化之后蛋白質不能結合,有的必須要 DNA 甲基化之后蛋白才結合。那么一旦蛋白結合在這個地方,這些蛋白有沒有可能通過下游的因素影響剪接呢?這也許是個可能。很多研究發現了介導這一過程的因素,是一些大家耳熟能詳的因子,比如 CTCF,它與 DNA 甲基化的結合與它的一個 domain 有關系。但是大家發現,這個因子居然同樣可以影響它的剪接;另一個是 MeCP2,它是一個甲基化結合蛋白。這兩個因子就是剛才講的,一個通過結合在非甲基化序列上影響剪接,一個通過結合在甲基化序列上影響剪接。還有一個是 HP1,它是組蛋白 H3K9 甲基化 reader。DNA 甲基化修飾影響剪接主要通過三種機制來實現的:一是改變速率,一旦改變速率,后面的機制就容易解釋;二是招募剪接因子;三是通過 Pol II 的快慢來實現,基本是由這三種機制來實現。


圖29. DNA 甲基化通過三種機制調控可變剪接 [13]

第一個例子中的 CTCF,它的結合具有序列特異性,CTCF 與特定 DNA 序列結合后,會讓 RNA 聚合酶 II 變慢。RNA 聚合酶 II 變慢之后,弱的剪接性號也能作為外顯子,因此外顯子包含,這個時候形成一個三個外顯子轉錄本。如果這個地方發生甲基化,那么 CTCF就沒有辦法結合在這個 DNA 序列上。如果 RNA 聚合酶 II 跑的快,由于這個位點比較弱被剪接掉,實際上會造成外顯子跳躍。從原理上來講,這種作用方式解釋的相對比較清楚,但卻沒能解釋在什么情況下這個位置的 RNA 聚合酶跑的快或慢。那么作為一個 DNA 甲基化結合蛋白,MeCP2 如何影響 splicing?正好相反。DNA 發生甲基化,會促進 MeCP2 結合上去,而且 MeCP2 還會招募一些特定的組蛋白修飾酶,如 HDAC,在下游的因子的作用下,它會讓 RNA 聚合酶 II 變慢。如何變慢,沒有解釋清楚,至少給出了一個線索,就是 MeCP2 結合上去會讓 RNA 聚合酶 II 會變得慢,變慢之后會造成外顯子正常的切割包含,如果 DNA 沒有甲基化,MeCP2 不會與之結合,RNA 聚合酶 II 快速移動,造成外顯子跳躍。這兩個例子都是蛋白結合在這里造成 RNA 聚合酶轉錄或延伸速率,決定外顯子跳躍與否。第三個例子是通過組蛋白修飾影響剪接。可以看到,如果 DNA 發生甲基化,會進一步使組蛋白上發生 H3K9me3,這種修飾會招募 HP1。HP1 是一個識別 H3K9me3 的蛋白,有了這個蛋白之后,它會再去招募 splicing factor。如果這個 splicing factor 是促進 exon skipping 的,在這個過程中,兩個 splicing factor 的位置比較近,促使外顯子發生跳躍。這個假設走了一條很長的路,很奇怪,從 DNA 修飾到組蛋白修飾,再到 reader,然后再 splicing factor,解釋起來比較麻煩。這個機制給大家的研究造成很大的困難,如果你要證明這個方式確實存在,首先要證明是 H3K9 甲基化而不是其他的,接下來解釋轉到 splicing factor,到底結合哪個 splicing factor,這個還得去找,這個給研究帶來了更大的難度。剛剛講了這三種機制,大家覺得從原理上講哪種更普遍,哪種更特異性?從原理上來講,CTCF 識別特定序列,只有某些特定基因才有這樣的序列,這樣它可能特異性更強;對于 MeCP2,只要是基因發生甲基化,它就能與之結合,對基因的序列要求沒有那么高,從而調控更多基因的剪接;HP1 與它的作用方式類似,因為它可以識別 H3K9me3,H3K9me3 在很多核小體上都能存在,因此它對基因選擇性沒有那么強。初步的猜想就是 CTCF 調控的基因更少,后兩者更多一點。好像一切看上去都很完美,很好地解釋了 DNA 甲基化確實會影響 splicing,但你仔細看一下我們之前說的關聯研究和后面的機制研究,存在一個讓人想不通的事情。你看一下被跳掉的 alternative exons,它含有的 DNA 甲基化水平實際上比其他外顯子的甲基化水平低。但之前我們說外顯子上的 DNA 甲基化比較高,我們之前認為外顯子高的甲基化水平跟它的剪接是相關的,DNA 甲基化是 promote 外顯子的定義。但實際上我們去看里面的數據,去推廣這個假說,其實是不成立的。因為在特定的胚胎干細胞中看到的現象是 DNA 甲基化可以促進或抑制特定 alternative exons inclusion [14]。原來認為簡單的 DNA 甲基化決定外顯子,實際上是有的時候甲基化高的區域作為外顯子保留,有的時候又作為內含子被切掉,這與假說中的情況不完全一樣。


圖30. DNA 甲基化可促進或抑制特定 alternative exons inclusion [14]

除了我們講的 alternative exon,其實還存在一種組成型外顯子 constitute exon。我們看到的甲基化水平高可能只是在組成型外顯子顯示的甲基化水平高,但是如果將組成型和可變的外顯子放在一起比較,與原來的假設相矛盾了。實際上對于 constitute exon,它更多的是由這個強的剪接信號來決定,這時甲基化水平高低只是一種伴隨現象,不管甲基化水平高或低,旁邊的 intron 都會被剪掉。alternative exon 一直都被認為是一個外顯子,甲基化水平可能對這個可變外顯子的影響更大,這樣可以更好解釋為什么全基因組水平和單基因水平機制驗證有可能存在矛盾。以上這些分析可以得出一個初步的結論,DNA 甲基化通過多種方式影響 RNA 剪接,那么反過來會不會成立,根據前面一個猜想肯定也是成立,遺憾的是并沒有這方面證據。

染色質修飾與基因轉錄終止

最后稍微再講一點,RNA 加工不僅是一個可變剪接的過程,還有加 Poly(A) 尾。Poly(A) 尾在哪個地方加也是非常重要的,很多剪接因子影響加 Poly(A) 尾,兩者關系密切。表觀遺傳修飾與轉錄終止之間有什么關系?轉錄終止提示在哪個位置加 Poly(A) 尾巴。如圖 31 所示,gene body 有不同修飾,尤其是在 3’-端存在很多組蛋白修飾。那這種特異修飾有沒有可能與 3’-端的 Poly(A) 尾存在聯系,答案是肯定的。
圖31. 基因組上不同區域的組蛋白修飾分布

我們先簡要了解一下 alternative polyadenylation,之前講過如果在 3’-UTR 區選擇不一樣 3’-UTR 長度,對蛋白質的量會造成影響,但是 alternative polyadenylation (APA) 也可以影響蛋白質的質。因為如果 APA 在 intron 區域,會使開發閱讀框后面發生改變,造成蛋白質 C-端改變,功能可能不一樣。這兩種方式在細胞內廣泛存在并發揮作用,具體作用非常多。70% 以上基因都存在 APA 現象,它參與很多過程,像腫瘤、細胞分化、發育、組織特異性,而且更有意思的是在細胞增殖過程中,增殖比較快的細胞,癌細胞或癌旁,更多基因會選擇近端 APA 位點,讓基因表達量產生明顯的改變,提示這種現象有非常重要的生物學意義,在這個過程中研究如何被表觀遺傳調控很有意義。
圖32. APA 相關的生物學過程 [15]

通過組學手段發現很多細胞里面,如果說一個基因有兩個 Poly(A) 位點,如果去看這兩個位點附近各種組蛋白修飾,明顯表現出有很多不同特征,如下圖 33,組蛋白修飾在上游 APA 位點和下游 APA 位點分布很不一樣,H3K36me3 在近端和遠端 Poly(A) 位點也不一樣,那么這樣一種相關性其實提示組蛋白修飾有可能調控 Poly(A) 位點的選擇。
圖33. 不同 APA 位點的組蛋白修飾 [16]

在植物里面也發現了類似的現象,組蛋白修飾確實影響 Poly(A) 位點選擇。比如有兩個轉錄本,選擇近端或者說上游端 Poly(A) 位點,這個是常規的,在這個附近有很多修飾,既有 DNA 甲基化,又有組蛋白修飾,組蛋白修飾有很多不同的 reader,這些 reader 最后調控加尾因素的選擇,最后抑制或促進 Poly(A) 位點選擇,這樣組蛋白修飾或表觀遺傳標記對選擇哪個地方結尾有了因果關系。
圖34. 組蛋白修飾影響 Poly(A) 尾的選擇 [17]

總結一下,DNA 甲基化、組蛋白修飾、可變剪接之間可以相互影響。影響可變剪接的因素包括順式作用元件本身強弱,和它的反式因子結合或剪接因子濃度、以及是不是可以影響 RNA 聚合酶 II 的延伸快慢。同時組蛋白修飾能夠影響 RNA 末端形成,剪接因子不僅影響 RNA 剪接,還影響 RNA 3’-端的形成。但有一點仍不清楚,RNA 剪接發生之后會不會對 DNA 甲基化造成影響。除此之外,RNA 修飾會不會對 RNA 剪接造成影響,楊運桂老師也講了,特定 RNA 修飾可以通過改變特定蛋白,最后對 RNA 剪接造成一些影響,而這樣一些影響可以進一步來推,比如說 RNA 修飾影響 splicing 之后,會不會再影響組蛋白修飾,再進一步影響甲基化,我覺得這也是完全有可能的。
圖35. DNA 甲基化、組蛋白修飾、RNA 剪接和 Poly(A) 尾形成的關系

這樣在中心法則下面 RNA 作為一個中間傳遞者,在它的水平上發生一個很多的調控,這些調控不僅對下面的蛋白質造成影響,可能反過來影響上游的遺傳物質,起到一個很重要的承上啟下的作用,甚至是一個很中心的位置。RNA 加工過程中存在很多未知因素,從不同角度去看,會有很多新的發現,如果能夠把這些新的發現的一個上游因素闡述的相對比較清楚,對過程理解會更深刻。

整理:復旦大學生物醫學研究院徐鵬、重慶醫科大學蔡瑩、中科院上海藥物所徐曉偉
責編:復旦大學生物醫學研究院徐鵬
參考文獻:1. Wang, Y., et al., The splicing factor RBM4 controls apoptosis, proliferation, and migration to suppress tumor progression. Cancer Cell,2014. 26(3): p. 374-389.
2. Di Giammartino,D.C., K. Nishida, and J.L. Manley, Mechanisms and consequences of alternative polyadenylation. Mol Cell, 2011. 43(6): p. 853-66.
3. Mayr, C. andD.P. Bartel, Widespread shortening of 3'UTRs by alternative cleavage and polyadenylation activates oncogenes in cancer cells. Cell, 2009. 138(4):p. 673-84.
4. Mortazavi, A., et al., Mapping and quantifying mammalian transcriptomes by RNA-Seq.Nat Methods, 2008. 5(7): p. 621-8.
5. Trapnell, C., et al., Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and Cufflinks. NatProtoc, 2012. 7(3): p. 562-78.
6. Fu, X.-D. and M.Ares Jr, Context-dependent control of alternative splicing by RNA-binding proteins. Nature Reviews Genetics,2014. 15: p. 689.
7. Kornblihtt, A.R., Promoter usage and alternative splicing. Current opinion in cell biology, 2005. 17(3): p. 262-268.
8. Barth, T.K. and A. Imhof, Fast signals and slow marks: the dynamics of histone modifications. Trends Biochem Sci, 2010. 35(11): p. 618-26.
9. Luco, R.F., et al., Epigenetics in alternative pre-mRNA splicing. Cell, 2011. 144(1): p.16-26.
10. Guo, R., et al., BS69/ZMYND11 reads and connects histone H3.3lysine 36 trimethylation-decorated chromatin to regulated pre-mRNA processing.Mol Cell, 2014. 56(2): p. 298-310.
11. Kim, S., et al., Pre-mRNA splicing is a determinant of histone H3K36 methylation. Proc Natl Acad Sci U S A, 2011. 108(33): p. 13564-9.12. Zhou, H.L., et al., Regulation of alternative splicing by local histone modifications: potential roles for RNA-guided mechanisms.Nucleic Acids Res, 2014. 42(2): p.701-13.
13. Lev Maor, G., A.Yearim, and G. Ast, The alternative role of DNA methylation in splicing regulation. Trends Genet, 2015. 31(5): p. 274-80.
14. Yearim, A., et al., HP1 is involved in regulating the global impact of DNA methylation on alternative splicing. Cell Rep, 2015. 10(7): p. 1122-34.
15. Elkon, R., A.P.Ugalde, and R. Agami, Alternative cleavage and polyadenylation: extent, regulation and function. Nat Rev Genet, 2013. 14(7): p. 496-506.
16. Ji, Z., et al., Transcriptional activity regulates alternative cleavage and polyadenylation. Mol Syst Biol, 2011. 7: p. 534.
17. Mathieu, O. andN. Bouche, Interplay between chromatin and RNA processing. Curr Opin Plant Biol, 2014. 18: p. 60-5.

推薦閱讀:
表觀遺傳,你想了解的都在這里

騰訊視頻鏈接: 復旦倪挺:表觀遺傳調控與可變剪接

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
禁止轉載,如需轉載請通過簡信或評論聯系作者。

推薦閱讀更多精彩內容

  • 基因的基本組成 基因是具有功能的DNA序列片段,由編碼序列和非編碼序列交替構成,我們又稱為割裂基因 split g...
    墻壁上的人閱讀 1,739評論 0 5
  • 氨基酸是蛋白質的基本結構單位,參與合成蛋白質的氨基酸有20種,可作為原料在核糖體工廠通過肽鍵連接形成多肽鏈,都有密...
    官敏慧閱讀 5,826評論 0 7
  • 一篇RNA-seq分析流程的綜述,全面而詳細!深度好文,可用來反復閱讀。初學者用于把握RNA-seq真個流程及各個...
    小白要變大神閱讀 7,842評論 0 21
  • 知識的學習沒有一蹴而就,沒有捷近,扎實的學習是唯一的捷近。 一篇RNA-seq分析流程的綜述,全面而詳細!深度好文...
    dandanwu90閱讀 49,213評論 5 152
  • 劉小澤寫于18.12.7這個部分是現在研究的熱門,因此很有必要了解一下背后的生物知識,我們不僅要做攻城獅,還要知道...
    劉小澤閱讀 10,904評論 0 50