一、lncRNA的研究背景
表觀遺傳學是研究基因表達發生了可遺傳的改變,而DNA序列不發生改變的一門生物學分支,對細胞的生長分化及腫瘤的發生發展至關重要。表觀遺傳學的主要機制包括DNA甲基化、組蛋白修飾及新近發現的非編碼RNA。非編碼RNA是指不能翻譯為蛋白的功能性RNA分子,其中常見的具調控作用的非編碼RNA包括小干涉RNA、miRNA、piRNA以及長鏈非編碼RNA。研究者的大量研究表明非編碼RNA在表觀遺傳學的調控中扮演了越來越重要的角色。
在近十余年的生命科學研究中非編碼調控RNA可謂是研究最火的領域之一,從2006年諾獎的siRNA,到這幾年異常火爆的microRNA,到即將登場并定能風靡的lncRNA,可謂如火如荼。RNA不僅僅只承擔遺傳信息中間載體的輔助性角色,而是更多地承擔了各種調控功能。
lncRNA在發育和基因表達中發揮的復雜精確的調控功能極大地解釋了基因組復雜性之難題,同時也為人們從基因表達調控網絡的維度來認識生命體的復雜性開啟新的天地。研究者大部分研究集中于短?RNA如?microRNA,piRNA?等一些?ncRNA?生物生成機制和調控通路,甚至在一些人類復雜疾病中的功能,但是這都只是冰山一角。人們對lncRNA(Long noncoding RNAs,lncRNAs)的認識還處在初級階段,lncRNA起初被認為是基因組轉錄的“噪音”,是RNA聚合酶II轉錄的副產物,不具有生物學功能。然而,有文獻研究表明,lncRNA參與了X染色體沉默、基因組印記以及染色質修飾、轉錄激活、轉錄干擾、核內運輸等多種重要的調控過程。lncRNA的這些調控作用也開始引起人們廣泛的關注。
哺乳動物基因組序列中,4%~9%的序列產生的轉錄本是lncRNA(相應的蛋白編碼RNA的比例是1%)。雖然關于lncRNA的研究進展迅猛,但是絕大部分的lncRNA的功能仍然是不清楚的,隨著研究的推進,各類lncRNA?的大量發現,lncRNA?的研究將是RNA?基因組研究非常吸引人的一個方向,使人們逐漸認識到基因組存在人類知之甚少的“暗物質”。
近年來lncRNA得到了研究界的廣泛關注,人們已經在測序技術的幫助下鑒定了大量lncRNA,但lncRNA的生物學功能依然迷霧重重。
西班牙IMIM(Hospital del Mar Medical Research Institute)和加泰羅尼亞理工大學(UPC)的研究團隊最近在eLife雜志上發表研究指出,長非編碼RNA在新蛋白演化中起到了重要的作用,它們在細胞中有著不為人知的重要功能。長非編碼RNA是指長度超過三百個核苷酸的RNA分子,其上沒有編碼蛋白的閱讀框。在細胞內lncRNA的豐度約占到70%至98%,有些lncRNA甚至長達幾千bp。雖然lncRNA沒有編碼任何蛋白質,但它們的表達在不同組織和發育階段依然具有特異性,這說明lncRNA具有重要的生物學意義。絕大多數lncRNA位于細胞核,它們對應的DNA區域有的與蛋白編碼基因重疊,有的位于基因之間或者內含子中。由于lncRNA似乎沒有承擔什么生物學功能,它們曾被認為是一種“進化噪聲”。現在西班牙的研究人員通過新測序技術向人們展示,許多這樣的轉錄本也有機會翻譯成為蛋白。這一發現旋即引起了激烈的爭論。
Mar Albà等人在六個物種中(人類、小鼠、魚、果蠅、酵母和一種植物)驗證了這一結果,許多lncRNA與核糖體關聯,似乎隨時準備翻譯成為蛋白。這說明,lncRNA可以成為新蛋白合成的資源。這項研究顯示,大多數lncRNA是種系特異性的,很少有lncRNA存在于兩個以上的物種中。由此可見,這些lncRNA很可能是最近才演化出來的。事實上,lncRNA分子表現出許多與“年輕”基因相似的特性。新功能性蛋白的出現,是一個反復嘗試的過程。因此細胞需要生成大量的轉錄本,這些轉錄本不一定都能通過時間的檢驗。lncRNA與這樣的轉錄本很相符。對近親物種進行研究,將有助于我們進一步理解新基因的形成機制,鑒定那些可能有功能的轉錄本。lncRNA表達模式改變與特定疾病的關聯,也是一個很有吸引力的研究方向。
二、lncRNA的作用機制
隨著lncRNA功能逐步顯現,其與靶點的作用機制成為進一步的熱點。早期認為原位調控是lncRNA?作用的唯一機制,它通過招募形成染色質修飾復合物而沉默鄰近基因轉錄,例如IGF2R?反義RNA(antisense of IGF2R RNA,AIR)、XIST?等。而Hox?基因反義基因間RNA(Hox antisense intergenicRNA,HOTAIR)的發現提示lncRNA可能存在遠程調控。
同源異型基因(homeotic genes,HOX)在細胞增殖與定向分化中起關鍵作用,人類Hox?基因簇約含100個ncRNA?基因,其中HOTAIR?定位于HOXC?基因座12q13.13。HOTAIR的5'端可招募結合多梳蛋白抑制復合物2(polycomb repressivecomplex 2,PRC2),借助PRC2上三個H3K27甲基化酶EZH2、SUZ12和EED,使另一基因座HOXD上長約40 kb的序列轉錄沉默,從而在乳腺上皮細胞內使細胞內轉錄傾向于胚胎成纖維細胞樣表型。超過20%的lncRNA?能夠通過結合PRC2或其他類似復合物發揮作用,提示lncRNA的遠程調控機制在生物體內廣泛存在。
長鏈非編碼RNA的作用機制非常復雜,至今尚未完全清楚。根據目前的研究,lncRNA的作用機制如要有以下幾種。
(1)編碼蛋白的基因上游啟動子區(橙色)轉錄,干擾下游基因(藍色)的表達;
(2)抑制RNA聚合酶II或者介導染色質重構以及組蛋白修飾,影響下游基因(藍色)的表達;
(3)與編碼蛋白基因的轉錄本形成互補雙鏈(紫色),干擾mRNA的剪切,形成不同的剪切形式;
(4)與編碼蛋白基因的轉錄本形成互補雙鏈(紫色),在Dicer酶的作用下產生內源性siRNA;
(5)與特定蛋白質結合,lncRNA轉錄本(綠色)可調節相應蛋白的活性;
(6)作為結構組分與蛋白質形成核酸蛋白質復合體;
(7)結合到特定蛋白質上,改變該蛋白質的細胞定位;
(8)作為小分子RNA(如miRNA、piRNA)的前體分子。
目前,發現的參與哺乳動物基因活動的lncRNA已有上千個,其調控基因表達的機制存在共性。一般來說,lncRNA主要從表觀遺傳學、轉錄調控及轉錄后調控等3個層面實現對基因表達的調控。
1 .表觀遺傳調控
哺乳動物lncRNA介導的表觀遺傳改變的研究,最早源于基因組印記(genomic printing)和X染色體失活(X chromosome inactive)兩個方面,分別與H19和X ist RNA密切相關。近十年研究證實,lncRNA與表觀遺傳調控密切相關,并且發現了許多新的與基因調控有關的lncRNA。
2.?轉錄調控
LncRNA能夠通過多種機制在轉錄水平進行調控,表現在如下幾個方面:
LncRNA的轉錄可以干擾鄰近基因的表達。例如,酵母的SER3基因受到上游一段lncRNA——SRG1的干擾。近端啟動子轉錄的lncRNA可將RNA結合蛋白定位至基因啟動子區域從而調控基因表達。如,人類細胞中的細胞周期蛋白D1(CCND1)的表達,DNA損傷信號誘導該基因啟動子上游一段lncRNA的表達,它可調節RNA結合蛋白——TLS的活性,接著TLS抑制CREB結合蛋白——組蛋白乙酰基轉移酶和p300的活動,進而使CCND1基因的表達沉默。
LncRNA可作為共因子調節轉錄因子的活性。例如,小鼠的一段lncRNA——Evf2轉錄自一段超保守的遠端增強子,它可與轉錄因子DLX2形成轉錄復合體,并結合至一個增強子上,從而誘導鄰近蛋白編碼基因DLX6的表達。通過與影響啟動子選擇的抑制性復合物相互作用,封鎖啟動子區域來調控RNA聚合酶(RNAP)II的活動從而干擾基因表達。這可能是存在于真核細胞染色體上的上千種三倍體復合物結構控制啟動子作用的普遍機制。
再如,小鼠17號染色體的Igf2r區是第一個被證實的可轉錄為?lncRNA的位點,父系染色體上一未拼接的?lncRNA——A irn從母源性Igf2r上的ICR區域開始轉錄,方向與Igf2r相反。這一反義鏈轉錄的RNA規模較大,跨越整個Igf2r啟動子。并越過基因間區抵達鄰近基因。屬于一種轉錄干擾機制。
3 .轉錄后調控
LncRNA在轉錄后水平可與mNRA形成雙鏈RNA復合物,以掩蓋mRNA的主要順式作用元件,從而調控基因表達。例如,lncRNA-Zeb2(即Sip1)能夠和HOX位點轉錄的mRNA的一個內含子的5’端剪切位點形成雙鏈,從而防止該內含子被剪切。該區域含有對于Zeb2蛋白表達所必須的核糖體結合位點,Zeb2通過這種方式能夠提高Zeb2蛋白的表達量。這一例子說明lncRNA可以指導mRNA亞型的選擇性剪接。
另外,lncRNA的復性(退火)具有靶向作用,使蛋白受體復合物能夠識別正義鏈mRNA轉錄本。這一租用類似于RNA誘導的沉默復合物(RISC)通過siRNA靶向作用于mRNA。來自于互補轉錄本甚至是lncRNA的雙鏈RNA,結合延長的內部發夾結構,能夠被加工成內源性siRNA以使基因表達沉默。