Epigenetic regulation and epigenomic landscape in rice?
ABSTRACT
表觀遺傳調控參與調控水稻的復雜農藝性狀。高通量測序技術和水稻自身復雜度適中的基因組,使得在全基因組水平上研究水稻表觀遺傳調控成為可能。此篇綜述討論了最近水稻表觀遺傳調控方面的進展,重點關注了關鍵的表觀遺傳調控元件、表觀基因組圖譜、表觀遺傳變異、轉座子沉默以及植物發育方面的問題。
INTRODUCTION
表觀遺傳學Epigenetics最早于1950s由Conrad Waddington(英國胚胎學家、遺傳學家、哲學家,參見大英百科全書https://www.britannica.com/biography/C-H-Waddington)提出,是研究不改變DNA序列的前提下,穩定可遺傳的基因表達調控機制。表觀遺傳調控的機制包括DNA methylation、histone modifications and variants、chromatin remodeling、and non-coding RNA介導的基因表達調控。表觀遺傳調控在多細胞生物的發育和生物學過程的多個方面起到不可或缺的作用。
DNA METHYLATION
DNA甲基化是一種在進化上保守的表觀遺傳修飾,發生在DNA鏈的CG、CHG、CHH(H代表A、C、T)胞嘧啶殘基上。DNA甲基化調控基因表達并且抑制轉座子的轉錄和轉座,因此在真核生物基因表達水平、轉基因沉默、基因組印記、基因進化、基因組穩定性以及多倍體適應中發揮中關鍵性的作用。相比于動物DNA甲基化主要發生在CG的胞嘧啶殘基,植物胞嘧啶甲基化可以發生在CG、CHG、CHH中。Non-CG甲基化主要在轉座子區域發現,CG甲基化主要發生于TEs和gene bodies。
The DNA methylation landscape
DNA甲基化在植物發育中起到關鍵作用,多個研究繪制了水稻在生殖發育、種子發育 、愈傷組織多個發育階段以及在雜交水稻、不同脅迫處理如鹽脅迫、干旱脅迫、磷脅迫以及農藥脅迫條件下的全基因組甲基化修飾圖譜。水稻全基因組胞嘧啶甲基化水平是擬南芥的四倍,可能是由于轉座子的數量和分布模式等不同的基因組結構造成的。
早期研究利用對甲基化敏感的限制酶構建了水稻日本晴和93-11的未分化懸浮細胞和幼嫩向光生長的莖尖的4號和10號染色體的著絲粒區高分辨DNA甲基化圖譜。這些研究發現超過一半的蛋白質編碼區的基因區和啟動子區存在DNA甲基化修飾,并且甲基化優先發生在轉錄起始位點下游,和抑制基因轉錄相關。這個模式和擬南芥中只有CG甲基化存在于gene body區的模式很不同。
全基因組胞嘧啶甲基化圖譜利用CpG甲基化免疫共沉淀測序解釋了染色體上DNA甲基化的分布和水稻染色體上異染色質區的分布相似。基因對環境的響應往往受到DNA甲基化的調控。例如,干旱響應基因顯著存在DNA甲基化修飾。此外,培矮64是一個光溫敏雄性不育系,廣泛用于水稻育種,在不育系中表現為全基因組超甲基化,在不同環境中存在非孟德爾的基因表達機制。全基因組分析水稻種子發育過程中DNA甲基化水平發現,非轉座子基因有不同的甲基化修飾狀態,說明在水稻籽粒發育過程中存在復雜的DNA甲基化模式調控機制。
利用重亞硫酸鹽測序(BS-seq)發現水稻幼穗中24.3%的胞嘧啶是被甲基化修飾的,是擬南芥的四倍。同時發現CG、CHG、CHH胞嘧啶甲基化分別占44.5%、20.1%、4.0%,和水稻葉片甲基化組結果一致。CG甲基化在蛋白質編碼區的gene bodies區水平較高,然而轉座子、重復序列、著絲粒周圍區域CG和non-CG甲基化水平都很高。此外,表達水平適中的基因容易被甲基化修飾,然而表達水平極高或者極低的基因不易被甲基化修飾。有趣的是,與親本和非再生植株相比,水稻雜交種和再生植株表現出顯著不同但可遺傳的甲基化模式。這個結果可以推測水稻在組織培養和再生過程中,DNA甲基化在可以容易地被獲得或者丟失 。在水稻胚乳中,低甲基化區域只發生在母本基因組上,可以形成印記基因,對于籽粒發育非常重要。此外,特別是利用生物信息學分析不同發育階段和響應不同環境刺激的全基因組DNA甲基化修飾模式,將會為DNA甲基化的功能提供新的理解。
Key regulators of DNA methylation
在理解水稻DNA甲基化修飾機制方面取得了重要進展,包括鑒定多種酶通過不同或相似的方式從頭建立和維持DNA甲基化。在水稻中,DNA甲基化主要通過small RNAs通過RdDM途徑建立。OsDRM2(和擬南芥中的DRM2同源),在RdDM通路中起到從頭甲基轉移酶的作用,負責從頭對水稻基因組中的CG和non-CG序列進行甲基化修飾。敲掉OsDMR2基因會同時影響營養生長和生殖生長,造成水稻半矮桿株型、分蘗數減少、推遲或不抽穗、不正常的穗和小穗表型、表現為完全不育,降低了近14%的DNA胞嘧啶甲基化修飾水平。有趣的是,OsDMR2的表達受到miR820的負調控。miR820是從一類從CACTA的DNA轉座子轉錄而來。通過miR820來抑制OsDMR2的表達,造成轉座子位點DNA甲基化水平降低,說明OsDMR2-miR820調控轉座子和寄主基因組的相互作用。
作為最普遍的胞嘧啶甲基化類型,CG甲基化主由MET1基因維持,包括OsMET1a(OsMET1-1)和OsMET1b(OsMET1-2)。OsMET1b是維持CG甲基化的主要甲基轉移酶,相比于OsMET1a它的表達更廣泛、水平更高。相比于擬南芥met1突變體可以有育性,水稻OsMET1b突變體嚴重地影響籽粒的發育并導致幼苗死亡。相應的,甲基化組分析發現osmet1b突變體幼苗在全基因組水平上發生CG甲基化丟失,伴隨改變對轉座子、編碼區、sRNAs以及可變剪切的調控。這項研究證明CG甲基化在水稻中起著重要、復雜的調控作用。
和CG甲基化類似,non-CG甲基化同樣在植物中起到重要作用。水稻染色質甲基化酶OsCMT3a,一個植物特有的甲基轉移酶,維持 non-CG(主要是CHG)的甲基化。OsCMT3a功能缺失突變體沒有了對TEs和很多基因的抑制,誘導多向性的發育表型,尤其在生殖階段。以上證據表明,相比于擬南芥,OsCMT3和OsDRM2在水稻的非CG甲基化和發育中起著更加重要的作用。在擬南芥中,drm1和drm2雙突變體、cmt3單突變體均沒有表型缺陷。這個表型可能是由于水稻和擬南芥基因組結構、不同基因組大小以及重復序列所處的環境不同導致的。相比于擬南芥基因組,水稻基因組的CG含量更高,并且從基因的5'到3'端CG含量下降。因為DNA甲基化轉移酶是序列依賴性地發揮作用,因此高CG含量可能會增加胞嘧啶甲基化水平。重要的是,水稻基因組包含更高的異染色質區域,被不連續存在的TEs標記。因此,DNA甲基化轉移酶會對水稻發育產生更加強烈的影響。相比于擬南芥,這可能是由于水稻中更多的TEs、重復序列被甲基化從而影響臨近基因和重復基因的表達。
除了甲基化酶之外,DECREASE IN DNA METHYLATION 1 (DDM1),是一個SWI/SNF染色質重塑因子,對于維持胞基因組重復序列和TEs的胞嘧啶甲基化是必需的,因此參與維持水稻基因組的TE沉默。OsDDM1參與維持異染色質和常染色質區的CG、CHG甲基化以及常染色質區的CHH甲基化。然而,它抑制著絲粒區重復序列的CHH甲基化。
DNA胞嘧啶甲基化是被動態調控的,可以通過DNA復制而被動去除,也可通過去甲基化酶主動去除。在擬南芥中,DNA去甲基化由DNA?glycosylases(DNA糖基化酶),如REPRESSOR OF SILENCING 1 (ROS1)可以防止內源基因和轉入基因的超甲基化。DEMETER (DME)在胚乳基因組印記中起到重要作用。DEMETER-LIKE 2 (DML2) 和 DEMETER-LIKE 3 (DML3)負責去除位置錯誤的甲基化。水稻基因組編碼了6個公認的5mC糖基化酶,4個與ROS1同源的酶(ROS1a、1b、1c、1d),和兩個DML3同源酶(DML3a和DML3b)。DNA GLYCOSYLASE 701 (DNG701)也被稱作ROS1c,是一個DNA糖基化酶。在愈傷組織中,相比于野生型,dng701敲除突變體變現為DNA超甲基化和T0S17轉座頻率降低。在愈傷組織中,過表達DNG701表現為降低DNA甲基化和Tos17的頻繁轉位,證明DNA甲基化對于抑制TEs起著關鍵作用。
HISTONE MODIFICATION
組蛋白N端尾巴的轉錄后修飾,如乙酰化、甲基化、磷酸化和泛素化在表觀遺傳調控中都有著重要的作用。翻譯后修飾影響著更高級的染色質結構,從而調節不同的生物學過程,包括基因表達、DNA復制、對DNA損傷的響應以及細胞凋亡。組蛋白乙酰化和甲基化是兩個重要的表觀遺傳標記,在很多綜述中已被詳細討論過,并且在水稻的發育和基因組區域劃分中行使著重要的功能。這里我們重點討論全基因組組蛋白乙酰化和甲基化對于水稻發育的影響。
Histone acetylation
組蛋白賴氨酸乙酰化廣泛地和轉錄激活相關,然而去乙酰化和轉錄抑制相關。水稻基因組編碼了至少8個組蛋白乙酰化轉移酶acetyltransferases (HATs)和18個組蛋白去乙酰化酶histone deacetylases (HDACs)。八個HATs被分為4類,CBP、TAFII250、GNAT(Gcn5-related N-acetyltransferases)和MYST(MOZ, Ybf2, Sas2, and Tip60)。此外,Song等鑒定到一個與粒重相關的QTL,它編碼一個新型的GNAT-like HAT, OsglHAT1。過表達?OsglHAT1可以增加粒重、提高細胞數目、籽粒灌漿和全基因組水平組蛋白H4的乙酰化水平。其他HATs的生物學功能還有待闡明。
相比于水稻中很多功能未知的HATs,水稻HDACs已經被發現參與調控植物生長和發育,并且參與響應生物和非生物脅迫。水稻HDACs由3個家族構成:RPD3/HDA1,SIR2(SILENT INFORMATION REGULATOR 2)和HD2。下調OsHDA703表達會降低水稻花梗的延伸和受精,然而下調OsHDA704,?OsHDA710,和?OsHDT702會造成營養生長時發育畸形。錯誤調節OsHDA702/OsHDAC1會改變生長速率,并通過表觀遺傳調控OsNAC6(控制根生長)的表達,進而導致莖尖和根組織的發育缺陷。OsHDT701屬于HD2家族,通過降低PATTERN RECOGNITION RECEPTOR (PRR)和抗病相關基因的組蛋白乙酰化修飾水平負調控固有免疫。兩個研究組分別獨立發現敲低SIR2家族的OsSRT701/OsSRT1會提高TEs和一些與細胞死亡、脅迫以及代謝相關基因的H3K9乙酰化水平。此外,干旱脅迫顯著誘導4種水稻HAT基因(OsHAC703,?OsHAG703,?OsHAF701, and?OsHAM701)表達,然而一些HDAC基因被非生物脅迫調節。過表達OsHDT701增加水稻耐鹽和抵抗滲透脅迫的能力。這些發現說明HATs和HDACs在水稻響應脅迫時發揮作用。
水稻全基因組組蛋白乙酰化分析發現64.9%的非TE基因被H3K9乙酰化修飾,主要富集在轉錄起始位點下游,并與基因表達激活有關。有趣的是,OsSRT1調節H3K9ac的穩定,并且靶向TEs,說明H3k9ac去乙酰化參與抑制TEs。H3K27ac是另一種組蛋白乙酰化標記,主要富集在基因區的轉錄起始位點下游,與H3K9ac位點高度一致。
Histone methylation
和組蛋白乙酰化不同的是,組蛋白賴氨酸甲基化提供特異的和獨特的信號。H3K4和H3K36的甲基化和轉錄激活相關,然而H3K9和H3K27甲基化和轉錄抑制相關。
組蛋白賴氨酸甲基轉移酶(HKMTS)包含一個SET(for Su(var)3-9, E(z), Trithorax)結構域。水稻基因組編碼至少37個含有SET結構域的蛋白。SDG714(SET DOMAIN GROUP PROTEIN 714)是第一個在水稻中被鑒定到的HKMT蛋白,它特定催化組蛋白H3K9甲基化。下調表達SDG714表現為表皮毛(trichome)缺失,并且降低H3K9甲基化和Tos17的DNA甲基化,可以提高Tos17的轉錄和轉座。這些發現證明SDG714在調節植物發育和維持基因組穩定性方面發揮著重要作用。相似的是,由SDG728介導的H3K9甲基化抑制Tos17和Ty1-copia元件的轉錄和轉座。兩個組蛋白H3K36甲基轉移酶,SDG724和SDG725已經被發現可以通過去除MADS50?和?RICE FLOWERING LOCUS T1?(RFT1) 等幾個與開花相關基因的H3K36me2/3修飾,從而促進開花。
通常來說,多梳蛋白 Polycomb group (PcG) proteins 通過催化H3K27甲基化從而抑制基因表達,然而?Trithorax group (TrxG) proteins 可以通過催化H3K4甲基化,從而維持基因的轉錄激活狀態。PcG和TrxG蛋白在植物和動物中都是高度保守的。SDG723/OsTrx1是水稻中唯一被鑒定到的TrxG蛋白,是一個開花的激活子。The POLYCOMB REPRESSIVE COMPLEX 2 (PRC2)有4個核心蛋白,ENHANCER of ZESTE [E(z)], SUPPRESSOR of ZESTE 12 [Su(z)12], EXTRA SEX COMBS (ESC), 和p55。作為一個催化組件,包含SET結構域的E(z)介導H3K27me3。水稻基因組編碼2個同源的E(z)(OsiEZ1/SDG718/OsSET1 and OsCLF/SDG711), 2個Su(z)12-like proteins [EMBRYONIC FLOWER 2a (OsEMF2a) and OsEMF2b], 和2個 ESC homologs [FERTILIZATION-INDEPENDENT ENDOSPERM 1 (OsFIE1) and OsFIE2]。與擬南芥中功能研究清晰的PRC2不同,水稻PRC2的許多功能還有待研究。水稻osemf2b 突變體存在多個缺陷,包括改變開花時間、花異常、以及完全不育,暗示OsEMF2b在水稻花發育過程中發揮關鍵作用。幾個PRC2相關的成分參與控制水稻抽穗。比如,在水稻中,OsVIL2 通過抑制?OsLFL1?(LEAFY COTYLEDON 2 and FUSCA 3-LIKE 1) 誘導開花。OsiEZ1/SDG718/OsSET1?和?OsCLF/SDG711?參與調控水稻抽穗期。在已知的水稻PRC2成分中,OsFIE1是唯一的印記基因,它的母本等位基因在胚乳中表達,然而父本等位基因在胚乳中不表達。OsFIE1 是受溫度調控的,并有表觀修飾,包括DNA甲基化和H3K9me2。過表達OsFIE1 會造成OsFIE1 雙等位基因表達,并且PRC2靶位點的H3K27me3發生異常。這導致多個發育缺陷,包括植株矮小、開花缺陷、以及種子變小,證明PRC2介導的H3K27me3在水稻發育中發揮著非常重要的作用。Tandem affinity-purified(串聯親和純化)得到的OsFIE2-PRC2復合體,包括OsFIE2、OsCLF/SDG711、OsiEZ1/SDG718/OsSET1 和 OsEMF2b在體外表現為特異的H3甲基轉移酶活性。這是首個證明水稻H3K27甲基轉移酶復合體活性的報道。
組蛋白賴氨酸甲基化的平衡受到HKMTs和去甲基化酶的動態調節。兩種組蛋白去甲基化酶,LYSINE-SPECIFIC DEMETHYLASE 1 (LSD1) 和 Jumonji C (JmjC) domain-containing proteins可以去除賴氨酸上的甲基化修飾。水稻基因組編碼了3個LSD1同源蛋白和20個JmjC domain-containing proteins,但是LSD1蛋白的功能還不清楚。JMJ706可以在體外去除H3K9me2/me3,在體內去除H3K27me2/me3甲基化修飾,并且參與調控水稻花發育基因的表達。除了JMJ706、JMJ705可以去除H3K27me2/me3并且誘導激活水稻抗逆相關基因表達。JMJ703可以特異性去除H3K4me1/me2/me3的甲基化修飾,并且導致多個性狀產生發育缺陷,影響了株高、二級分枝和籽粒大小等重要農藝性狀。探索JMJ703靶定的特異性染色質區域并促進染色質高級修飾,進而調控水稻發育過程中的基因表達機制是十分有趣的。
水稻全基因組的H3K4甲基化修飾圖譜表明超過一半的蛋白編碼基因,不包括TEs,有H3K4me2或者H3K4me3修飾,高度符合H3K9ac的修飾pattern。H3K4me2水平和適中水平的基因表達呈正相關。與之相比,有H3K4me3修飾的基因是活躍轉錄的。這些修飾都傾向于發生在水稻基因的5'端(TSS下游),但是修飾水平峰值在不同的位置。這個模式證明了H3K4me3和H3K9ac可以被用來預測和證明注釋不明確的水稻基因。例如,H3K4me3、H3K36me3在gene body區時,和激活基因表達相關,并且在調節特定等位基因表達中起到重要作用。H3K27me3作為一種抑制性修飾,發生在所有水稻gene bodies 的將近40%的非TEs基因上。這些位點的表達水平較低,并且有很強的組織特異性,和由PRC2復合體介導的H3K27me3的功能是一致的。
相比于以上描述的組蛋白修飾,H3K9甲基化是一個異染色質區的標記,對于抑制重復序列的表達是需要的。例如,著絲粒包含著串聯重復衛星序列,由多個表觀遺傳修飾調節。蔣繼明實驗室開發了一種包含四種測序完成的水稻著絲粒的芯片,并利用ChIP-chip來定位H3K4me2、?H3K4me3、H3K36me3 和 H3K4K9ac四種常染色質修飾位點。他們發現這四種常染色質標記和水稻 著絲粒的基因區相關。例如,87.2%位于著絲粒區的含有4種組蛋白修飾標記的基因都可以轉錄,并且表達水平高的基因傾向于和四種組蛋白修飾標記相關。這顯示水稻著絲粒區域存在與激活基因表達相關的常染色質亞區。
NON-CODING REGULATORY RNA
ncRNAs是重要的表觀遺傳調控子,并且包括sRNA和長片段非編碼RNA(lncRNAs)。這些ncRNAs在植物發育過程中扮演著重要的角色,維持基因組的完整性,響應生物和非生物脅迫。在水稻中已經鑒定到許多個有功能的ncRNAs,它們參與了不同的生物學過程。這里我們總結了目前水稻miRNAs、siRNAs、lncRNAs的前沿研究結果,以及應用于調控水稻重要農藝性狀的可能的策略。
MicroRNA
MiRNAs是一類長度為21~22nt,由莖環結構產生的單鏈RNA分子。miRNA在水稻和擬南芥中的合成途徑是保守的。miRNA的發生因子的破壞會導致嚴重發育缺陷。說明miRNAs在水稻發育過程中起到重要的作用。植物miRNAs通過與靶mRNAs進行近乎完美的序列結合,并對其進行轉錄后切割。 在水稻中,一些non-canonical miRNAs可以通過RdDM途徑誘導產生DNA甲基化。DNA甲基化常常與H3K9甲基化相關。結合5'RACE和生物信息學分析在不同組織和不同亞種中鑒定到一些水稻miRNAs的靶點,這極大促進了對于miRNAs生物學功能的研究。
一些研究已經在水稻中鑒定到許多miRNAs。截止目前(2016年),在水稻中已經有由592種前體產生的713種成熟的miRNAs被收錄在miRBase 21.0中?(http://microrna.sanger.ac.uk/)。少數水稻miRNAs的靶標和功能被鑒定。其中,幾種miRNAs被鑒定為重要農藝性狀的關鍵調控元件。例如,miR156可以負調控SQUAMOSA?(SQUA)?PROMOTER-BINDING-LIKE (SPL)轉錄因子,SPL參與水稻和其他植物的許多生物學途徑。兩個獨立研究揭示了