DNA甲基化是一種被廣泛研究的表觀遺傳修飾方式,與組蛋白修飾等方式一起,在調控基因表達和染色質構象等方面發揮了重要作用。通常地,甲基化DNA指5-甲基胞嘧啶(5mC),它是在DNA甲基轉移酶(DNMT)的作用下將甲基基團添加到胞嘧啶的5’C位置上形成的(Vertino PM, 1996)。哺乳動物細胞中甲基化主要發生在CG雙核苷酸的胞嘧啶上(Goldberg AD, 2007),植物細胞中則存在很大比例的non-CG(CHH、CHG,H代表A、C、T)甲基化(Jackson JP, 2002)。
1. 定義
在DNA甲基轉移酶(DNA methyltransferase, 縮寫DNMT)的作用下,基因組DNA序列上CpG島的二核苷酸5′端胞嘧啶轉變為5′甲基胞嘧啶(5′ methylcytosine, 縮寫5mC)。
DNA甲基化(DNA methylation)是研究得最清楚,也是最重要的表觀遺傳修飾形式; 主要是基因組 DNA上的胞嘧啶第5位碳原子和甲基間的共價結合,胞嘧啶由此被修飾為5甲基胞嘧啶(5-methylcytosine,5mC)。
DNA甲基化在維持正常細胞的功能、雌性個體X染色體失活、寄生DNA序列的抑制、基因組結構穩定、遺傳印記、胚胎發育、及腫瘤和疾病的發生、發展緊密相關,具有至關重要的作用。
2. 甲基化類型
在哺乳動物中, DNA甲基化類型可分為:?維持甲基化(maintenance DNA methylation) 和?重新甲基化(de novo methylation)。
維持甲基化是指在甲基轉移酶的作用下,DNA的半保留復制過程中,會在子鏈的相應的位置進行甲基化修飾的過程。
重新甲基化是指在甲基轉移酶的作用下,原來沒有甲基化的DNA雙鏈上,進行甲基化的過程,之后由維持甲基化酶來維持穩定的DNA甲基化狀態。
對于這兩種甲基化機制來說,有兩種對應類型的甲基化酶:維持甲基轉移酶和重新甲基轉移酶。有文章詳細的研究了甲基化相關酶的作用機制:
<Reversing DNA Methylation: Mechanisms, Genomics, and Biological Functions>
維持甲基化是指在甲基轉移酶的作用下,DNA的半保留復制過程中,會在子鏈的相應的位置進行甲基化修飾的過程。(DNA復制后,新合成鏈在DNMT1的作用下,以舊鏈為模板進行甲基化。(缺乏嚴格的精確性,95%))
重新甲基化是指在甲基轉移酶的作用下,原來沒有甲基化的DNA雙鏈上,進行甲基化的過程,之后由維持甲基化酶來維持穩定的DNA甲基化狀態(甲基化并非基因沉默的原因而是基因沉默的結果,其以某種機制識別沉默基因,后進行甲基化)。
重新甲基化引發因素可能包括:
????1). DNA本身的序列、成分和次級結構。
????2). RNA根據序列同源性可能靶定的區域。
????3).特定染色質蛋白、組蛋白修飾或相當有序的染色質結構。
3. 甲基化&癌癥
已有的研究表明胚胎的正常發育非常依賴于基因組DNA的適當甲基化,任何一種甲基轉移酶的缺失,都可導致小鼠胚胎發育的中止而死亡。
此外,各種腫瘤中都普遍存在DNA甲基化狀態的異常改變,且異常的DNA甲基化狀態是腫瘤的重要特征之一。
小鼠的體外實驗和體內實驗都已表明,全基因組水平的去甲基化可能導致整個基因組的不穩定,從而增加腫瘤的發生幾率。
抑癌基因啟動子區域CpG島的高甲基化,是諸多癌癥發生早期的重要事件之一。
4. 甲基化發生區域:?CpG島(CpG islands)
哺乳動物基因組中5mC占胞嘧啶總量的2%-7%,約70%的5mC存在于CpG二連核苷。
在結構基因的5’端調控區域, CpG二連核苷常常以成簇串聯形式排列,這種富含CpG二連核苷的區域稱為CpG島(CpG islands),其大小為500-1000bp,約56%的編碼基因含該結構。
基因調控元件(如啟動子)所含CpG島中的5mC會阻礙轉錄因子復合體與DNA的結合。
目前認為基因調控元件(如啟動子)的CpG島中發生5mC修飾會在空間上阻礙轉錄因子復合物與DNA的結合。因而DNA甲基化一般與基因沉默相關聯(DNA甲基化一般與基因沉默相關聯;非甲基化一般與基因的活化相關聯;而去甲基化往往與一個沉默基因的重新激活相關聯)。
5. 甲基化檢測技術
1). 基于限制性酶切預處理的甲基化檢測技術:
? ? 利用甲基化敏感性限制性內切酶對甲基化區域不切割的特性,將DNA消化為不同大小的片段后再進行分析。隨后進行Southern或PCR擴增分離產物,以明確目標片段的甲基化狀態。
2). 基于亞硫酸鹽修飾預處理的甲基化檢測技術:
? ? DNA經亞硫酸鹽處理后,未甲基化的胞嘧啶(C)被轉化成尿嘧啶(U),甲基化的胞嘧啶保持不變。
3). 基于親和富集預處理的甲基化檢測技術:
? ? MeDIP 方法在將基因組 DNA 超聲波打斷并變性后,使用 5- 甲基胞嘧啶特異性抗體富集甲基化片段,再分離純化得到甲基化 DNA 片段,然后再用測序等方法分析;
? ? MBDCap 技術與 MeDIP 方法類似,利用甲基化DNA結合蛋白來對甲基化的DNA進行免疫沉淀,因為采用的富集蛋白不同, MeDIP 普遍富集 CpG 低密度的甲基化區域,而 MBDCap 則普遍富集 CpG 高密度的甲基化區域 。?
目前, WGBS(全基因組甲基化測序)主要使用:?亞硫酸鹽修飾預處理后進行DNA甲基化檢測;
6.?全基因組甲基化(WGBS)基本分析內容
目前, 各大測序公司都能夠完成WGBS的分析以及檢測, 他們的分析內容主要包括以下幾部分(與所有調控類型一樣, 甲基化分析內容也主要包含: 建庫, 質控, 鑒定, 分類, 差異, 靶向, 功能等幾大部分):?
1). 質控: 衡量文庫覆蓋度, 顯示數據量的同時也基本預測了鑒定結果;
2). 甲基化位點motif識別以及屬性分類(建庫過程中,未甲基化的C已經被轉化成U了, so, 直接檢測的C即為被甲基化修飾的胞嘧啶):?
? ? Motif 表示包含mC位點在內的上下游9bp 的堿基分布特征,可以表征序列保守性。
? ? 序列環境分類(CG,CHG,CHH; H 代表A, C, T);?
3). 單樣本甲基化分析:? 在單個樣本層面進行整體水平甲基化水平密度、染色體水平甲基化水平密度、基因功能區域甲基化水平分布和基因上下游2K甲基化水平分布,這個幾個方面來展現物種甲基化模式,構建物種甲基化譜。
4). 比較組合甲基化水平分析: 從樣本group中可視化組內和組間的甲基化水平;
5). 差異甲基化分析: 根據各樣本以及各個比較組合的甲基化檢測結果, 進行差異分析;
6). 差異甲基化功能分析: 即根據差異甲基化位點, 找到該位點潛在調控的gene; 并進行gene的功能富集分析;
7. 甲基化數據庫
1).?DNAmod: the DNA modification database
? ? 官網鏈接:??https://dnamod.hoffmanlab.org/
? ? 數據庫功能包括:?Searching for DNA modifications;?Covalently modified DNA nucleobases;?
????DNAmod包括可用測序方法的手動注釋、它們在自然界中出現的描述,并提供現有和建議的命名法。DNAmod使研究人員能夠快速回顧以前的工作,選擇繪圖技術,并跟蹤有關修改的興趣基礎的最新發展。
2).?SEanalysis: a web tool for super-enhancer associated regulatory analysis
? ? 官網鏈接:?http://licpathway.net/SEanalysis/
? ??SEanalysis描述了SE相關基因、與目標SE結合的TFs及其上游途徑。當前版本的SEanalysis包含來自540多種細胞/組織的330000多個SEs、來自這些細胞/組織的5042個TF芯片seq數據、來自10個數據庫的700個人類TFs和2880條通路的DNA結合序列模體。SEanalysis支持通過SEs、樣本、TFs、途徑或基因進行搜索。這些因素形成的復雜調控網絡可以交互可視化。此外,我們開發了一個可定制的基因組瀏覽器,其中包含超過6000個可定制的可視化軌跡。
????哈哈, 數據庫我還沒有測試哦 ~ 用過的大神可以動動您的小手, 將使用鏈接留在評論區;
8. 小小的總結
1). DNA甲基化位點分析大同小異, 但各個公司的圖片精美程度, 將會為老師提供不同程度的美感體驗, 當然也能從宏觀方面說明問題 (甲基化圖譜, 真可以畫的很漂亮);
2). DNA甲基化位點主要從基因調控表達層面發揮作用, 聯合普通轉錄組測序(polyA富集protein_coding gene并進行建庫分析)結果可以發現: 甲基化調控區域, 力證甲基化調控結果(這也是目前很多公司的關聯分析切入口);
3). 但是, 細胞中的轉錄調控影響因子太多, DNA甲基化僅僅是基因沉默與否的切入口, 關于lncRNA對protein_coding gene的轉錄翻譯調控, promoter 對?protein_coding gene的轉錄調控; miRNA的降解, siRNA的干擾作用仍不能探索的面面俱到;?
4). 目前可用的數據庫越來越多(關于功能工具的, 關于數據存儲的數據庫), 老師們不可錯過哦;?
關于gene從農場(DNA)到餐桌(產物蛋白)過程中的干擾因素以及變化規律仍迷霧重重; 即使不能面面俱到, 但感謝還在真心努力著的攀登者們;
鳴謝: 來自學者們的努力, 以及網絡圖片;