2009年,Job Dekker首次開發出Hi-C技術,實現了全基因組單位內染色體片段間相互作用的捕獲。高通量染色體三維構象捕獲技術Hi-C(High-throughput chromosome conformation capture)作為國自然熱點前沿技術,是分析染色質三維空間結構的經典方法,被廣泛應用于研究三維基因組結構和表觀遺傳調控,以獲得全基因組范圍內整個染色質DNA在空間位置上的關系與相互作用模式、高分辨率的染色質三維結構信息。
揭示染色體互作模式,描繪三維結構重構圖譜
研究關鍵詞:染色質區室A/B Compartment?、拓撲結構域TAD與染色環 Chromatin loops;3D圖譜
01 A Compartment:開放的染色質,表達活躍,基因豐富,包含用于主動轉錄的組蛋白標記,通常位于細胞核的內部;
02 B Compartment:表達不活躍,基因缺乏,結構緊湊,含有基因沉默的組蛋白標志物,位于核的外圍;
03 TAD:染色質區室中互作相對頻繁的基因組區域,富含H3K27me3修飾、RNA聚合酶II以及CTCF結合位點,通常與組蛋白修飾、甲基化修飾有關;
04 Loop:局部區域的兩個高頻位點互作是成環的基礎。loop是染色質在空間中形成的環狀結構,是區室中互作頻率相對周圍較強的區域。這種結構可以使在線性距離很遠的元件得以相遇,以此來調控基因的轉錄和表達:比如,從空間上拉近啟動子和增強子的距離,促使基因的轉錄起始。
當生物體生命活動/生理狀態發生變化時(通常在表觀顯現,“由表及里”),常常伴隨染色質區室B to A/A to B的轉換,在此過程中,染色質狀態、開放性或者可及性會產生變化,進而影響一系列調控因子或元件與開放染色質區域的結合狀態(與ATAC-seq互相驗證);與此同時,TAD邊界也發生一定程度的改變,隨之而來的相關組蛋白修飾或調控因子水平的變化也會反過來影響染色質松散程度和開放性(可結合CUT&TAG測序組學研究組蛋白修飾和轉錄因子調控變化),進而影響基因的轉錄表達。
此外,據研究表明,大部分的A/B區室、TAD在不同的細胞類型中相對保守,而loop經常連接啟動子與增強子,與基因的激活有關(與RNA-seq關聯分析驗證基因表達情況),更具動態變化,因此promoter-enhancer的互作模式也會依據調控因子的水平變化產生差異,更具有針對性。
因此,錨定重點染色質區室A/B轉換、篩選差異TAD邊界甚至loop結構,分析TAD邊界上相關組蛋白修飾變化情況以及增強子的鑒定是分析染色質遠距離互作、空間結構的重要環節。而基于染色體全部的互作信息,通過數學模型將二維的染色體互作信息轉化為三維空間結構,是反映全基因組范圍內染色體互作情況的重要生信分析工具(3D圖譜,見第二部分)。
剖析染色體3D空間結構與遺傳進化史
泛三維基因組圖譜分析
在互作不同層級的基礎上(即染色質區室A/B Compartment 、拓撲結構域TAD與染色質環loop),重構不同樣本的三維結構圖譜(3D圖譜),進行不同物種間三維結構的比較,進而揭示物種間的基因組進化特征和資源多樣性演化機制,并挖掘基因組大小演化中空間結構的重組規律。另一方面,同一物種不同發育階段的三維結構比較,也能夠剖析物種遠距離調控的三維空間互作機制。因此,基于不同個體間TAD/loop等邊界的保守性及其在進化過程中的獲得和丟失分析,以及TAD富集區域的基因、轉座元件TE或染色體重排等特征,對于三維結構的重塑十分必要。另外,與基因組、轉錄組和表觀組等組學技術結合,進一步探討三維基因組結構對其功能和基因組遺傳進化的影響。
解鎖個體單體型奧秘
單體型(Haplotype),又稱為單倍體基因型,指在同一染色體上進行共同遺傳的多個基因座上等位基因的組合,即若干個決定同一性狀的緊密連鎖的基因構成的基因型;亦指一個染色單體中具有統計學關聯的一類單核苷酸多態性(SNP)。由于一個基因的SNP往往不能揭示其與性狀表型的真實關聯,因而針對多個位點的單倍型分析成為解釋錯綜復雜調控機理的有效手段。
以染色質互作為基礎的染色體跨度的個體單體型的構建和群體中各種單倍型頻率的計算,可以應用于人類健康研究中比如臨床診斷、器官移植中供受體的匹配檢測、癌癥或復雜疾病細胞拓撲結構特征的研究;也可以應用于動植物的分子育種中,如研究復雜性狀的基因調控網絡與機制。
案例分享
Cell Death & Differentiation:Hi-C揭示了干細胞在分化過程中對染色質三維結構的影響 [2]
該研究構建了hMSC向脂肪與成骨細胞分化的高分辨率染色質三維互作動態圖譜,鑒定出分化方向特異性的染色質環結構,發現這些染色質環的形成伴隨著增強子的特異性激活以及轉錄因子的特異性結合,影響基因表達的選擇性激活。通過構建分化特異性調控網絡,鑒定了細胞命運決定性調控環路,并結合CRISPR/Cas9、3D-FISH等技術驗證了調控環路對基因表達的影響。該研究結果通過Hi-C、ATAC、ChIP、RNA多組學測序數據揭示了hMSC在向脂肪、成骨細胞分化過程中的三維基因組與表觀遺傳修飾的動態景觀對于促進干細胞命運轉變過程中的重要作用,為理解hMSC的命運決定過程提供了新的思路。
BMC Biology:Hi-C技術繪制脊椎動物三維基因組結構圖譜 [3]
該研究利用12種主要脊椎動物的成纖維細胞系Hi-C數據,繪制了不同物種的三維基因組結構圖譜,表明了基因組大小和染色體長度與最上層的三維基因組結構單元——染色體疆域的形成有關,而更精細的下層結構特征,包括DNA的局部轉錄可及性,是通過脊椎動物的進化選擇的;TAD的保守性似乎與物種間基因表達的模塊化密切相關;在基因組結構的進化過程中,LINE和SINE轉座因子可能分別參與異染色質和常染色質的組織。該研究揭示了決定跨物種功能基因保守性和轉錄調控的三維基因組結構特征,擴展了人們對基因組結構形成機制的理解,為農業動植物基因組進化和重要經濟性狀的三維基因組學研究提供了參考依據。