文章來源:科研圈?2018-05-12
北京大學生命科學學院賈璐萌,李亭亭(李程研究組)
上回說到Hi-C更適用于研究大尺Hi度上的染色質結構,而不適用于研究轉錄調控元件之間的相互作用。
轉錄調控元件主要包括啟動子,增強子,絕緣子和抑制子。在轉錄的起始階段,基因的啟動子與其他遠距離調控元件(增強子,絕緣子和抑制子)空間靠近(圖4)。距離調控元件通過幫助啟動子招募具有抑制或者激活功能的轉錄相關蛋白,調控基因的轉錄(Zhang et al。,2013)。為了結合轉錄相關蛋白,這些轉錄調控元件通常缺少核小體的結合,這使用活躍調控區(qū)域的染色質相對開放(開放染色質)。針對轉錄調控元件的這些特點,可通過捕獲轉錄相關蛋白結合區(qū)域[ChIP-seq(Johnson et al。,2007)]和捕獲染色質開放區(qū)域[DNase-seq(Boyle等人,2008),FAIRE-seq(Giresi等人,2007),MNase-seq(Schlesinger等人,2013),ATAC-seq(Buenrostro等人,2013) -seq(Ponnaluri等,2017)]的技術來檢測轉錄調控元件。
為了更好的捕獲基因組轉錄調控元件之間的遠距離相互作用,結合轉錄調控元件檢測技術的其他染色質構象捕獲方法被提出。這些方法主要包括三類。
第一類,是轉錄相關蛋白介導的染色質相互作用的捕獲技術(Chia-PET(Fullwood等人,2009),HiChIP(Mumbach等人,2016),PLAC-seq(Fang等人, 2016))。在這類技術中,最早被提出的是阮一駿等開發(fā)的嘉PET技術(圖5)。在上回說到喜-C更適用于研究大尺度上的染色質結構,而不適用于研究轉錄調控元件之間的相互作用。
轉錄調控元件主要包括啟動子,增強子,絕緣子和抑制子。在轉錄的起始階段,基因的啟動子與其他遠距離調控元件(增強子,絕緣子和抑制子)空間靠近(圖4)。距離調控元件通過幫助啟動子招募具有抑制或者激活功能的轉錄相關蛋白,調控基因的轉錄(Zhang et al。,2013)。為了結合轉錄相關蛋白,這些轉錄調控元件通常缺少核小體的結合,這使用活躍調控區(qū)域的染色質相對開放(開放染色質)。針對轉錄調控元件的這些特點,可通過捕獲轉錄相關蛋白結合區(qū)域[ChIP-seq(Johnson et al。,2007)]和捕獲染色質開放區(qū)域[DNase-seq(Boyle等人,2008),FAIRE-seq(Giresi等人,2007),MNase-seq(Schlesinger等人,2013),ATAC-seq(Buenrostro等人,2013) -seq(Ponnaluri等,2017)]的技術來檢測轉錄調控元件。
為了更好的捕獲基因組轉錄調控元件之間的遠距離相互作用,結合轉錄調控元件檢測技術的其他染色質構象捕獲方法被提出。這些方法主要包括三類。
第一類,是轉錄相關蛋白介導的染色質相互作用的捕獲技術(Chia-PET(Fullwood等人,2009),HiChIP(Mumbach等人,2016),PLAC-seq(Fang等人, 2016))。在這類技術中,最早被提出的是阮一駿等開發(fā)的嘉PET技術(圖5)。在嘉PET技術中,交聯好的染色質首先被超聲打碎成獨立的相互作用復合體;結合有目的蛋白的復合體通過免疫沉淀技術被富集;目的蛋白結合的復合體的DNA末端被連接包含MMEI位點的生物素化寡核苷酸接頭;通過連接體間的連接,目的蛋白介導的存在相互作用的DNA被連接至同一片段; MmeI片段化DNA后,DNA被純化;隨后PET片段被建立庫測序.Chia-PET作為一種可以有效富集蛋白介導的染色質間相互作用的技術,自開發(fā)以來,得到了廣泛的應用.RNAPII ChIA-PET及CTCF ChIA-PET技術不僅幫助解析了轉錄相關的染色質拓撲結構(Li等,2012; Tang等,2015 ),還成功幫助解?了解非編碼區(qū)SNP位點對遠距離調控基因表達的影響(Tang et al。,2015)。2017年,同樣是用于捕獲基因組轉換調控元件之間的遠距離相互作用的技術Hi-ChIP(Mumbach這兩種技術都在Hi-C技術的基礎上結合了免疫沉淀技術,從實驗目的上與ChIA-PET一致,目前來看,與嘉PET技術相比,喜芯片與PLAC-SEQ能得到更高比例的有效讀取。相信喜芯片與PLAC-seq的也將被廣泛應用于蛋白介導的染色質相互作用的研究。
第二類,是目的探針所在區(qū)域的染色質相互作用的捕獲(Capture Hi-C)。這類技術以啟動子捕獲Hi-C(Mifsud等,2015)技術為代表,根據啟動子區(qū)域設計RNA探針,在高 - C實驗的基礎上加入了一步探針的富集,檢測啟動子探針所在區(qū)域的染色質相互作用。
第三類,是基于開放染色質間相互作用的捕獲[DNase Hi-C(Ma等人,2015),Micro-C(Hsieh等人,2015),BL-Hi-C(Liang等人, ,DNase Hi-C技術使用DNase酶取代Hi-C實驗中的限制性內切酶,消化染色質,可特異性地捕獲DNase I敏感的開放染色質間相互作用(Ma et al。 ,2015).Micro-C技術使用MNase取代Hi-C實驗中的限制性內切酶消化染色質,可以得到核小體尺度分辨率的DNA相互作用圖譜(Hsieh等,2015).BL- Hi-C技術使用識別序列為“GGCC”的限制性內切酶HaeIII進行染色質消化。由于結合有轉錄相關蛋白及結構蛋白的活躍染色質區(qū)域DNA的GC堿基組成比例更高,故BL-喜-C可富集高GC區(qū)域的活躍染色質間的相互作用。
這些方法各有優(yōu)劣及側重,從不同層面上解析染色質空間結構,回答重要生物學問題.Chia-PET(Fullwood等人,2009),HiChIP(Mumbach等人,2016),PLAC-seq (Fang et al。,2016)僅能捕獲某一種蛋白介導的染色質間的相互作用; Capture Hi-C技術通過特異性探針,捕獲探針所在區(qū)域(如啟動子區(qū))染色質間相互作用(Mifsud et al。,2015); DNase Hi-C雖然可以富集開放染色質之間的相互作用,但是由于DNase I整合效率非常高,高度片段化的染色質之間自連或隨機連接,減少了真實相互作用的捕獲比例(Li et al。,2018).BL-Hi-C捕獲了10000多個高GC區(qū)域的染色質相互作用,這些相互作用大多是CTCF HiChIP及RNAPII HiChIP的子集。這些技術雖然各有優(yōu)勢,然而大都依賴目的蛋白,探針序列,酶切偏好。綜上所述,一種不依賴于探針序列及蛋白抗體,用染色質開放程度為富集條件,直接高效富集全基?組活躍轉錄調控元件間相互作用的技術需要被開發(fā)。
OCEAN-C(Open Chromatin Enrichment And Network Hi-C)技術(圖 6)(Li et al., 2018)是結合了 FAIRE-seq 技術及 Hi-C 技術的關鍵步驟而開發(fā)的一種可以不依賴蛋白抗體及靶序列的新技術。在OCEAN-C技術中,染色質首先被甲醛交聯;隨后,染色質被限制性內切酶(MboI)消化;DNA末端修復時引入帶有生物素標記的脫氧核糖核苷酸;隨后空間存在相互作用的DNA被連接;超聲打斷染色質后,開放染色質被酚-氯仿抽提;最后,存在相互作用的開放染色質因為有生物素信號,可以被富集用于后續(xù)文庫構建。?
need-to-insert-img
與其他技術相比,第一:OCEAN- C 技術不僅能檢測到TAD、compartments等三維基因組結構,而且同時富集開放染色質區(qū)域及這些開放染色質之間的相互作用。第二:我們在三種 B 細胞相關細胞(U266,RPMI8226,GM12878)中應用了 OCEAN-C 技術,發(fā)現三種細胞中均有近 10000 個開放染色質相互作用中心(HOCI)。HOCI長度在 1 kb 左右、以活躍啟動子及增強子為主、并結合有大量轉錄相關蛋白。許多HOCI也與Super-enhancer、broad H3K4me3區(qū)域有重合,幫助理解這些新發(fā)現的重要調控區(qū)域內部和之間的互作(圖7)。第三:HOCI作為相互作用網絡的重要節(jié)點,與其他開放染色質互作,形成全基因組開放染色質相互作用網絡,調控基因表達(圖8)。
need-to-insert-img
?隨著二代測序技術的發(fā)展,越來越多的染色質構象捕獲技術被開發(fā)。三維基因組實驗技術的應用越來越廣泛,在細胞周期、細胞分化、疾病、指導基因組組裝等各方面的研究中都有應用。例如,Hi-C技術用于研究細胞有絲分裂過程中的染色質結構變化:在有絲分裂中期,染色質會失去分區(qū)和 TAD結構,坍縮為一個密集的染色質狀態(tài) (Naumova et al., 2013);5C技術用于研究干細胞分化過程中核染色質的變化:在分化過程中,由于染色質三維結構的變化,OCT4的啟動子和遠程增強子的相互作用減弱,導致OCT4表達量下降,促進細胞分化 (Beagan et al., 2016)。Hi-C技術同樣成功揭示了TAD邊界的變化對疾病產生的影響:TAD邊界遭到破壞造成原本被隔離的增強子與啟動子形成異常的相互作用,導致基因時空表達的紊亂而產生疾病,如手指畸形疾病 (Lupianez et al., 2015)和大腦膠質瘤 (Flavahan et al., 2016);
如今,隨著三維基因組研究方法的更新和研究范圍的擴展,越來越多的新的染色質構象捕獲技術被開發(fā)。最近,曹罡課題組和李國亮課題組又合作開發(fā)了更加高效經濟的DLO Hi-C技術(Lin et al., 2018)。不僅如此,單細胞Hi-C技術也逐漸被開發(fā) (Flyamer et al., 2017; Nagano et al., 2013; Ramani et al., 2017)。2014年美國國立衛(wèi)生研究院(NIH)為此專門制定了4DN計劃(4D Nucleome)(Dekker et al., 2017),斥資1.2億美元資助了24個研究項目。4DN計劃結合三維基因組學、單細胞測序、單細胞實時成像等前沿技術,開展標準化、高通量、單細胞層面、可動態(tài)觀測的三維基因組學技術和應用研究。這些技術和項目融合了多學科的技術,將極大地促進后基因組學時代從基因組的一維列研究向四維的基因組空間結構和隨時間變化的研究轉變。我們將繼續(xù)開發(fā)和應用OCEAN-C技術,研究以富集超級增強子、broad H3K4me3等結合有大量轉錄因子的基因調控元件間的相互作用,并與基因表達變化關聯,幫助進一步闡明基因組結構、功能與疾病的關系。
技術中,交聯好的染色質首先被超聲打碎成獨立的相互作用復合體;結合有目的蛋白的復合體通過免疫沉淀技術被富集;目的蛋白結合的復合體的DNA末端被連接包含MMEI位點的生物素化寡核苷酸接頭;通過連接體間的連接,目的蛋白介導的存在相互作用的DNA被連接至同一片段; MmeI片段化DNA后,DNA被純化;隨后PET片段被建立庫測序.Chia-PET作為一種可以有效富集蛋白介導的染色質間相互作用的技術,自開發(fā)以來,得到了廣泛的應用.RNAPII ChIA-PET及CTCF ChIA-PET技術不僅幫助解析了轉錄相關的染色質拓撲結構(Li等,2012; Tang等,2015 ),還成功幫助解?了解非編碼區(qū)SNP位點對遠距離調控基因表達的影響(Tang et al。,2015)。2017年,同樣是用于捕獲基因組轉換調控元件之間的遠距離相互作用的技術Hi-ChIP(Mumbach這兩種技術都在Hi-C技術的基礎上結合了免疫沉淀技術,從實驗目的上與ChIA-PET一致,目前來看,與嘉PET技術相比,喜芯片與PLAC-SEQ能得到更高比例的有效讀取。相信喜芯片與PLAC-seq的也將被廣泛應用于蛋白介導的染色質相互作用的研究。
第二類,是目的探針所在區(qū)域的染色質相互作用的捕獲(Capture Hi-C)。這類技術以啟動子捕獲Hi-C(Mifsud等,2015)技術為代表,根據啟動子區(qū)域設計RNA探針,在高 - C實驗的基礎上加入了一步探針的富集,檢測啟動子探針所在區(qū)域的染色質相互作用。
第三類,是基于開放染色質間相互作用的捕獲[DNase Hi-C(Ma等人,2015),Micro-C(Hsieh等人,2015),BL-Hi-C(Liang等人, ,DNase Hi-C技術使用DNase酶取代Hi-C實驗中的限制性內切酶,消化染色質,可特異性地捕獲DNase I敏感的開放染色質間相互作用(Ma et al。 ,2015).Micro-C技術使用MNase取代Hi-C實驗中的限制性內切酶消化染色質,可以得到核小體尺度分辨率的DNA相互作用圖譜(Hsieh等,2015).BL- Hi-C技術使用識別序列為“GGCC”的限制性內切酶HaeIII進行染色質消化。由于結合有轉錄相關蛋白及結構蛋白的活躍染色質區(qū)域DNA的GC堿基組成比例更高,故BL-喜-C可富集高GC區(qū)域的活躍染色質間的相互作用。
這些方法各有優(yōu)劣及側重,從不同層面上解析染色質空間結構,回答重要生物學問題.Chia-PET(Fullwood等人,2009),HiChIP(Mumbach等人,2016),PLAC-seq (Fang et al。,2016)僅能捕獲某一種蛋白介導的染色質間的相互作用; Capture Hi-C技術通過特異性探針,捕獲探針所在區(qū)域(如啟動子區(qū))染色質間相互作用(Mifsud et al。,2015); DNase Hi-C雖然可以富集開放染色質之間的相互作用,但是由于DNase I整合效率非常高,高度片段化的染色質之間自連或隨機連接,減少了真實相互作用的捕獲比例(Li et al。,2018).BL-Hi-C捕獲了10000多個高GC區(qū)域的染色質相互作用,這些相互作用大多是CTCF HiChIP及RNAPII HiChIP的子集。這些技術雖然各有優(yōu)勢,然而大都依賴目的蛋白,探針序列,酶切偏好。綜上所述,一種不依賴于探針序列及蛋白抗體,用染色質開放程度為富集條件,直接高效富集全基?組活躍轉錄調控元件間相互作用的技術需要被開發(fā)。
OCEAN-C(Open Chromatin Enrichment And Network Hi-C)技術(圖 6)(Li et al., 2018)是結合了 FAIRE-seq 技術及 Hi-C 技術的關鍵步驟而開發(fā)的一種可以不依賴蛋白抗體及靶序列的新技術。在OCEAN-C技術中,染色質首先被甲醛交聯;隨后,染色質被限制性內切酶(MboI)消化;DNA末端修復時引入帶有生物素標記的脫氧核糖核苷酸;隨后空間存在相互作用的DNA被連接;超聲打斷染色質后,開放染色質被酚-氯仿抽提;最后,存在相互作用的開放染色質因為有生物素信號,可以被富集用于后續(xù)文庫構建。?
與其他技術相比,第一:OCEAN- C 技術不僅能檢測到TAD、compartments等三維基因組結構,而且同時富集開放染色質區(qū)域及這些開放染色質之間的相互作用。第二:我們在三種 B 細胞相關細胞(U266,RPMI8226,GM12878)中應用了 OCEAN-C 技術,發(fā)現三種細胞中均有近 10000 個開放染色質相互作用中心(HOCI)。HOCI長度在 1 kb 左右、以活躍啟動子及增強子為主、并結合有大量轉錄相關蛋白。許多HOCI也與Super-enhancer、broad H3K4me3區(qū)域有重合,幫助理解這些新發(fā)現的重要調控區(qū)域內部和之間的互作(圖7)。第三:HOCI作為相互作用網絡的重要節(jié)點,與其他開放染色質互作,形成全基因組開放染色質相互作用網絡,調控基因表達(圖8)。
?隨著二代測序技術的發(fā)展,越來越多的染色質構象捕獲技術被開發(fā)。三維基因組實驗技術的應用越來越廣泛,在細胞周期、細胞分化、疾病、指導基因組組裝等各方面的研究中都有應用。例如,Hi-C技術用于研究細胞有絲分裂過程中的染色質結構變化:在有絲分裂中期,染色質會失去分區(qū)和 TAD結構,坍縮為一個密集的染色質狀態(tài) (Naumova et al., 2013);5C技術用于研究干細胞分化過程中核染色質的變化:在分化過程中,由于染色質三維結構的變化,OCT4的啟動子和遠程增強子的相互作用減弱,導致OCT4表達量下降,促進細胞分化 (Beagan et al., 2016)。Hi-C技術同樣成功揭示了TAD邊界的變化對疾病產生的影響:TAD邊界遭到破壞造成原本被隔離的增強子與啟動子形成異常的相互作用,導致基因時空表達的紊亂而產生疾病,如手指畸形疾病 (Lupianez et al., 2015)和大腦膠質瘤 (Flavahan et al., 2016);
如今,隨著三維基因組研究方法的更新和研究范圍的擴展,越來越多的新的染色質構象捕獲技術被開發(fā)。最近,曹罡課題組和李國亮課題組又合作開發(fā)了更加高效經濟的DLO Hi-C技術(Lin et al., 2018)。不僅如此,單細胞Hi-C技術也逐漸被開發(fā) (Flyamer et al., 2017; Nagano et al., 2013; Ramani et al., 2017)。2014年美國國立衛(wèi)生研究院(NIH)為此專門制定了4DN計劃(4D Nucleome)(Dekker et al., 2017),斥資1.2億美元資助了24個研究項目。4DN計劃結合三維基因組學、單細胞測序、單細胞實時成像等前沿技術,開展標準化、高通量、單細胞層面、可動態(tài)觀測的三維基因組學技術和應用研究。這些技術和項目融合了多學科的技術,將極大地促進后基因組學時代從基因組的一維列研究向四維的基因組空間結構和隨時間變化的研究轉變。我們將繼續(xù)開發(fā)和應用OCEAN-C技術,研究以富集超級增強子、broad H3K4me3等結合有大量轉錄因子的基因調控元件間的相互作用,并與基因表達變化關聯,幫助進一步闡明基因組結構、功能與疾病的關系。