DNA甲基化預測COVID-19急性呼吸窘迫綜合征患者的結局

DNA methylation predicts the outcome of COVID-19 patients with acute respiratory distress syndrome

DNA甲基化可預測COVID-19急性呼吸窘迫綜合征患者的結局

發表期刊:J Transl Med

發表日期:2022 Nov 12

影響因子:8.440

DOI:? 10.1186/s12967-022-03737-5

一、研究背景

????????COVID-19是一種新型冠狀病毒,于2019年底在中國武漢首次發現,2020年3月被世界衛生組織(WHO)宣布為大流行病。兩年后,檢測到幾個變種,有超過500萬例死亡記錄。嚴重的COVID-19感染患者常常出現呼吸衰竭,可能需要機械通氣,與高達50%的死亡率有關。已經確定了危重病人結局的幾個預測因素。它們主要包括臨床變量、生化標志物和并發癥。感染期間,宿主細胞的DNA甲基化可以被改變,從而調節免疫反應。

????????表觀遺傳學指的是研究不依賴DNA序列的基因活動調節和表達變化。DNA甲基化是表觀遺傳學的標志之一,涉及到在胞嘧啶環的5′碳上共價添加一個甲基。甲基化與基因表達呈反比關系。

二、材料與方法

1、數據來源

在四個時間點(T)進行隨訪:第7天(T2)、第14天(T3)、第21天(T4)和第60天(后T4)

流程圖

2、分析流程

1) PBMCs分離和DNA提取

2) EPIC850甲基化質量控制、數據過濾和歸一化

3) 免疫細胞種群的估計:R中的FlowSorted Blood EPIC包被用來估計來自歸一化甲基化數據的細胞類型組成,包括T淋巴細胞(CD4 +和CD8 +)、B細胞(CD19 +)和單核細胞(CD14 +)、NK細胞(CD56 +)以及中性粒細胞;使用R中broom包中的lm和glance函數,確定了確定免疫細胞比例之間差異的準確模型

4) 甲基化分析和組間比較

5) 預測結果:對CpGs進行單變量Cox比例風險分析,以確定與患者生存有關的甲基化位點;使用R中的生存包,用K-M分析來估計兩組基因的生存差異,通過cox比例風險模型來估計兩組之間的差異;使用pROC軟件包對甲基化被用于預測生存的邏輯回歸模型進行ROC分析

三、實驗結果

01 - 入院時COVID-19患者與對照組之間的甲基化差異

????????作者首先進行了PCA分析,以確定數據集中是否存在人群分層的情況。主成分1(PC1)解釋了13.5%的變異。相比之下,PCA 2解釋了9.3%的變異,沒有觀察到與COVID-19或對照組參與者或種族有關的人群結構化。

????????在COVID-19中,免疫細胞的比例經常是可變的;因此,進行去卷積法,根據過濾和歸一化的數據估計每個樣本中免疫細胞的比例。使用線性模型,隨后尋找在組間有明顯差異的細胞比例。基于AIC的最佳模型,CD8 T細胞、CD4 T細胞和B細胞在COVID-19患者和對照組之間存在明顯差異。與對照組相比,COVID-19患者的CD8和CD4 T細胞明顯降低,B細胞明顯升高(圖2A)。

圖2

????????為了研究CpG甲基化水平的變化是否與COVID-19感染有關,首先通過測試臨床協變量和免疫細胞比例,建立了最佳線性模型。共測試了11個不同的模型,根據AIC標準,三種免疫細胞類型(CD8 T細胞、CD4 T細胞和B細胞)比例對CpGs的數量貢獻最大;因此,它們被納入差異甲基化分析的最終模型。與對照組相比,在COVID-19患者中檢測到33.3%的差異甲基化CpG(750874中共有133335個;71527個低甲基化,61808個高甲基化)(圖3)。基因相關的不同甲基化CpGs占0.7%(1054/133335),而啟動子相關的CpGs更為豐富,占14.4%(19238/133335),表明其在基因調控中的潛在作用。觀察到的甲基化變化與20822個獨特的基因有關。

圖3 COVID-19患者與對照組之間不同程度的甲基化CpGs

????????為了確定分析的可重復性,作者將觀察結果與以前發表的數據進行了比較(圖4)。首先,調查了以前在預測COVID-19嚴重程度方面顯示出極大準確性的44個CpG位點在COVID-19和對照組之間是否存在差異。代表6個基因的9個CpG,包括IFI44L(cg13452062)、DDO(cg02872426)、SGMS1(cg10188795)、CXCR2(cg19225688)、CCDC6(cg04736673)、CDC42BPB(cg02003183)、cg06601098、cg11671940和cg18523915也在本研究中被差異甲基化。此外,在相同的基因中發現了不同的甲基化CpG,但與Castro de Moura等人的研究報告中的位點不同,這些基因包括:AIM2和HLA-C基因中的兩個CpG,以及以下每個基因中的一個CpG位點:CELF4, CEP85L, KIFAP3, LCE1C, LHX6, MOBKL2A, PM20D1, PM20D1, SORCS1, UBAP2L, UBE2W, VIM, ZNF385D。

圖4 UpSet圖

????????此外,作者檢查了以前報道的COVID-19相關的基因是否有明顯的CpG甲基化變化。在Castro de Moura等人報道并在其他研究中重復的40個基因中,在COVID-19患者的39個基因中檢測到220個CpG,107個超甲基化,113個低甲基化(圖3、4)。這些基因包括免疫反應、病毒進入、病毒復制、血液凝固、肺細胞中的蛋白質結合、泛素連接酶和ACE2相關基因。作者進一步進行路徑富集分析,以測試顯著甲基化的CpGs之間的關系。發現免疫相關途徑的明顯富集,包括干擾素-γ和干擾素-α反應、早期雌激素反應、頂端表面和紫外線反應。這些途徑在COVID-19患者中出現低甲基化,表明許多免疫相關基因可能被誘導表達。有絲分裂紡錘體途徑是COVID-19患者中唯一的高甲基化途徑。

????????還使用與CpGs相同的模型進行了差異甲基化區域(DMR)分析,其中在COVID-19患者中發現了4788個低甲基化,包含≥5個CpGs的簇,跨越5723個基因。還檢測到總共4347個低甲基化區域,覆蓋5072個基因,表明DMRs橫跨一個以上的基因。為了確定DMR分析檢測到的基因之間的關系,進行了通路富集分析。作者發現干擾素-α反應和Kras信號通路在COVID-19中低甲基化的明顯富集。相反,有絲分裂紡錘體途徑超甲基化,顯示出與單個CpG分析的相似性。

????????3名COVID-19患者在T2時死亡,5名在T3時死亡,4名在T4時死亡,12名在T4后死亡,即60天內最初納入的100名患者中有24名死亡(24%)。死亡的病人平均比康復的病人大11歲。正如預期的那樣,他們有更多的鼻腔感染,更有可能接受體外膜氧合(ECMO)。但是他們并沒有患更多的心血管疾病。

02 - COVID-19組中基線和最后記錄的時間點之間DNA甲基化變化的相互比較

????????作者比較了納入時的免疫細胞含量和甲基化特征與死亡或康復前最后記錄的甲基化特征。在恢復期,與他們的基線免疫細胞含量相比,檢測到更高比例的CD4 T細胞和更低比例的中性粒細胞(圖2B)。此外,確定了11989個低甲基化和22082個高甲基化的CpGs(圖5A),涉及到多個途徑。高甲基化的CpGs在炎癥反應、干擾素-α反應、血紅素代謝、通過NF-kB的TNF-alfa信號傳導、雌激素早期反應、Kras信號傳導、uv反應dn、il2 stat5信號傳導、有絲分裂主軸、干擾素-gamma反應、IL6 jak stat3信號傳導、頂端連接和成肌途徑中富集。低甲基化的CpGs在異體移植排斥、有絲分裂紡錘體和myc靶點v1途徑中富集。在死亡的病人中,基線和死亡前最后記錄的時間點之間的免疫細胞比例沒有差異(圖3)。令人驚訝的是,與在那些康復的患者中觀察到的變化相比,這些患者表達的差異性甲基化變化的數量比他們的基線值少。檢測到3150個低甲基化和3652個高甲基化的CpGs(圖5B)。經FDR校正后,與這些甲基化變化相關的途徑沒有明顯變化。

圖5 死亡和康復的COVID-19患者之間的差異性甲基化

????????作者還進行了DMR分析,考慮了有五個或更多CpGs的區域。在康復的病人中,有310個相對于363個基因的高甲基化區域和82個相對于102個基因的低甲基化區域。在FDR校正后,沒有明顯的路徑。然而,一些與免疫有關的、在單個CpGs分析中具有顯著性的路徑也顯示出DMR意義。還測試了是否有DMRs與死亡明顯相關,確定了35個區域,包括45個基因,在死亡的病人中被高甲基化。在同一對比中,只有三個區域是低甲基化的,它們跨越了四個基因(即GNAS、MEST、RP1-309F20.3)。盡管如此,沒有發現與這些DMR變化有關的重要途徑。

03 - 兩組之間在納入和隨訪結束時的DNA甲基化差異的內部比較

????????作者比較了死亡的COVID-19患者和恢復到基線水平的患者。首先測試了模型,包括臨床協變量的不同組合,以確定比較免疫細胞比例差異的最佳模型。根據這一標準,不含協變量的模型(mod7;細胞比例~死亡/恢復)被選為最佳模型,并被用于數據分析。沒有發現 "死亡 "和"恢復 "患者在基線或最后一個時間點的免疫細胞有明顯的差異。接下來通過測試不同的協變量,建立了這些組的差異化甲基化比較的最佳模型。模型 "none"(沒有任何協變量)根據兩個標準適合大多數的CpGs,因此這個模型被選為后續分析。

????????CpG位點或區域表明,基線(基線死亡與基線恢復)的甲基化變化對結果沒有明顯影響。然而,在最后一個時間點比較相同的病人,結果是死亡的病人與康復的病人相比,有1478個低甲基化和1557個高甲基化的CpG(圖5C)。此外,在190個基因附近的156個區域發現了高甲基化的DMRs,在133個基因中發現了102個低甲基化的區域。沒有基于DMR途徑的基因的重要途徑,在這個比較中,也沒有發現任何免疫細胞比例的差異。

????????Castro de Moura等人發表的研究預測了嚴重的COVID-19病例的44個CpGs,與之相比,作者發現有5個CpGs僅在康復的病人的基線和最后的時間點之間存在差異。沒有一個在死亡的病人和他們的基線之間有差異(圖4)。四個CpG(cg11671940;RP11-351M16.3,cg10188795;SGMS1,cg17515347和cg24145401;AIM2)與基線相比是高甲基化的,一個是低甲基化的(cg06601098),它不屬于任何基因區域。在Castro de Moura等人的嚴重COVID-19病例中,除了一個CpG是低甲基化的,其他都是低甲基化的。它們在康復的病人中都有明顯的高甲基化,表明它們有可能改善結果。在Castro de Moura等人的研究中,cg06601098是一個例外,它在康復的嚴重COVID-19患者中被低甲基化。然而,在比較康復患者與死亡患者的最后一個時間點時,這些變化都不明顯。

????????此外,還從以前的研究中發現了40個候選基因的CpGs變化。在此,觀察到康復者在最后一個時間點與基線相比,有29個高甲基化和31個低甲基化的CpGs(圖6)。死亡的病人有7個高甲基化和8個低甲基化的CpG。其中一個CpGs(TMPRSS2基因中的cg16371860)在康復者和死亡者中都有明顯的低甲基化;因此,作為康復的潛在標志物,它可能沒有多大意義。將最后一個時間點的康復者和死亡者與已發表的數據進行比較,沒有發現Castro de Moura等人的任何重要CpG。然而,作者從40個候選基因中發現了9個CpGs,包括死亡患者中兩個低甲基化的CpGs(啟動子相關的OAS1;cg18217049,和TMPRSS2;cg19020860)。還看到死亡患者中有三個高甲基化的CpGs,來自STAT3(cg17833746,cg24312520,cg24718015),一個來自OAS2(cg19371652),一個來自LZTFL1(cg09709426),還有一個是來自TBK1基因(cg13540592)(圖6)。

圖6 舊研究中與COVID-19有關的基因的CpGs的顯著變化

04 - 關鍵的COVID-19疾病誘發的差異性甲基化的時間過程

????????為了確定甲基化隨時間的變化,作者分析了所有四個時間點的死亡或在第60天(T4后)康復的患者。首先,研究了死亡和康復的病人在免疫細胞動態方面是否有差異。使用樣條函數的免疫細胞比例分析確定了中性粒細胞的顯著變化,中性粒細胞在后來死亡的病人中顯示出T3和T4的突然增加。相反,那些康復的患者則表現出相反的情況(圖7A),表明這些細胞在臨床結果中的關鍵重要性。

????????作者發現在49個CpG位點上,死亡的患者和康復的患者在四個時間點上的甲基化趨勢存在差異,這些位點對應于27個基因(圖8),其中大部分已知是調節蛋白結合的活性。在這27個基因中,19個已經在COVID-19中報道過,要么是病毒進入和與受體結合,要么是臨床預測,如疾病的嚴重程度或其與末端器官損傷的關系。

圖8 在四個時間點上死亡和康復的病人之間CpGs的顯著變化

????????在COVID-19中沒有報道的基因中,有兩個已知在免疫系統中起作用:DEFB116和DEFB115。這些基因屬于β-防御素系統,它是先天免疫反應的重要組成部分,在保護免受感染方面發揮著重要作用。作者發現這些基因的CpGs在所有四個時間點上有不同的甲基化(圖7B和C)。DEFB115在死亡的COVID-19患者中總體上甲基化程度較低,這表明在關鍵的COVID-19患者中表達可能增加。DEF116只在死亡的病人中出現低甲基化。

圖7 COVID-19患者四個時間點的免疫細胞和甲基化變化摘要

05 - 對疾病結果的預測

????????作者測試了COVID-19兩組基線和結果前最后記錄的時間點之間的相互比較、兩組納入時和隨訪結束時的內部比較所發出的所有CpGs(共40,956個),以及從差異甲基化的時間過程發出的CpGs。共有13個CpGs對應于8個基因預測了結果,其中三個基因是通過比較存活患者的基線和最后一個時間點的甲基化變化發出的(PSMB9、MFHAS1和MRPS2),五個基因是通過比較死亡患者的基線和最后一個時間點發出的(MAT2B、YY1P2、ROCK1、ZNF789、H1F0)。

????????ROC1、ZNF789和H1F0的甲基化程度較高,增加了死亡風險(圖9),而PSMB9、MFHAS1、MRPS2、MAT2B和YY1P2的高甲基化會降低其風險(圖10)。該模型的敏感性和特異性的ROC曲線顯示,ZNF789(80.6%)和MRPS2(80%)的預測結果非常好,PSMB9(78.5%)、MFHAS(75.7%)、H1F0(75.8%)、YY1P2(72%)和ROCK1(77.7%)基因的預測結果較好,而MAT2B(66.9%)則一般(圖9和10)。這些基因大多與炎癥或DNA調節有關,有趣的是,這些基因中有7個在以前的COVID-19研究中被報道過。進一步,查看了SRTING數據庫,以評估這些基因的蛋白質相互作用。同時,在降低死亡率的五個基因中不存在相互作用,在Reactome途徑中存在富集,被稱為 "凋亡執行途徑"。

圖9 Kaplan-Meier和ROC分析
圖10

四、結論

????????總的來說,作者在重癥COVID-19患者的ARDS中發現了一個預測臨床結果的表觀遺傳特征。雖然免疫相關的途徑,干擾素-α和-γ,最初是區分重癥COVID-19的主要生物機制,但由八個基因組成的表觀遺傳學特征集預測了生存率。需要進一步的研究來闡明甲基組作為疾病生物標志物的潛在用途,最重要的是評估DNA甲基轉移酶、核苷抑制劑或其他藥物潛在的表觀遺傳學靶向療法在COVID-19中的應用。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容