影響因子:7.31
關(guān)于非腫瘤生信,我們也解讀過很多
目前非腫瘤中結(jié)合熱點(diǎn)基因集,免疫浸潤,機(jī)器學(xué)習(xí),分型的分析是比較先進(jìn)的。有需要的分析的朋友歡迎交流!!
研究概述:
心房顫動(dòng)(AF)是缺血性卒中的主要危險(xiǎn)因素,而僅憑臨床特征和神經(jīng)影像學(xué)表現(xiàn)都不能可靠地分類心源性栓塞性卒中(CE)。本研究旨在確定在心房顫動(dòng)相關(guān)心源性栓塞性卒中(AF-CE)患者中具有診斷價(jià)值的新型潛在生物標(biāo)志物,區(qū)分AF-CE與其他類型缺血性卒中。
研究者對(duì)AF和CE的共同的DEGs進(jìn)行綜合分析后,使用LASSO和SVM-RFE兩種機(jī)器學(xué)習(xí)算法確定了三個(gè)診斷標(biāo)志物C1QC、VSIG4 和 CFD。然后采用RT-qPCR分析了3種診斷標(biāo)志物的表達(dá)水平,發(fā)現(xiàn)水平高低可用于區(qū)分AF-CE患者與正常對(duì)照組,并可有效區(qū)分AF-CE和LAA卒中。之后使用臨床樣本驗(yàn)證結(jié)果,并使用ROC曲線分析確定這些特征標(biāo)志基因的診斷價(jià)值。最終得出C1QC、VSIG4 和 CFD 可作為 AF-CE 的獨(dú)立因素和診斷標(biāo)準(zhǔn)。最后建立了列線圖模型、開發(fā)了在線預(yù)測工具。
研究結(jié)果:
一、差異表達(dá)基因的鑒定
1. 在與CE相關(guān)的GSE58294 (GPL570)數(shù)據(jù)集中,與對(duì)照組相比,在中風(fēng)后三個(gè)時(shí)間點(diǎn)(<3 h(圖1a)、5 h(圖1b)和24 h(圖1c)分別篩選DEGs。同時(shí),從GSE41177中獲得13962個(gè)AF相關(guān)的DEGs (圖1d)。
2. GSE58294數(shù)據(jù)集中不同時(shí)間點(diǎn)的DEGs結(jié)果的交集有418個(gè)DEGs (圖1e)。該交集中的DEGs交叉得到316個(gè)AF-CE基因(圖1f)。
3. 將GSE58294和GSE41177數(shù)據(jù)集合并為訓(xùn)練集,移除批處理效果后使用limma包獲得13個(gè)AF-CE相關(guān)的DEGs基因(AP000525.9、POM121L9P、TIMM8A、MCEMP1、C1QC、LOC100996760、BCL2A1、S100A12、VSIG4、OLAH、ANKRD22、BMX、CFD),其中9個(gè)基因上調(diào),4個(gè)基因下調(diào)(圖1g)。
二、功能相關(guān)分析
1. 使用Metascape在線工具進(jìn)行功能標(biāo)注。結(jié)果表明:AF-CE相關(guān)的DEGs標(biāo)志性富集于氧化應(yīng)激誘導(dǎo)的衰老、氧化應(yīng)激反應(yīng)的調(diào)控、氧化應(yīng)激反應(yīng)的調(diào)控、細(xì)胞程序性死亡、上皮細(xì)胞增殖的調(diào)控、VEGFA-VEGFR2信號(hào)通路、補(bǔ)體和凝血級(jí)聯(lián)、雌激素信號(hào)通路、snRNA 3’端加工、MHC II類蛋白復(fù)合物組裝、細(xì)胞對(duì)生長因子刺激反應(yīng)的調(diào)控、肌肉結(jié)構(gòu)發(fā)育、白細(xì)胞介素-12的產(chǎn)生、癌癥中的蛋白多糖、水楊酸與甘氨酸的偶聯(lián)以及附肢形態(tài)發(fā)生(圖2a)。
2. DO富集分析結(jié)果顯示,AF-CE相關(guān)的DEGs主要與免疫介導(dǎo)的炎癥性疾病(肝炎、乙肝、丙肝)和女性生殖系統(tǒng)疾病(女性生殖器官癌、卵巢上皮性癌、卵巢表面惡性上皮間質(zhì)腫瘤、卵巢癌、泌尿系統(tǒng)癌)相關(guān)(圖2B)。
三、利用LASSO和SVM-RFE算法選擇診斷標(biāo)記
1. 使用兩種不同的算法(LASSO和SVM-RFE)從組合訓(xùn)練集(GSE58294和GSE41177)中篩選特征基因。SVM-RFE算法結(jié)果表明,當(dāng)特征數(shù)為13,包含前文所述13個(gè)AF-CE相關(guān)的DEGs時(shí)分類器誤差最小(圖3a、 b)。
2. LASSO算法經(jīng)過十倍交叉驗(yàn)證,選取10個(gè)基因,分別為AP000525.9、TIMM8A、S100A12、LOC100996760、VSIG4、C1QC、BCL2A1、OLAH、BMX、CFD(圖3c、 d)。
3. 最終選擇LASSO和SVM-RFE算法之間共有的7個(gè)特征基因(LOC100996760、VSIG4、C1QC、BCL2A1、OLAH、BMX和CFD)進(jìn)一步分析(圖3e)。7個(gè)特征基因的ROC分析AUC值均大于0.8,提示這7個(gè)基因可作為AF-CE患者的診斷標(biāo)志物(圖3f)。
4. 為進(jìn)一步驗(yàn)證這7個(gè)候選診斷基因的可靠性和可重復(fù)性,作者合并了兩個(gè)數(shù)據(jù)集(GSE115574和GSE14975)作為驗(yàn)證集。結(jié)果顯示,CFD (P < 0.05)、VSIG4 (P < 0.01)和C1QC (P < 0.05)在AF和SR之間存在差異(圖4a、b)。
5. 圖4c 的ROC分析顯示,三基因組合模型(C1QC+VSIG4+CFD)的AUC為0.794,高于單個(gè)基因的AUC:C1QC(0.672),VSIG4 (0.688),CFD( 0.671),組合模型具有較高的診斷價(jià)值。
6. 而動(dòng)脈粥樣硬化數(shù)據(jù)集GSE20129中C1QC、VSIG4和CFD的表達(dá)無明顯差異(圖4d -f)。從上述結(jié)果來看,特征生物標(biāo)志物VSIG4、C1QC和CFD具有較高的診斷準(zhǔn)確性。
四、特征生物標(biāo)志物的通路分析
為確定VSIG4,C1QC和CFD的生物學(xué)相關(guān)性,作者從PathCards數(shù)據(jù)庫進(jìn)行富集分析。
結(jié)果表明,候選特征生物標(biāo)志物主要富集于免疫應(yīng)答凝集素誘導(dǎo)補(bǔ)體通路、纖維蛋白凝塊形成(凝血級(jí)聯(lián)反應(yīng))、C4和C2激活劑的產(chǎn)生、先天免疫系統(tǒng)、補(bǔ)體通路、補(bǔ)體和凝血級(jí)聯(lián)、對(duì)血小板胞質(zhì)Ca升高的反應(yīng)2+和脂肪生成(圖5a)。
故認(rèn)為VSIG4,C1QC和CFD可能與AF-CE的調(diào)節(jié)細(xì)胞免疫反應(yīng)有關(guān),而細(xì)胞免疫反應(yīng)又反過來影響AF-CE的風(fēng)險(xiǎn)。
五、免疫細(xì)胞浸潤
1. 作者計(jì)算了GSE58294數(shù)據(jù)集中患者樣本、腦卒中后<3、5和24h患者樣本與對(duì)照樣本之間免疫細(xì)胞浸潤分布的差異。
①與對(duì)照組相比,AF-CE組在腦卒中后<3、5、24 h中性粒細(xì)胞升高;5 h 呈現(xiàn)M0、M2巨噬細(xì)胞升高;24 h 呈現(xiàn)T細(xì)胞γ δ和M2巨噬細(xì)胞升高。靜息樹突狀細(xì)胞在腦卒中后3 h和5 h顯著降低。
②幼稚CD4 T細(xì)胞在腦卒中后3h較低,嗜酸性粒細(xì)胞在腦卒中后5h較低,CD8 T細(xì)胞和靜息NK細(xì)胞在腦卒中后24小時(shí)較低。(P 均< 0.05)
2. 對(duì)三個(gè)特征生物標(biāo)志物,發(fā)現(xiàn)CFD(圖5b)與中性粒細(xì)胞呈正相關(guān),與幼稚B細(xì)胞、幼稚CD4 T細(xì)胞和靜息NK細(xì)胞呈負(fù)相關(guān)。C1QC(圖5c)與中性粒細(xì)胞和靜息肥大細(xì)胞呈正相關(guān),與靜息樹突狀細(xì)胞呈負(fù)相關(guān)。VSIG4(圖5d)與中性粒細(xì)胞呈正相關(guān),與中性粒細(xì)胞、 T濾泡輔助細(xì)胞、靜息樹突狀細(xì)胞和嗜酸性粒細(xì)胞呈負(fù)相關(guān)。這些結(jié)果與通路分析的結(jié)果一致。
六、臨床樣本中診斷基因的表達(dá)
為進(jìn)一步證實(shí),作者收集53份臨床血樣(20例LAA患者,20例CE患者和13例對(duì)照)進(jìn)行qRT-PCR分析,檢測C1QC、VSIG4和CFD的表達(dá)。如圖6a-c所示,與健康對(duì)照相比,CE組和LAA組C1QC和VSIG4表達(dá)明顯升高,而CFD表達(dá)降低。
七、C1QC、VSIG4 和 CFD 作為潛在AF-CE 生物標(biāo)志物的評(píng)估
1. 構(gòu)建ROC曲線以評(píng)價(jià)候選診斷基因的診斷準(zhǔn)確性。(AUC越接近于1,真實(shí)性越高)
對(duì)照組CT與CE患者比較結(jié)果:(95%可信區(qū)間和p值見于圖片,下同)
C1QC(圖6d)的AUC為0.7885,VSIG4(圖6e)的AUC為0.8769,CFD(圖6f)的AUC為0.8250。
2. 對(duì)照組與LAA患者比較結(jié)果:C1QC(圖6g)的AUC為0.8632,VSIG4 (圖6h)的AUC為0.8423,CFD(圖6i)的AUC為0.9219。
3. CE患者與LAA患者比較結(jié)果:C1QC(圖6j)的AUC為0.7350,VSIG4(圖6k)的AUC為0.9675,CFD(圖6l)的AUC為0.7575。
4. 這些結(jié)果表明,C1QC、VSIG4和CFD表達(dá)在區(qū)分對(duì)照組、CE和LAA患者方面具有很大的價(jià)值,且對(duì)所分析的兩種腦卒中亞型具有特異性。因此C1QC、VSIG4和CFD可能是AF-CE的診斷生物標(biāo)志物。
八、AF-CE診斷列線圖和在線預(yù)測工具的構(gòu)建和評(píng)估
1. 基于3個(gè)診斷基因(C1QC、CFD和VSIG4),使用“RMS”包構(gòu)建診斷AF-CE的列線圖(圖7a)。為更直觀地評(píng)估列線圖模型的臨床效果,基于決策曲線分析(DCA)生成的曲線計(jì)算了臨床影響曲線。AF-CE列線圖(圖7b)具有良好的區(qū)分效果,曲線下面積AUC為0.969(95%CI:0.940-0.991)。紅色表示的高風(fēng)險(xiǎn)曲線與藍(lán)色表示的真陽性患者曲線非常接近。這表明列線圖模型能夠且可以接受準(zhǔn)確預(yù)測區(qū)別(圖7c)。
2. DCA表明,C1QC+CFD+VSIG4曲線遠(yuǎn)高于灰線,這解釋了列線圖模型的高精度(圖7d)。此外,還構(gòu)建了校準(zhǔn)曲線以確定列線圖模型的預(yù)測能力。AF-CE的實(shí)際風(fēng)險(xiǎn)和預(yù)測風(fēng)險(xiǎn)之間幾乎沒有差異,表明預(yù)測AF-CE的準(zhǔn)確性很高(圖7e)。
3. 此外作者開發(fā)了一種在線預(yù)測工具用于臨床應(yīng)用,基于構(gòu)建的列線圖預(yù)測AF-CE的風(fēng)險(xiǎn)。將候選診斷基因(C1QC,CFD和VSIG4)的表達(dá)水平輸入在線預(yù)測工具,結(jié)果表明所有AF-CE患者測試樣本得分接近100%,而健康對(duì)照接近0%,這表明預(yù)測軟件具有較高的描繪精度。
九、臨床病理參數(shù)(包括年齡、性別、TIA、心源性疾病、心悸、呼吸困難、高血壓、吸煙、左心房直徑和糖尿病)與候選疾病生物標(biāo)志物之間的相關(guān)性
1. C1QC表達(dá)與年齡>60歲、糖尿病史、高血壓史、以及當(dāng)前或近期吸煙呈正相關(guān),而與患者其他臨床病理參數(shù)無相關(guān)性(P > 0.05)。
2. 對(duì)于CFD的表達(dá),在上述臨床病理特征均有顯著差異:糖尿病史與較低的CFD表達(dá)相關(guān),女性表達(dá)低于男性,高血壓史者表達(dá)較低。(P < 0.05)
3. VSIG4表達(dá)明顯增高在高血壓史、心源性疾病史、心悸史、吸煙者、年齡> 60歲、女性。(P < 0.05)
研究總結(jié):
本研究首次探索了特定的基于血液的生物標(biāo)志物C1QC、VSIG4 和 CFD,可通過機(jī)器學(xué)習(xí)快速診斷AF-CE患者,這可能有助于支持治療計(jì)劃和二級(jí)預(yù)防計(jì)劃。此外,這些生物標(biāo)志物主要富集在免疫系統(tǒng)和補(bǔ)體通路中,可能為進(jìn)一步研究奠定基礎(chǔ)。