最新7+非腫瘤生信,機(jī)器學(xué)習(xí)篩選關(guān)鍵基因+樣本驗(yàn)證。目前機(jī)器學(xué)習(xí)已經(jīng)替代WGCNA成為篩選關(guān)鍵基因方法。非腫瘤生信分析歡迎咨詢!

影響因子:7.31

關(guān)于非腫瘤生信,我們也解讀過很多

目前非腫瘤中結(jié)合熱點(diǎn)基因集,免疫浸潤,機(jī)器學(xué)習(xí),分型的分析是比較先進(jìn)的。有需要的分析的朋友歡迎交流!!

研究概述:

心房顫動(dòng)(AF)是缺血性卒中的主要危險(xiǎn)因素,而僅憑臨床特征和神經(jīng)影像學(xué)表現(xiàn)都不能可靠地分類心源性栓塞性卒中(CE)。本研究旨在確定在心房顫動(dòng)相關(guān)心源性栓塞性卒中(AF-CE)患者中具有診斷價(jià)值的新型潛在生物標(biāo)志物,區(qū)分AF-CE與其他類型缺血性卒中。

研究者對(duì)AF和CE的共同的DEGs進(jìn)行綜合分析后,使用LASSO和SVM-RFE兩種機(jī)器學(xué)習(xí)算法確定了三個(gè)診斷標(biāo)志物C1QC、VSIG4 和 CFD。然后采用RT-qPCR分析了3種診斷標(biāo)志物的表達(dá)水平,發(fā)現(xiàn)水平高低可用于區(qū)分AF-CE患者與正常對(duì)照組,并可有效區(qū)分AF-CE和LAA卒中。之后使用臨床樣本驗(yàn)證結(jié)果,并使用ROC曲線分析確定這些特征標(biāo)志基因的診斷價(jià)值。最終得出C1QC、VSIG4 和 CFD 可作為 AF-CE 的獨(dú)立因素和診斷標(biāo)準(zhǔn)。最后建立了列線圖模型、開發(fā)了在線預(yù)測工具。

研究結(jié)果:

一、差異表達(dá)基因的鑒定

1. 在與CE相關(guān)的GSE58294 (GPL570)數(shù)據(jù)集中,與對(duì)照組相比,在中風(fēng)后三個(gè)時(shí)間點(diǎn)(<3 h(圖1a)、5 h(圖1b)和24 h(圖1c)分別篩選DEGs。同時(shí),從GSE41177中獲得13962個(gè)AF相關(guān)的DEGs (圖1d)。

2. GSE58294數(shù)據(jù)集中不同時(shí)間點(diǎn)的DEGs結(jié)果的交集有418個(gè)DEGs (圖1e)。該交集中的DEGs交叉得到316個(gè)AF-CE基因(圖1f)。

3. 將GSE58294和GSE41177數(shù)據(jù)集合并為訓(xùn)練集,移除批處理效果后使用limma包獲得13個(gè)AF-CE相關(guān)的DEGs基因(AP000525.9、POM121L9P、TIMM8A、MCEMP1、C1QC、LOC100996760、BCL2A1、S100A12、VSIG4、OLAH、ANKRD22、BMX、CFD),其中9個(gè)基因上調(diào),4個(gè)基因下調(diào)(圖1g)。

二、功能相關(guān)分析

1. 使用Metascape在線工具進(jìn)行功能標(biāo)注。結(jié)果表明:AF-CE相關(guān)的DEGs標(biāo)志性富集于氧化應(yīng)激誘導(dǎo)的衰老、氧化應(yīng)激反應(yīng)的調(diào)控、氧化應(yīng)激反應(yīng)的調(diào)控、細(xì)胞程序性死亡、上皮細(xì)胞增殖的調(diào)控、VEGFA-VEGFR2信號(hào)通路、補(bǔ)體和凝血級(jí)聯(lián)、雌激素信號(hào)通路、snRNA 3’端加工、MHC II類蛋白復(fù)合物組裝、細(xì)胞對(duì)生長因子刺激反應(yīng)的調(diào)控、肌肉結(jié)構(gòu)發(fā)育、白細(xì)胞介素-12的產(chǎn)生、癌癥中的蛋白多糖、水楊酸與甘氨酸的偶聯(lián)以及附肢形態(tài)發(fā)生(圖2a)。

2. DO富集分析結(jié)果顯示,AF-CE相關(guān)的DEGs主要與免疫介導(dǎo)的炎癥性疾病(肝炎、乙肝、丙肝)和女性生殖系統(tǒng)疾病(女性生殖器官癌、卵巢上皮性癌、卵巢表面惡性上皮間質(zhì)腫瘤、卵巢癌、泌尿系統(tǒng)癌)相關(guān)(圖2B)。

三、利用LASSO和SVM-RFE算法選擇診斷標(biāo)記

1. 使用兩種不同的算法(LASSO和SVM-RFE)從組合訓(xùn)練集(GSE58294和GSE41177)中篩選特征基因。SVM-RFE算法結(jié)果表明,當(dāng)特征數(shù)為13,包含前文所述13個(gè)AF-CE相關(guān)的DEGs時(shí)分類器誤差最小(圖3a、 b)。

2. LASSO算法經(jīng)過十倍交叉驗(yàn)證,選取10個(gè)基因,分別為AP000525.9、TIMM8A、S100A12、LOC100996760、VSIG4、C1QC、BCL2A1、OLAH、BMX、CFD(圖3c、 d)。

3. 最終選擇LASSO和SVM-RFE算法之間共有的7個(gè)特征基因(LOC100996760、VSIG4、C1QC、BCL2A1、OLAH、BMX和CFD)進(jìn)一步分析(圖3e)。7個(gè)特征基因的ROC分析AUC值均大于0.8,提示這7個(gè)基因可作為AF-CE患者的診斷標(biāo)志物(圖3f)。

4. 為進(jìn)一步驗(yàn)證這7個(gè)候選診斷基因的可靠性和可重復(fù)性,作者合并了兩個(gè)數(shù)據(jù)集(GSE115574和GSE14975)作為驗(yàn)證集。結(jié)果顯示,CFD (P < 0.05)、VSIG4 (P < 0.01)和C1QC (P < 0.05)在AF和SR之間存在差異(圖4a、b)。

5. 圖4c 的ROC分析顯示,三基因組合模型(C1QC+VSIG4+CFD)的AUC為0.794,高于單個(gè)基因的AUC:C1QC(0.672),VSIG4 (0.688),CFD( 0.671),組合模型具有較高的診斷價(jià)值。

6. 而動(dòng)脈粥樣硬化數(shù)據(jù)集GSE20129中C1QC、VSIG4和CFD的表達(dá)無明顯差異(圖4d -f)。從上述結(jié)果來看,特征生物標(biāo)志物VSIG4、C1QC和CFD具有較高的診斷準(zhǔn)確性。

四、特征生物標(biāo)志物的通路分析

為確定VSIG4,C1QC和CFD的生物學(xué)相關(guān)性,作者從PathCards數(shù)據(jù)庫進(jìn)行富集分析。

結(jié)果表明,候選特征生物標(biāo)志物主要富集于免疫應(yīng)答凝集素誘導(dǎo)補(bǔ)體通路、纖維蛋白凝塊形成(凝血級(jí)聯(lián)反應(yīng))、C4和C2激活劑的產(chǎn)生、先天免疫系統(tǒng)、補(bǔ)體通路、補(bǔ)體和凝血級(jí)聯(lián)、對(duì)血小板胞質(zhì)Ca升高的反應(yīng)2+和脂肪生成(圖5a)。

故認(rèn)為VSIG4,C1QC和CFD可能與AF-CE的調(diào)節(jié)細(xì)胞免疫反應(yīng)有關(guān),而細(xì)胞免疫反應(yīng)又反過來影響AF-CE的風(fēng)險(xiǎn)。


五、免疫細(xì)胞浸潤

1. 作者計(jì)算了GSE58294數(shù)據(jù)集中患者樣本、腦卒中后<3、5和24h患者樣本與對(duì)照樣本之間免疫細(xì)胞浸潤分布的差異。

①與對(duì)照組相比,AF-CE組在腦卒中后<3、5、24 h中性粒細(xì)胞升高;5 h 呈現(xiàn)M0、M2巨噬細(xì)胞升高;24 h 呈現(xiàn)T細(xì)胞γ δ和M2巨噬細(xì)胞升高。靜息樹突狀細(xì)胞在腦卒中后3 h和5 h顯著降低。

②幼稚CD4 T細(xì)胞在腦卒中后3h較低,嗜酸性粒細(xì)胞在腦卒中后5h較低,CD8 T細(xì)胞和靜息NK細(xì)胞在腦卒中后24小時(shí)較低。(P 均< 0.05)

2. 對(duì)三個(gè)特征生物標(biāo)志物,發(fā)現(xiàn)CFD(圖5b)與中性粒細(xì)胞呈正相關(guān),與幼稚B細(xì)胞、幼稚CD4 T細(xì)胞和靜息NK細(xì)胞呈負(fù)相關(guān)。C1QC(圖5c)與中性粒細(xì)胞和靜息肥大細(xì)胞呈正相關(guān),與靜息樹突狀細(xì)胞呈負(fù)相關(guān)。VSIG4(圖5d)與中性粒細(xì)胞呈正相關(guān),與中性粒細(xì)胞、 T濾泡輔助細(xì)胞、靜息樹突狀細(xì)胞和嗜酸性粒細(xì)胞呈負(fù)相關(guān)。這些結(jié)果與通路分析的結(jié)果一致。

六、臨床樣本中診斷基因的表達(dá)

為進(jìn)一步證實(shí),作者收集53份臨床血樣(20例LAA患者,20例CE患者和13例對(duì)照)進(jìn)行qRT-PCR分析,檢測C1QC、VSIG4和CFD的表達(dá)。如圖6a-c所示,與健康對(duì)照相比,CE組和LAA組C1QC和VSIG4表達(dá)明顯升高,而CFD表達(dá)降低。

七、C1QC、VSIG4 和 CFD 作為潛在AF-CE 生物標(biāo)志物的評(píng)估

1. 構(gòu)建ROC曲線以評(píng)價(jià)候選診斷基因的診斷準(zhǔn)確性。(AUC越接近于1,真實(shí)性越高)

對(duì)照組CT與CE患者比較結(jié)果:(95%可信區(qū)間和p值見于圖片,下同)

C1QC(圖6d)的AUC為0.7885,VSIG4(圖6e)的AUC為0.8769,CFD(圖6f)的AUC為0.8250。

2. 對(duì)照組與LAA患者比較結(jié)果:C1QC(圖6g)的AUC為0.8632,VSIG4 (圖6h)的AUC為0.8423,CFD(圖6i)的AUC為0.9219。

3. CE患者與LAA患者比較結(jié)果:C1QC(圖6j)的AUC為0.7350,VSIG4(圖6k)的AUC為0.9675,CFD(圖6l)的AUC為0.7575。

4. 這些結(jié)果表明,C1QC、VSIG4和CFD表達(dá)在區(qū)分對(duì)照組、CE和LAA患者方面具有很大的價(jià)值,且對(duì)所分析的兩種腦卒中亞型具有特異性。因此C1QC、VSIG4和CFD可能是AF-CE的診斷生物標(biāo)志物。

八、AF-CE診斷列線圖和在線預(yù)測工具的構(gòu)建和評(píng)估

1. 基于3個(gè)診斷基因(C1QC、CFD和VSIG4),使用“RMS”包構(gòu)建診斷AF-CE的列線圖(圖7a)。為更直觀地評(píng)估列線圖模型的臨床效果,基于決策曲線分析(DCA)生成的曲線計(jì)算了臨床影響曲線。AF-CE列線圖(圖7b)具有良好的區(qū)分效果,曲線下面積AUC為0.969(95%CI:0.940-0.991)。紅色表示的高風(fēng)險(xiǎn)曲線與藍(lán)色表示的真陽性患者曲線非常接近。這表明列線圖模型能夠且可以接受準(zhǔn)確預(yù)測區(qū)別(圖7c)。

2. DCA表明,C1QC+CFD+VSIG4曲線遠(yuǎn)高于灰線,這解釋了列線圖模型的高精度(圖7d)。此外,還構(gòu)建了校準(zhǔn)曲線以確定列線圖模型的預(yù)測能力。AF-CE的實(shí)際風(fēng)險(xiǎn)和預(yù)測風(fēng)險(xiǎn)之間幾乎沒有差異,表明預(yù)測AF-CE的準(zhǔn)確性很高(圖7e)。

3. 此外作者開發(fā)了一種在線預(yù)測工具用于臨床應(yīng)用,基于構(gòu)建的列線圖預(yù)測AF-CE的風(fēng)險(xiǎn)。將候選診斷基因(C1QC,CFD和VSIG4)的表達(dá)水平輸入在線預(yù)測工具,結(jié)果表明所有AF-CE患者測試樣本得分接近100%,而健康對(duì)照接近0%,這表明預(yù)測軟件具有較高的描繪精度。

九、臨床病理參數(shù)(包括年齡、性別、TIA、心源性疾病、心悸、呼吸困難、高血壓、吸煙、左心房直徑和糖尿病)與候選疾病生物標(biāo)志物之間的相關(guān)性

1. C1QC表達(dá)與年齡>60歲、糖尿病史、高血壓史、以及當(dāng)前或近期吸煙呈正相關(guān),而與患者其他臨床病理參數(shù)無相關(guān)性(P > 0.05)。

2. 對(duì)于CFD的表達(dá),在上述臨床病理特征均有顯著差異:糖尿病史與較低的CFD表達(dá)相關(guān),女性表達(dá)低于男性,高血壓史者表達(dá)較低。(P < 0.05)

3. VSIG4表達(dá)明顯增高在高血壓史、心源性疾病史、心悸史、吸煙者、年齡> 60歲、女性。(P < 0.05)

研究總結(jié):

本研究首次探索了特定的基于血液的生物標(biāo)志物C1QC、VSIG4 和 CFD,可通過機(jī)器學(xué)習(xí)快速診斷AF-CE患者,這可能有助于支持治療計(jì)劃和二級(jí)預(yù)防計(jì)劃。此外,這些生物標(biāo)志物主要富集在免疫系統(tǒng)和補(bǔ)體通路中,可能為進(jìn)一步研究奠定基礎(chǔ)。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,963評(píng)論 6 542
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,348評(píng)論 3 429
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,083評(píng)論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,706評(píng)論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 72,442評(píng)論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,802評(píng)論 1 328
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,795評(píng)論 3 446
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,983評(píng)論 0 290
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,542評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 41,287評(píng)論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,486評(píng)論 1 374
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,030評(píng)論 5 363
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,710評(píng)論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,116評(píng)論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,412評(píng)論 1 294
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 52,224評(píng)論 3 398
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,462評(píng)論 2 378

推薦閱讀更多精彩內(nèi)容