影響因子:9.186
關于非腫瘤生信,我們也解讀過很多,主要有以下類型
1 單個疾病WGCNA+PPI分析篩選hub基因。
2 單個疾病結(jié)合免疫浸潤,熱點基因集,機器學習算法等。
3 兩種相關疾病聯(lián)合分析,包括非腫瘤結(jié)合非腫瘤,非腫瘤結(jié)合腫瘤或者非腫瘤結(jié)合泛癌分析
4 基于分型的非腫瘤生信分析
5 單細胞結(jié)合普通轉(zhuǎn)錄組生信分析
研究概述:
本研究首先使用R語言在三個基因表達數(shù)據(jù)集中找到DEGs并進行基因集富集分析。隨后,使用WGCNA選擇的關鍵模塊基因,利用3種機器學習算法鑒定出402個樞紐基因。接著使用ROC曲線和列線圖以驗證候選樞紐基因(CD177、CYSTM1和MMP8)的識別性和有效性。此外,通過CIBERSORT,使用細胞類型鑒定評估小兒敗血癥的炎癥和免疫狀態(tài),進一步研究了診斷標志物與浸潤免疫細胞之間的關系。
研究流程圖
研究結(jié)果:
一、小兒敗血癥DEGs的篩查與GSEA
1. 兩組患者共有556個DEGs,包括381個上調(diào)基因和175個下調(diào)基因。
2. 對小兒敗血癥患者和健康對照進行了GSEA研究生物信號通路,小兒敗血癥患者的凝血、補體、IL6-JAK-STAT3信號傳導、炎癥反應和NF-κB介導的TNFα信號顯著富集。
二、DEGs的功能富集分析
1. DO分析結(jié)果顯示,這些DEGs與肺部疾病、動脈硬化、肝炎、動脈粥樣硬化、動脈硬化性心血管疾病、細菌性傳染病、原發(fā)性細菌性傳染病、阻塞性肺病、結(jié)核病和支氣管疾病有關(補充圖2b)。
2. GO富集分析表明,DEGs具有免疫應答調(diào)節(jié)信號通路、免疫應答活化、細胞因子產(chǎn)生正向調(diào)節(jié)、白細胞介導免疫、T細胞活化和髓系白細胞活化(補充圖2c)。
3. KEGG分析與造血細胞譜系、金黃色葡萄球菌感染、Th1和Th2細胞分化以及Th17細胞分化有關(補充圖2d)。
三、兒科敗血癥共表達基因模塊的鑒定
1. 在兒科膿毒癥數(shù)據(jù)集中使用WGCNA來定位由許多基因共表達的基因模塊。首先,將來自兩個數(shù)據(jù)集的樣本分為兩組,即小兒敗血癥組和正常組(補充圖3a)。然后,基于0.8的尺度獨立性,選擇13作為軟閾值功率β,以確保無標度網(wǎng)絡的生物學意義(補充圖3b,c)。
2. 通過分層聚類分析和基因樹狀圖的動態(tài)分支切割方法,將基因分為12個模塊(補充圖.3d,e)。淺青色、藍色和淺綠色模塊與兒科敗血癥顯著相關,并選擇其進一步分析(補充圖3f)。
四、診斷標志物的篩查和驗證
1. 通過維恩圖比較DEGs和關鍵模塊基因的重疊區(qū)域,識別出402個重疊的基因區(qū)域(圖2a)。
2. 使用三種機器學習算法來識別特征基因:SVM-RFE(圖2b); 隨機森林(圖2c, d); LASSO回歸分析(圖2e, f)。
3. 這三種算法將CYSTM1,MMP8和CD177鑒定為重疊基因(圖3a)。
使用rms軟件包開發(fā)基于三個標志基因診斷兒科敗血癥的列線圖模型(圖3b)。
4. 根據(jù)決策曲線分析(DCA)的結(jié)果,列線圖模型具有更好的臨床效益(圖3c)。AUC分別為0.988、0.973和0.986表明生物標志物具有較高的預測價值準確性(圖3d)。
5. 在GSE13904驗證集中,小兒膿毒癥組CYSTM1、MMP8和CD177的表達明顯高于對照組(圖3e)。AUC分別為0.968、0.964和0.957的ROC曲線表明它們在GSE13904驗證集中可能是有價值的生物標志物(圖3f)。
五、免疫細胞浸潤結(jié)果
1. 采用CIBERSORT算法評估免疫細胞浸潤狀態(tài),與正常樣本相比,小兒膿毒癥樣本中單核細胞、M0、M1、M2巨噬細胞、靜息肥大細胞、活化肥大細胞、嗜酸性粒細胞和中性粒細胞的比例普遍較高;
2. 幼稚B細胞、CD8+T細胞、靜息CD4+記憶T細胞、活化CD4+記憶T細胞、Trges、靜息NK細胞、活化NK細胞和靜息樹突狀細胞的比例相對較低(補充圖4)。
3. 根據(jù)相關性分析的結(jié)果,CYSTM1,MMP8和CD177與多種免疫細胞具有顯著程度的聯(lián)系(補充圖5)。
研究總結(jié):
本文不僅整合了兒科敗血癥的多個高通量測序數(shù)據(jù)進行分析,更重要的是首次使用機器學習來篩選特征基因(CD177、CYSTM1和MMP8)。此外,還研究了診斷標志物與免疫細胞之間的關系,構(gòu)建列線圖用于兒科膿毒癥診斷。