Machine learning-based identification of tumor-infiltrating immune cell-associated lncRNAs for improving outcomes and immunotherapy responses in patients with low-grade glioma
基于機器學習識別的腫瘤浸潤性免疫細胞相關lncRNAs可改善low grade glioma 患者的預后和免疫治療反應
發表期刊:Theranostics(IF :11.6)
發表時間:2022.07
(PS: 點擊標題,直達文章原文)
摘要
理論基礎:越來越多證據表明,lncRNA參與免疫系統的調節,并在免疫細胞亞群中表現出細胞類型特異性。鑒于腫瘤浸潤淋巴細胞在有效免疫治療的重要作用,我們探索了低級膠質瘤 (low-grade glioma, LGG) 中腫瘤浸潤性免疫細胞相關lncRNA (tumor-infiltrating immune cell-associated lncRNA, TIIClncRNA) ,這一尚未被發現的問題。
方法:本研究利用了一種新的計算框架和10種機器學習算法 (101種組合) ,通過整合分析純化免疫細胞、LGG細胞系和LGG bulk組織,篩選出TIIClncRNAs。
結果:基于16個最有效的TIIClncRNA建立了TIIClnc特征,可以在公共數據集和湘雅內部數據集中非常有效地預測結果,優于已發表的95個特征性能。TIIClnc特征與免疫特性密切相關,包括微衛星不穩定性、腫瘤突變負擔和干擾素γ,并表現出更活躍的免疫過程。此外,TIIClnc特征在多種癌癥類型的多個數據集中預測了更好的免疫治療應答。值得注意的是,在湘雅的內部數據集中,TIIClnc特征與CD8、PD-1和PD-L1之間的正相關性得到了驗證。
結論:TIIClnc特征能夠更精確地識別出LGG患者中免疫治療的潛在受益者。
關鍵詞:免疫治療,LGG,lncRNA,免疫檢查點,immune infiltration
workflow
TIIClnc特征篩選方法
- 在免疫細胞(GEO數據集)里找15%高表達的lncRNA
- 計算組織特異性評分 (tissue specificity index, TSI),找在每種免疫亞型特異表達的lncRNA作為候選免疫相關lncRNA
- 與LGG細胞(CCLE數據庫)內的lncRNA做差異表達分析,找在免疫細胞高表達、LGG低表達的候選免疫相關lncRNA
- 對step3得到的lncRNA做多因素cox回歸分析,找具有預后效能的TIIClncRNA (TCGA數據庫)
- 用多種機器學習的不同組合 (101種) 對step4得到的TIIClncRNA進行建模,10折交叉驗證,尋找預測效果最好 (c-index最大) 的模型 (CoxBoost + RSF),和最有價值的TIIClncRNA特征
- 用step5得到的模型及特征進行通路分析、生存分析等,并與近10年內發表的glioma相關的特征相比較,評價該模型的優越性。
GEO數據集:GSE27291, GSE27838, GSE28490, GSE13906, GSE23371, GSE25320, GSE28698, GSE28726, GSE49910, GSE51540, GSE59237, GSE37750, GSE39889, GSE42058, GSE6863, GSE8059
CCLE數據庫:depmap.org
TCGA數據庫:GDC (cancer.gov)
機器學習方法:
- random survival forest (RSF)
- elastic network (Enet)
- Lasso
- Ridge, stepwise Cox
- CoxBoost
- partial least squares regression for Cox (plsRcox)
- supervised principal components (SuperPC)
- generalized boosted regression modeling (GBM)
- survival support vector machine (survival-SVM)
所有組合如下圖
屏幕截圖 2022-10-29 163149.png