Predicting the Risk of Melanoma Metastasis Using an Immune Risk Score in the Melanoma Cohort
在黑色素瘤數(shù)據(jù)集中,用免疫相關的基因來預測患者的體內(nèi)腫瘤瘤的轉(zhuǎn)移狀態(tài)
發(fā)表期刊:Front Bioeng Biotechnol
發(fā)表日期:2020 Mar 31
影響因子:5.12
DOI:10.3389/fbioe.2020.00206
01—分析流程圖
02—研究背景
黑色素瘤是一種侵襲能力很強的癌癥,雖然占皮膚癌的2%左右,但能很快的轉(zhuǎn)移至淋巴結(jié)和遠處器官,所以是皮膚癌中死亡人數(shù)最多的癌種。多項研究表明,手術切除原發(fā)性黑色素瘤的患者具有較高的治愈率,但是如果黑色素瘤已經(jīng)轉(zhuǎn)移至淋巴結(jié)或遠處器官,會威脅患者的生命,其5年生存率僅為15%至20%。因此,迫切需要尋找黑色素瘤生物標志物,來預測黑色素瘤的轉(zhuǎn)移。
免疫系統(tǒng)在腫瘤起始,進展和轉(zhuǎn)移起的決定性因素,免疫細胞與癌細胞之間有復雜的相互作用,可以抑制、促進腫瘤的生長,現(xiàn)在認為癌癥免疫逃逸是癌癥的新興標志。黑色素瘤是一種免疫原性癌癥,可以通過在免疫微環(huán)境中產(chǎn)生可耐受的細胞因子和生長因子來抵抗對免疫系統(tǒng)的控制。因此,有幾項研究說明,基因表達譜可以影響黑色素瘤患者預后,但很少有研究基因表達譜與黑色素瘤轉(zhuǎn)移的關鍵。所以,本研究構(gòu)建一個與免疫相關的風險評分,來預測黑色素瘤患者的轉(zhuǎn)移情況。
03—材料與方法
1.數(shù)據(jù)來源
-----------
訓練集:TCGA 470個樣本(103個原發(fā)腫瘤樣本+367轉(zhuǎn)移腫瘤樣本),
內(nèi)部驗證集:470名TCGA患者中有110名患者(65名原發(fā)腫瘤+45名轉(zhuǎn)移腫瘤),這些患者是初次診斷為診斷為黑色素瘤的患者。
驗證集:GSE8401,GSE15605和GSE46517
2.分析方法
-----------
差異分析:首先在表達矩陣中去掉在50%以上的樣本中表達值為0的基因,然后使用R包limma在原發(fā)樣本和轉(zhuǎn)移樣本中進行差異分析(FC > 2 or < 0.5, P value < 0.05, and FDR < 0.05),篩選與免疫相關的差異基因(IRGs),使用R包clusterProfiler進行KEGG分析。
建立預后模型:使用單因素和多因素logistic分析,識別與黑色素瘤轉(zhuǎn)移風險相關的IRGs(P<0.05)。
評估模型的預測性能:使用ROC曲線和Precision-Recall curve(PR曲線)來評估模型的預測性能,
利用風險模型對臨床信息進行預測:使用約登指數(shù)選擇最佳的分險評分閾值,將患者分為高低分險兩組,并用風險模型和其他臨床信息一起構(gòu)建logistic回歸模型來預測黑色素瘤患者的生存狀態(tài),并繪制多變量列線圖。
04—結(jié)果
1.TCGA訓練集患者和內(nèi)部驗證集的臨床信息展示,如表1所示:
-----------
表1 TCGA訓練集的臨床信息展示?
2.識別與預后相關的風險基因(IRGs)
-----------
根據(jù)方法中提到的篩選條件,在TCGA數(shù)據(jù)集103個腫瘤原發(fā)樣本和367個轉(zhuǎn)移樣本之間共篩選出124個與免疫相關的差異基因(火山圖見圖1A)。然后將差異基因進行KEGG富集分析,結(jié)果顯示這124個差異基因富集了38個KEGG途徑,主要功能是參與了黑色素瘤的轉(zhuǎn)移,免疫代謝等與癌癥相關途徑(見圖1B)。進一步,使用單因素和多因素logistic分析,最終識別出8個風險IRGs并構(gòu)建了一個評分公式來預測黑色素瘤患者的轉(zhuǎn)移情況。8個IRGs的多因素logistic分析結(jié)果如表2所示,免疫風險得分(IRS)、基因表達與患者是否發(fā)生黑色素瘤轉(zhuǎn)移狀態(tài)(見圖1C-D)。
表2.8個IRGs多變量logistic分析結(jié)果
3.評估預后模型的預測性能
-----------
使用ROC曲線中的AUC來評估風險模型對黑色素瘤患者是否發(fā)生轉(zhuǎn)移的預測性能,IRS的ROC曲線和PR曲線(如圖2),結(jié)果顯示,在TCGA訓練集中,IRS對黑色素瘤轉(zhuǎn)移的AUC為0.90 (95%CI 0.86–0.93),在內(nèi)部驗證集中,IRS對黑色素瘤轉(zhuǎn)移的AUC為0.80(95%CI 0.71–0.89)。然后使用臨床因素對黑色素瘤患者的轉(zhuǎn)移情況進行預測并和風險基因模型的預測性能進行對比(表3),結(jié)果顯示,風險模型對患者轉(zhuǎn)移能力的預測情況要優(yōu)于其他臨床變量。
表3.免疫風險模型對黑色素瘤是否發(fā)生轉(zhuǎn)移的預測預測能力
進一步,根據(jù)約登指數(shù)選擇最佳的分險評分閾值(IRS=0.60),分析TCGA訓練集與內(nèi)部驗證集患者的accuracy(準確度)、sensitivity(敏感度)、specificity(特異度)、positive predictive value(陽性預測值)、negative predictive value(陰性預測值)等統(tǒng)計指標(表4),進一步說明IRS預測的可靠性。最后,使用IRS的PR曲線分析TCGA訓練集中與臨床初步診斷黑色素瘤患者中,黑色素瘤轉(zhuǎn)移患者的比例(圖3A-B)。
表4.The summary statistics for IRS
4.IRS與黑色素患者的臨床信息分析
-----------
使用相同的閾值(IRS = 0.60)將訓練集和內(nèi)部驗證集分為低IRS組和高IRS組,并將年齡等臨床變量和風險評分構(gòu)成變量logistic回歸模型,對黑色素瘤患者是否發(fā)現(xiàn)轉(zhuǎn)移進行預測。結(jié)果顯示,在加入了年齡作為協(xié)變量,在訓練集樣本中,高IRS組的患者比低IRS組的患者發(fā)生黑色素瘤轉(zhuǎn)移的可能性高18.45倍,在內(nèi)部驗證集中也觀察到相似的結(jié)果(表5)。最后在訓練集和內(nèi)部驗證集中使用諾模圖進一步評估風險模型的預測性能(圖4)。
表5.臨床因素與IRS綜合預測黑色素瘤的轉(zhuǎn)移情況
5.外部數(shù)據(jù)集驗證
-----------
為了驗證模型的魯棒性,使用三套GEO數(shù)據(jù)集(即GSE8401,GSE15605和GSE46517)作為外部數(shù)據(jù)集來驗證風險模型,作者使用這些數(shù)據(jù)集來評估IRS對黑色瘤患者是否發(fā)現(xiàn)轉(zhuǎn)移進行評估。結(jié)果顯示三個外部數(shù)據(jù)集具有很高的AUC,進一步使用單變量logistic回歸分析估算三個數(shù)據(jù)集了OR值(表6),最后PR曲線分析還顯示IRS可以增加對黑色素瘤患者是否發(fā)生的預測能力(圖2C–E)。
表6.外部數(shù)據(jù)對風險模型的驗證
05—結(jié)果圖展示
圖1.識別與免疫相關的分線模型
圖2. IRS的ROC曲線和PR曲線
圖3.風險評分PR曲線
圖4 列線圖
06—結(jié)論
在TCGA黑色素瘤數(shù)據(jù)中,提取出與免疫相關基因的表達譜,在原發(fā)腫瘤樣本和轉(zhuǎn)移腫瘤樣本篩選出124個與免疫相關的差異基因,通過單因素多因素logistic分析構(gòu)建了8個基因風險模型來預測黑色素瘤患者是否發(fā)生轉(zhuǎn)移,并用三套外部數(shù)據(jù)進行驗證。