識別 lncRNA相關的生物標志物以提高LUAD預后的準確性(IF5+)

Identification of a Prognostic Signature Composed of GPI, IL22RA1, CCT6A and SPOCK1 for Lung Adenocarcinoma Based on Bioinformatic Analysis of lncRNA-Mediated ceRNA Network and Sample Validation

基于lncRNA介導的ceRNA網絡的生物信息學分析和樣本驗證,識別由GPI、IL22RA1、CCT6A和SPOCK1組成的肺腺癌預后特征

發表期刊:Front Oncol

發表日期:2022 Mar 28

DOI:? 10.3389/fonc.2022.844691

一、背景

????????肺腺癌(LUAD)是中國乃至全球最常見的惡性腫瘤之一,發病率和死亡率都很高,占所有肺癌的40%。目前,對LUAD生物學特性的認識不足,限制了療效的進一步提高。因此,迫切需要弄清腫瘤的發病機制,確定新的生物標志物和治療方案以改善預后。

????????長非編碼RNAs(lncRNAs)是一種長度超過200個核苷酸的轉錄物,幾乎沒有編碼蛋白質的潛力。近年來,越來越多的證據表明,lncRNAs可以作為競爭性內源性RNA(ceRNA),通過競爭共享的miRNAs來間接調節下游目標mRNA的表達,隨后參與復雜疾病表型和各種病理過程的發展,包括癌癥。

二、材料與方法

1.數據來源

1)40個配對的LUAD和鄰近的非腫瘤組織

2)NSCLC細胞系(HCI-H1299和A549)、永生化肺上皮細胞系BEAS-2B和HEK293T

3)從TCGA數據庫下載LUAD相關RNAs表達的原始測序數據和相應患者的完整臨床數據

4)GSE32863

2.實驗流程

1) 細胞培養和shRNA的穩定轉染、菌落形成試驗和傷口愈合試驗、免疫印跡法

2) lncRNAs、miRNAs和mRNAs在LUAD和鄰近非腫瘤組織中的表達概況分析:使用R軟件包edgeR來篩選LUAD和鄰近非腫瘤組織中差異表達的lncRNAs、miRNAs和mRNAs

3) LUAD中ceRNA網絡的構建:miRcod數據庫被用來預測差異表達的lncRNA和miRNA之間的相互作用;從miRTarBase、miRDB和TargetScan數據庫中搜索差異表達的miRNA靶標

4) 基于ceRNA網絡的預后特征的建立和驗證:單變量Cox回歸分析提取ceRNA網絡中的生存相關節點基因;使用R包 "glmnet "通過LASSO回歸分析,進一步提取預后基因用于多變量Cox回歸;nomogram構建;使用Oncomine、TCGA和GSE32863驗證了預后標志基因的mRNA表達水平;使用40對LUAD和鄰近的非腫瘤組織,通過Western blot分析進一步驗證了蛋白質的表達水平

5) 基因組富集分析:GESA

6) 22種免疫細胞類型的浸潤模式及ceRNA網絡相關基因特征與免疫治療生物標志物的相關性分析:CIBERSORT

7) 基于ceRNA網絡相關基因特征的化療反應預測

三、實驗結果

01 - 開發和驗證基于ceRNA網絡的預后特征

????????作者分析了LUAD中lncRNA、miRNA和mRNA的差異表達,使用的TCGA數據庫包含497個LUAD和54個癌旁樣本。在LUAD和鄰近的非腫瘤樣本之間共鑒定了214個lncRNA(51個下調和163個上調),198個miRNA(87個下調和111個上調)和2989個mRNA(1344個下調和1645個上調)。

????????為了探索LUAD中ceRNA的潛在調節機制,作者試圖根據ceRNA假說建立LUAD的ceRNA網絡。使用miRcode、miRTarBase和miRDB數據庫,共鑒定了119個miRAN-mRNA對和15個lncRNA-miRNA對的相互作用。最后,構建了一個LUAD特有的lncRNA-miRNA-mRNA ceRNA網絡,由7個lncRNAs、15個miRNAs和95個mRNAs組成,包括117個節點和134條邊,并進行了可視化(補充圖2)。

補充圖2 從TCGA_LUAD數據庫中差異表達的lncRNA、miRNA和mRNA構建的LncRNA-miRNA-mRNA網絡

????????由于上述構建的ceRNA網絡是由許多基因及其相互作用組成的,因此不容易明確其診斷和預后的意義。因此,利用TCGA-LUAD數據庫進行單變量Cox回歸分析,篩選出ceRNA網絡中與LUAD患者總生存期(OS)相關的節點基因。結果顯示,24個節點基因與OS明顯相關(圖1A)。隨后,為降低風險模型的復雜性,采用Lasso回歸分析,剔除相關性相對較低的基因,從24個預后基因中篩選了9個(圖1B,C)。然后,將462名有生存數據的TCGA-LUAD患者隨機分為訓練組和測試組,基于多變量Cox回歸分析,在訓練隊列中建立了一個預后特征模型。確定了四個候選特征基因,即GPI、IL22RA1、CCT6A和SPOCK1(圖1D , E)。

圖1 識別LUAD中四個具有顯著預后作用的基因及其表達

????????基于4個基因特征的風險評分公式被構建為風險評分=0.314?GPI+0.127?IL22RA1+0.330?CCT6A+0.104?SPOCK1。根據風險評分的中位數,訓練隊列中的232名LUAD患者被分為高風險和低風險組。如圖2A、B所示,風險分數的增加與LUAD患者的不良OS有關,K-M曲線顯示,高危組患者的OS下降(圖2C)。ROC分析觀察到,與上述每個基因相比,四個基因的預后特征具有更大的AUC值(圖2D)。此外,主成分分析(PCA)清楚地確定了兩個風險組之間的明顯不同分布(圖2E)。

????????最后,為了驗證四基因特征的預測價值,用測試隊列(n=230)和整個隊列(n=462)作為驗證集來評估訓練隊列的結果。與訓練隊列的結果類似,兩個驗證集的KM曲線顯示,低風險組的患者表現出更好的OS(圖2F,I)。在測試隊列和整個隊列中,四個基因特征的AUC在1年、3年和5年的時間點分別為0.633、0.635、0.665、0.673、0.672和0.668(圖2G,J)。此外,PCA也顯示出與訓練隊列類似的結果(圖2H,K)。

圖2 訓練隊列、測試隊列和整個隊列中四個基因特征的預后分析

????????然后對四個預后特征基因進行了外部驗證。Oncomine數據庫分析發現,與正常肺組織相比,LUAD組織中GPI、IL22RA1、CCT6A和SPOCK1 mRNA的表達水平明顯更高(圖3A)。此外,從TCGA的配對樣本和GSE32863數據庫中進一步確認了這四個基因在LUAD中的mRNA表達(圖3B,C)。通過Western blot分析調查了這四個基因在40對LUAD組織和鄰近非腫瘤組織中的蛋白表達水平。結果顯示,GPI、IL22RA1、CCT6A和SPOCK1在腫瘤組織(T)中的表達明顯高于對照組織(N)(n=40;圖3D,E)。

圖3 預后特征中包含的基因表達的驗證

02 - ceRNA網絡相關基因特征與其他報道的基因特征在預后評估中的性能比較

????????為了進一步評估ceRNA網絡相關基因特征的預測性能,作者選擇了其他四種已發表的基因特征進行比較。根據這四個模型中的相應基因,用同樣的方法(多變量Cox回歸分析)在訓練隊列中計算每個病人的風險得分,然后評估時間依賴的ROC。圖2D和圖4A -D顯示,ceRNA網絡相關基因特征對5年OS的AUC為0.678,明顯大于其他基因特征。通過限制性平均生存率(RMS)軟件包計算的所有預后特征的C-指數顯示,本研究模型具有最高的C-指數,為0.668(圖4E)。此外,所有五個預后模型的RMS時間曲線也表明,本研究4個基因特征在大于8年的時間段內表現最好(圖4F)。這些結果表明,ceRNA網絡相關基因特征可能為LUAD提供更好的預后評估性能。

圖4 四基因預后特征風險模型與其他報道的風險模型的比較

03 - 基于風險特征的預測nomogram的構建和驗證

????????單變量Cox回歸分析顯示,腫瘤分期、復發和風險評分與訓練組的OS密切相關(圖 5A),多變量Cox回歸分析進一步證實了上述結果(圖5B)。因此,將這三個因素結合起來,構建了一個預測LUAD患者1年、3年和5年的OS的復合nomogram(圖5C)。訓練隊列中預測LUAD患者3年OS的nomogram校準圖顯示實際觀察和nomogram預測之間有很大的一致性(圖5D),nomogram模型預測OS的C-指數為0.778。此外,該nomogram預測3年OS的AUC值大于分期、復發和風險評分,表明使用nomogram預測OS可能帶來更多的凈收益(圖5E)。最后,進一步評估了使用測試隊列和整個隊列的四基因預后nomogram的預測價值。校準圖(圖5F,H)和風險分數的時間依賴性ROC曲線(圖5G,I)與從訓練集得出的結果一致。

圖5 指示變量與LUAD患者預后之間的相關性

04 - 風險特征的功能注釋

????????為了進一步探索與四個基因特征相關的潛在生物途徑和過程,作者通過GSEA對訓練隊列中的樣本進行了基因集富集。發現與腫瘤發生有關的關鍵途徑,包括細胞周期、DNA復制、P53信號通路、蛋白酶體和剪接體,在高危組中明顯富集(圖6A)。此外,作者研究了風險模型是否與腫瘤免疫微環境有關,繪制了22種腫瘤免疫細胞類型的熱圖,顯示這些免疫細胞的分布(圖6B)。然后,發現高危LUAD患者的T細胞CD4記憶激活、NK細胞靜止、巨噬細胞M0和巨噬細胞M1的比例明顯較高,T細胞CD4記憶靜止、單核細胞和肥大細胞靜止的比例較低(圖6C)。此外,進一步分析了風險組與免疫檢查點分子表達之間的相關性。結果顯示,與低風險組相比,高風險組的TNFSF4、CD274、PD-L1和LAG3的表達水平明顯更高(圖6D)。因此,在這些結果中觀察到的免疫細胞浸潤和免疫檢查點分子表達的異質性可能為LUAD患者提供潛在的預后指標和免疫治療的目標。

圖6 高風險組和低風險組的功能分析

05 - 高風險和低風險LUAD患者的化療反應分析

????????除了免疫檢查點阻斷療法,化療仍然是晚期LUAD患者的有效治療方法。因此,作者試圖在整個隊列中調查LUAD的低風險和高風險患者對常見化療藥物的反應。根據GDSC的數據,計算出高危組和低危組的IC50值。結果表明,高危LUAD患者對順鉑、多西紫杉醇、多柔比星、厄洛替尼、依托泊苷、吉西他濱、紫杉醇和長春瑞濱的敏感性增加,而高危組和低危組之間阿糖胞苷的IC50值沒有明顯差異,這表明四基因風險模型可能作為化學敏感性的潛在預測因子(圖7)。

圖7 低風險和高風險LUAD患者的化療反應不同

06 - 構成風險特征的GPI、IL22RA1、CCT6A和SPOCK1影響LUAD的預后,與PI3K/AKT信號通路的激活相關

????????最后,為了深入了解GPI、IL22RA1、CCT6A和SPOCK1對LUAD進展的影響,利用TACG-LUAD數據庫進行了GESA,分別比較GPI、IL22RA1、CCT6A和SPOCK1的高表達和低表達。觀察到,許多參與PI3K-AKT-mTOR信號通路的重要調控基因,在調節各種致癌過程中發揮著重要作用,在GPI、IL22RA1、CCT6A和SPOCK1高表達的細胞中明顯富集(圖8A)。

????????鑒于CCT6A的歸一化富集分數(NES)最高,作者主要選擇CCT6A來探索相關機制。首先通過Western blot檢測了CCT6A在BEAS-2B、A549和H1299細胞系中的表達水平(圖8B)。由于CCT6A在兩個非小細胞肺癌(NSCLC)細胞系A549和H1299中的高表達水平,使用了針對CCT6A的短發夾RNA(shRNA)來沉默CCT6A。結果顯示,CCT6A的敲除大大降低了A549和H1299的增殖和遷移(圖8C-F)。此外,Western blot分析顯示,CCT6A沉默明顯抑制了A549和H1299的上皮-間質轉化(EMT),表現為N-adherin的蛋白水平明顯降低,E-cadherin明顯增加。值得注意的是,還觀察到CCT6A敲除后,p-PI3K和p-AKT的蛋白水平明顯下降(圖8G),這表明CCT6A可能通過激活PI3K/AKT通路影響LUAD細胞的EMT,進而影響LUAD的惡性程度和LUAD患者的預后。

圖8 探討風險模型相關基因GPI、IL22RA1、CCT6A和SPOCK1對LUAD進展的潛在機制

四、結論

????????作者通過生物信息學方法構建了一個LUAD特異性lncRNA介導的ceRNA網絡。然后,基于該網絡的節點基因開發了一個四種基因的預后特征,在預測LUAD患者的生存和化療反應方面表現出很高的性能。最后,對獨立的預后因素進行了進一步的分析,并結合成一個執行良好的nomogram,顯示出強大的臨床應用潛力。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容