Prognosis-Related Molecular Subtypes and Immune Features Associated with Hepatocellular Carcinoma
與預后相關的分子亞型和與肝細胞癌相關的免疫特征
發(fā)表期刊:Cancers (Basel)
發(fā)表日期:2022 Nov 21
影響因子:6.575
DOI:? 10.3390/cancers14225721
一、研究背景
????????原發(fā)性肝癌是全球癌癥相關死亡的第四大原因,它表現(xiàn)出顯著的組織學和生物學異質性。肝細胞癌(HCC)是最常見的類型,占原發(fā)性肝癌的90%以上。HCC的主要風險因素包括感染丙型肝炎或乙型肝炎病毒、過度飲酒、吸煙和飲食。遺傳風險因素可能與這些環(huán)境風險因素相互作用,如CTNNB1(編碼β-catenin)、TP53和AXINI基因的突變。
????????由于HCC的異質性很強,身體不同區(qū)域的腫瘤可能代表不同的亞型。這些亞型在代謝和信號通路上可能有所不同,導致患者生存期的差異。
二、材料與方法
1、數(shù)據(jù)來源
1)從廣西醫(yī)科大學附屬腫瘤醫(yī)院收集了六對HCC和配對的癌旁正常組織樣本,這些樣本是在不同的臨床階段被病理診斷為HCC的患者
2)從TCGA數(shù)據(jù)庫中的肝癌(LIHC)數(shù)據(jù)集中下載了371個原發(fā)腫瘤樣本、3個復發(fā)腫瘤樣本和50個正常組織樣本的基因表達譜
3)在GEO數(shù)據(jù)庫,獲得了GSE14520(225個HCC組織和220個非腫瘤組織)、GSE76427(52個相鄰的非腫瘤組織和115個HCC組織)、GSE25097(268個HCC組織和243個鄰近的非腫瘤組織)、GSE138178(49個HCC組織和配對的鄰近非腫瘤組織)、GSE84006(38個原發(fā)性HCC組織和配對的鄰近非腫瘤肝組織)、GSE136319數(shù)據(jù)集(秘魯患者的47個腫瘤和47個非腫瘤肝臟組織的DNA甲基化數(shù)據(jù))
2、分析流程
三、實驗結果
01 - HCC中的DEGs及其功能富集度
????????為了確定與HCC預后相關的基因,作者首先利用TCGA、GSE76427、GSE25097和GSE14520數(shù)據(jù)集的數(shù)據(jù)進行了差異分析(圖2A,B)。在四個數(shù)據(jù)集重疊的4036個交叉的DEGs中,有2058個上調,1272個下調,706個DEGs表達方向不同(圖2C)。功能富集分析表明,激活了各種與HCC相關的途徑,如P53信號通路、色氨酸代謝以及初級膽汁酸生物合成(圖2D)。重疊的DEGs可能參與了細胞的氨基酸分解過程、羧酸分解過程和其他代謝過程(圖2E)。
????????GSEA顯示,DEGs與細胞周期、錯配修復和DNA復制正相關,但與礦物質吸收、PPAR信號傳導以及補體和凝血級聯(lián)負相關。在GSE14520中,預測HCC患者5年OS的AUC是58%。Cox回歸和KM分析也顯示,3330個重疊的DEG中,有217個與HCC預后密切相關,而使用Metascape的進一步富集分析顯示,這些預后基因在小分子分解代謝、小分子生物合成和有絲分裂細胞周期中明顯富集。
????????為了評估TCGA和GSE14520中預后相關基因的診斷價值,作者計算了它們的AUC值,并從217個AUC>0.80的預后基因中選出138個(圖3A)。然后對這138個基因進行單變量Cox分析,得到10個相對重要性大于0.2的生存相關基因(圖3B)。隨后的LASSO回歸確定了七個特征基因:SORBS2, DHRS1, SLC16A2, RCL1, IGFALS, GNA14和FANCI,預測5年OS的AUC為0.744(圖3C-E)。然后用GMM模型將7個特征基因的表達數(shù)據(jù)整合成3個群組127個組合,并選擇AUC最高的群組來識別預測HCC復發(fā)的強勢特征基因。經GMM分類器測定,127個組合中的1個特征基因的平均準確率為0.9901(圖3F)。通過單變量Cox回歸分析進一步調查特征基因的獨立預后價值,表明FANCI在兩個數(shù)據(jù)集中都與不良的OS顯著相關(圖3G,H),表明它可能作為HCC復發(fā)的一個新的預測生物標志物。
02 - 基于特征基因的預后風險評分作為HCC的預后工具
????????根據(jù)風險評分的中位數(shù)將HCC患者分為高風險組和低風險組(圖4A,B),在GSE14520和TCGA數(shù)據(jù)中,其預測1、3、5年OS的AUC值均大于0.65(圖4C,D)。使用整合了特征基因和臨床病理風險因素的nomogram對OS預測進行了量化(圖4E)。校準圖也顯示,nomogram與理想模型相比表現(xiàn)良好(圖4F)。
????????為了確定HCC的分子亞型,根據(jù)217個預后相關基因對GSE14520和TCGA數(shù)據(jù)庫的HCC樣本進行了NMF聚類(圖5A-C)。能夠將HCC患者分為兩個分子亞型(圖5C):預后差的HCC的C1亞型,和OS良好的C2亞型(圖5E)。還發(fā)現(xiàn)GSE14520的剪影寬度值為0.85(圖5D),TCGA的剪影寬度值為0.88,這表明HCC樣本與兩個不同亞型之間有很好的相關性。
03 - HCC亞型對免疫療法和化療藥物的敏感性
????????GSE14520和TCGA中兩種HCC亞型的臨床數(shù)據(jù)分布比較表明,兩種亞型的年齡沒有明顯差異,但男性比女性更容易患兩種亞型的疾病。此外,根據(jù)GSE14520(圖6B)和TCGA(圖6C)的數(shù)據(jù),C1亞型顯示出比C2亞型更短的生存期(圖6A),以及對CTLA4-R治療更大的反應性。相反,TCGA中的C2亞型對抗癌藥物ZM.447439和AG.14699的反應性明顯大于C1亞型(圖6D)。
04 - 干性指數(shù)和FANCI的表達
????????根據(jù)干性指數(shù)值對HCC樣本進行排名,顯示其臨床人口學特征與mRNAi明顯相關(圖S4A)。FANCI與干性指數(shù)正相關(圖S4B),它在GSE138178和GSE84006數(shù)據(jù)集中都是上調的(圖S4C,D)。利用Oncomine數(shù)據(jù)庫進一步分析FANCI在各種癌癥類型中的mRNA表達,發(fā)現(xiàn)FANCI在肝癌中與正常組織相比明顯上調(圖S4E)。這些結果被TCGA RNA測序數(shù)據(jù)在TIMER中證實,表明FANCI在腫瘤中的水平明顯高于鄰近的正常組織(圖S4F)。
????????為了探索FANCI在HCC預后中的作用,作者進行了時間-ROC分析,結果顯示,在GSE14520數(shù)據(jù)集中預測5年OS的AUC最高(圖7A),而在TCGA中預測1、3、5年OS的AUC都大于0.60(圖7B)。FANCI的AUC在所有四個數(shù)據(jù)集中都高于0.90(圖7C)。富集分析顯示,F(xiàn)ANCI與纖維蛋白溶解的調節(jié)、環(huán)氧酶P450途徑和蛋白激活級聯(lián)呈正相關,而與錯配修復、中心體分離和轉體合成呈負相關(圖7D)。此外,F(xiàn)ANCI與細胞周期、DNA復制和蛋白酶體正相關,而與FOXO、IL-17和p53信號通路負相關(圖7E)。
????????還發(fā)現(xiàn)在人類蛋白質圖譜數(shù)據(jù)庫中,F(xiàn)ANCI在HCC組織中的表達高于對照組(圖8A)。同樣,6名HCC患者的轉錄組測序結果顯示,與鄰近患者相比,F(xiàn)ANCI在HCC中高表達,特別是在腫瘤進展的患者2(RFS 66天)和5(RFS 248天)(圖8B-D)。同時,F(xiàn)ANCI在以前的研究中被確定為Wnt信號的下流基因,調節(jié)HCC的早期復發(fā)。這些結果提示,它可能正向調節(jié)范可尼貧血癥的途徑(圖8E)。
05 - 免疫細胞浸潤、體細胞突變和DNA甲基化
????????為了探索免疫細胞浸潤在HCC中的潛在臨床意義,作者確定了所有四個數(shù)據(jù)集的浸潤水平(圖9A)。與對照組相比,HCC樣本中T輔助2型(Th2)、T輔助和前樹突狀細胞明顯上調,而T細胞和細胞毒性細胞與C1亞型明顯相關(圖9B)。還分析了HCC組織中24種免疫細胞類型之間的相關性(圖9C),并構建了四個集群,顯示了彼此之間的正負相關(圖9D)。此外,樹突狀細胞和Th12細胞與七個特征基因相關,而Th2細胞和FANCI之間有明顯的相關性(圖9E)。CIBERSORT算法還顯示,大多數(shù)浸潤的免疫細胞是T細胞(圖9E)。
????????根據(jù)顯示至少20倍覆蓋率的測序數(shù)據(jù),在364名HCC患者中鑒定了體細胞單核苷酸變異。發(fā)現(xiàn)突變使腫瘤抑制基因TP53(占所有患者的31%)、AXINI(8%)和RB1(5%)失活(圖S5A)。此外,發(fā)現(xiàn)FANCI在HCC患者中有兩個位點發(fā)生突變,這些突變可能會影響蛋白功能(圖S5B)。進一步發(fā)現(xiàn)FANCI的mRNA水平與蛋白水平呈負相關,這意味著該基因會受到甲基化的影響(圖S5D)。對GSE136319中秘魯肝癌患者HCC和非腫瘤組織之間差異甲基化的基因分析表明,甲基化修飾被調查(圖S5C)。此外,MEXPRESS工具顯示,TCGA中FANCI啟動子區(qū)域的甲基化水平在HCC樣本中明顯高于正常組織。
四、結論
????????作者利用生物信息學比較了腫瘤和非腫瘤組織之間的基因表達,以確定HCC分子亞型和生物標志物來幫助預測預后。此外,使用單樣本基因集富集分析(ssGSEA)來確定免疫浸潤的水平并描述腫瘤免疫微環(huán)境的特征。本研究確定了HCC患者的兩種分子亞型,并檢測了可能作為HCC潛在生物標志物和治療目標的關鍵基因。