大家好!今天給大家介紹一篇關于胃癌(GC)診斷和預后特征的生信文章。文章中建立了GC的單細胞轉錄圖譜,重點關注T細胞相關基因的表達,用于細胞-細胞通訊分析、軌跡分析和轉錄因子調控網絡分析。發現了與T細胞相關的預后特征。根據這些預后特征將患者分為高風險或低風險組,可以有效地預測患者的生存率和腫瘤微環境的免疫浸潤狀態。文章思路簡單,方法不難可重復,感興趣的小伙伴不要錯過哦!
摘要
**背景 **胃癌( gastric cancer,GC )的早期診斷和預后預測是當前GC治療臨床實踐中面臨的重大挑戰。因此,作者的目的是探索可以預測GC患者預后的相關基因特征。
方法 在本研究中,作者建立了GC的單細胞轉錄圖譜,重點關注T細胞相關基因的表達,用于細胞-細胞通訊分析、軌跡分析和轉錄因子調控網絡分析。此外,作者使用TCGA和GEO數據對胃癌患者的免疫相關預后基因特征進行了驗證和預測。基于這些預后基因標簽,作者通過將患者樣本分為高風險或低風險組來預測GC患者的免疫浸潤狀態。
結果 基于10例胃癌患者的腫瘤樣本和相應的正常樣本,作者選取了18416個細胞進行后續的單細胞測序分析。從中,作者鑒定了3284個T細胞,并從5種不同的T細胞亞型中獲得了641個與T細胞相關的差異表達基因。通過整合大量RNA測序數據,作者發現了與T細胞相關的預后特征。根據這些預后特征將患者分為高風險或低風險組,可以有效地預測患者的生存率和腫瘤微環境的免疫浸潤狀態。
結論 本研究探索了胃癌患者中與T細胞相關的預后基因特征,為預測患者的生存率和免疫浸潤水平提供了見解。
圖 1 研究工作流程
研究結果
胃癌的單細胞轉錄組圖譜
在本研究中,作者共分析了GSE183904數據集中的10個樣本,其中包括5例患者的腫瘤和正常組織樣本。每個樣本都進行了初步篩選,以去除低質量數據,結果保留了18416個細胞用于后續分析。然后,作者整合不同的樣本以消除批次效應,并進行標準化、中心化和PCA降尺度,然后使用t - SNE方法進行聚類可視化。圖2A展示了不同樣本的單細胞轉錄組圖譜,而圖2B展示了正常和腫瘤樣本的單細胞轉錄組圖譜。聚類分析將18416個細胞分為25個簇,如圖2C所示。使用Single R包進行細胞注釋發現8種細胞類型( 圖2D ):高表達PGC的上皮細胞、高表達XCL1的NK細胞、高表達C1Q8的巨噬細胞、高表達IL7R的T細胞、高表達IGLC2的B細胞、高表達POSTN的組織干細胞、高表達HLA - DRA的單核細胞和高表達PLVAP (圖2F和G)的內皮細胞。圖2E為其在不同樣本中的比例,上皮細胞、T細胞、B細胞和NK細胞所占比例較高,而組織干細胞、巨噬細胞、單核細胞和內皮細胞所占比例相對較小。
圖 2 GC患者正常和腫瘤樣本的單細胞圖譜綜述。
scRNA-seq中T細胞的單細胞轉錄組圖譜和富集分析
GC scRNA-seq圖譜顯示在所有樣本中都存在大量的T細胞。因此,本研究從樣本中提取3284個T細胞,用于后續的聚類和標注。圖3A顯示了T細胞再次聚類后的7個簇,圖3B顯示了T細胞的注釋,包括763個記憶CD8 T細胞,426個黏膜相關不變型T ( MAIT )細胞,297個調節性T細胞,1017個T輔助細胞1/17 (Th 1/17)和781個Vδ2 T細胞。圖3C和D為每個T細胞亞型的標記基因,包括GZMK、CCR6、trbv1 -1、LINC01871和BATF,圖3E為每個T細胞亞型的前10個DEGs。對T細胞相關的DEGs進行GO富集分析,發現它們主要富集在BP,如免疫系統過程的調節、免疫反應和細胞活化(圖3F及附表S5)等。在細胞組分( CC )方面,主要集中在細胞表面、膜的一側和質膜的外側。在分子功能( molecular function,MF )方面,它們主要參與信號受體結合、抗原結合和免疫球蛋白受體結合。KEGG富集分析顯示,T細胞相關標志基因主要參與細胞因子-細胞因子受體相互作用、MAPK信號通路和NF - κ B信號通路(圖3G)。
圖 3 scRNA-seq中T細胞的單細胞轉錄組圖譜。
細胞-細胞通訊分析
在這項研究中,作者采用CellChat功能來模擬不同類型細胞之間的配體-受體相互作用,從而產生細胞-細胞通信網絡(圖4A)。通過對該網絡信號通路的通路分析,作者發現了在細胞間通訊中頻繁出現的中期因子(MK)和巨噬細胞移動抑制因子(MIF)信號通路。發現MIF信號傳導途徑廣泛存在于各種類型細胞中的配體-受體相互作用中,其中CD74、CXR4和CD44在多種細胞類型中表現出更高的表達水平(圖4B-G)。
圖 4 細胞間通訊分析。
scRNA-seq中T細胞的偽時序分析
偽時序分析,又稱細胞軌跡分析,是根據單細胞樣本中時間基因的表達模式,模擬不同細胞的發育軌跡。在本研究中,作者提取T細胞來展示它們的發育軌跡,揭示了T細胞亞型的四個分支(圖5A)。圖5B和D表明T細胞在發育過程中表現出9種分化狀態,而圖5C和E描述了細胞亞型分化的時間順序,顏色較深的細胞逐漸過渡到顏色較淺的細胞。這說明調節性T細胞和輔助性T細胞屬于細胞發育的早期階段,而記憶性CD8 T細胞則屬于細胞分化的晚期階段,從第4分支到第2分支,再到第3分支,最后到第1分支。隨后,作者利用BEAM函數,通過熱圖展示了這四個不同分支的時間基因表達。通過GO富集分析探索BPs,結果表明,分支1主要與蛋白結合、適應性免疫反應、T細胞激活的正向調節、白細胞激活的調節有關。分支2主要與適應性免疫反應、對外界刺激反應的正調控、對病毒的反應有關。分支3主要與適應性免疫反應、炎癥反應和細胞死亡的正調控有關。最后,分支4主要與免疫球蛋白產生、T細胞分化和對趨化因子(圖5F – I )的反應有關。可見,這些BPs主要參與T細胞分化和免疫應答。
圖 5 scRNA-seq中T細胞的偽時間分析。
T細胞中TF調控網絡的構建
利用SCENIC功能預測TFs及其與T細胞相關的靶基因。最終選取前5個TFs (SPI1、TFF3、FOXP3、MYLK、GATA2)進行分析(圖6A)。隨后,采用Cytoscape軟件進行網絡可視化,將TFs表示為綠色節點,對應的靶基因表示為黃色節點(圖6B)。對這些靶基因進行富集分析,氧化石墨烯分析結果顯示,在信號轉導、炎癥反應和免疫反應等bp中顯著富集(圖6C)。KEGG分析結果顯示,在腫瘤通路、細胞因子-細胞因子受體相互作用、PI3K-Akt信號通路、MAPK信號通路等通路中顯著富集(圖6D)。
圖 6 T細胞中TF調控網絡的分析。
T細胞中預后基因簽名的預測和驗證
在TCGA-STAD數據集上進行差異基因分析,將得到的1494個DEGs與scRNA-seq中的641個T細胞相關DEGs取交集,得到10個交集基因(圖7A ):MAL、HOPX、ARL4D、GKN1、HBB、CLIC3、GPR15、HPGD、MZB1和GBP5。首先,對這些基因的表達矩陣進行標準化,并采用LASSO回歸分析計算其風險分數。以TCGA-STAD數據集為訓練集,GSE84437數據集為測試集,建立預后模型。根據風險評分(圖7B-D , G)將患者分為高危組和低危組。Kaplan-Meier生存曲線顯示訓練集和測試集(圖7E, H)的高風險組預后均較差。時間依賴的ROC曲線分析顯示,在訓練集( GC患者1年、3年和5年生存率的AUC約為0.6)和測試集(圖7F, I)中,預后特征在預測患者總生存期方面具有良好的性能。隨后,生成氣泡圖來可視化scRNA-seq中10個預后信號的表達(圖8A)。此外,我們還分析了這10個預后信號與22種免疫細胞類型之間的相關性,發現GBP5與多種T細胞亞型之間存在很強的相關性(圖8B)。
圖 7 T細胞中預后基因簽名的預測和驗證。
圖 8 T細胞和免疫細胞預后信號的相關性分析。
臨床相關性cox回歸分析及諾圖圖分析
為了進一步闡明與胃癌相關的危險因素,并驗證現有預后基因標簽的風險評分,我們對患者的臨床信息進行了Cox回歸分析。在單因素Cox回歸分析中,發現年齡( HR = 1.019 , 95 % CI = 1.001 ~ 1.037 , P < 0.05)、性別( HR = 1.482 , 95 % CI = 1.012 ~ 2.172 , P < 0.05)、腫瘤分期( HR = 1.559 , 95 % CI = 1.255 ~ 1.936 , P < 0.001)和風險評分( HR = 1.947 , 95 % CI = 1.323 ~ 2.866 , P < 0.001)顯著影響患者的總生存期,并被確定為不良預后危險因素(圖9A )。在多因素Cox回歸分析中,年齡( HR = 1.031 , 95 % CI = 1.013 ~ 1.050 , P < 0.001)、腫瘤分期( HR = 1.678 , 95 % CI = 1.338 ~ 2.105 , P < 0.001)和風險評分( HR = 2.326 , 95 % CI = 1.540 ~ 3.512 , P < 0.001)被確定為影響患者總生存期的獨立預后因素(圖9B )。隨后,利用GC患者的臨床數據,我們用R語言生成了列線圖。該列線圖對患者的年齡、性別、腫瘤T、N、M分期及危險度評分提供了相應的分值,可以預測1年、3年、5年的生存概率(圖9C)。
圖 9 臨床風險指標分析。
預后基因簽名的免疫浸潤分析
為了進一步探討高危組和低風險患者組的預后信號與TME之間的關系,我們首先使用CIBERSORT算法對22種免疫細胞類型的比例進行了可視化分析(圖10A)。隨后,在風險分層的基礎上,利用ESTIMATE算法計算患者的免疫評分。結果顯示,高危組基質評分較高(P < 0.0001),而低風險組免疫評分較高(P < 0.001)(圖10B-E)。此外,我們使用ssGSEA算法來分析高危和低風險患者群體的免疫細胞比例。分析表明,低危組中CD8 T細胞、活化記憶CD4 T細胞、T濾泡輔助細胞、γδ T細胞和M1巨噬細胞的比例較高。相反,高危組表現出更高比例的靜息記憶性CD4 T細胞、單核細胞、靜息肥大細胞和幼稚B細胞(圖10F )。這些發現表明,與高風險組相比,低風險組患者具有抗腫瘤活性的免疫細胞比例更高,表明免疫浸潤在腫瘤發生發展過程中的主要作用。
圖 10 T細胞預后基因特征的免疫浸潤分析
結論
在本研究中,作者利用scRNA-seq方法構建胃癌單細胞轉錄組圖譜,探索T細胞在細胞軌跡、轉錄因子調控網絡和細胞-細胞通訊機制中的作用。此外,作者將單細胞樣本與TCGA和GEO數據整合,以預測和驗證與T細胞相關的預后基因特征,使作者能夠預測患者1年、3年和5年生存率。此外,作者觀察到這些預后基因特征也具有預測TME內免疫浸潤的能力。