介紹
惡性實體瘤組織不僅包括腫瘤細胞,還包括與腫瘤相關的正常上皮和基質細胞,免疫細胞和血管細胞。基質細胞被認為在腫瘤生長、疾病進展和耐藥性中起重要作用。
浸潤性免疫細胞的作用與環境有關,雖然浸潤性T淋巴細胞的抗腫瘤作用在卵巢癌中已被觀察到,但在結直腸癌中,腫瘤的生長、侵襲和轉移與腫瘤的生長、侵襲和轉移有關.
對腫瘤組織中與腫瘤相關的正常細胞的全面了解可能為腫瘤生物學的研究提供重要的見解,并有助于開發可靠的預后和預測模型。
作者提出了一種新的算法,利用癌癥樣本轉錄譜的獨特性質來推斷腫瘤細胞的內容以及不同的浸潤正常細胞,稱為Estimation of STromal and Immune cells in MAlignant Tumour tissues using Expression data(ESTIMATE)。
作者重點研究基質細胞和免疫細胞,它們構成了腫瘤樣本中主要的非腫瘤成分,并識別與腫瘤組織中基質細胞和免疫細胞浸潤相關的特異性信號。通過進行單樣本基因集富集分析(ssGSEA),作者通過計算基質和免疫評分來預測浸潤基質和免疫細胞的水平,這些構成了在腫瘤組織中推斷腫瘤純度的 ESTIMATE score的基礎。
ESTIMATE算法的概述如下圖所示
作者從不同平臺的數據一篩選出兩個 signature,一個是Stromal signature,Immune signature。兩個標簽分別有141個基因。通過ssGSEA分別計算基質得分和免疫得分。然后聯合這兩個得分來預測腫瘤純度。
ESTIMATE適用平臺有"affymetrix", "agilent", "illumina",為了能讓RNAseq數據能夠適用ESTIMATE,使用VOOM法對RNAseq數據進行處理。此處用原始的sample文件進行輸入
ESTIMATE代碼
#安裝包
if (F) {
library(utils)
rforge <- "http://r-forge.r-project.org"
install.packages("estimate", repos=rforge, dependencies=TRUE)
}
library(estimate)
help(package="estimate")
輸入數據進行分析
rm(list = ls())
library(estimate)
in.file <- 'sample_input.txt' #輸入文件
outfile2E <- 'ESTIMATE_input.gct' #生成ESTIMATE 的輸入文件
outputGCT(in.file, outfile2E) #該函數以GCT格式寫入輸入文件
filterCommonGenes(input.f= in.file, output.f= outfile2E, id="GeneSymbol")
# 該功能將每個平臺的不同數量的基因與10412個普通基因相結合。
### code chunk number 2: estimate
#這個功能計算基質,免疫,并估計得分每個樣本使用基因表達數據。
estimateScore("ESTIMATE_input.gct", "ESTIMATE_score.gct")
plotPurity(scores="ESTIMATE_score.gct", samples="s516")
#根據ESTIMATE score繪制腫瘤純度。
#將評分保存為txt格式
ESTIMATE_score <- read.table("ESTIMATE_score.gct", skip = 2,#前兩行跳過
header = TRUE,row.names = 1)
ESTIMATE_score <- ESTIMATE_score[,2:ncol(ESTIMATE_score)]
ESTIMATE_score
write.table(ESTIMATE_score,file = "ESTIMATE_score.txt",quote = F,sep = "\t")
參考來源
Yoshihara, K., Shahmoradgoli, M., Martínez, E. et al. Inferring tumour purity and stromal and immune cell admixture from expression data. Nat Commun 4, 2612 (2013).https://doi.org/10.1038/ncomms3612