hello,大家好,我們的分析也慢慢進入深水區了,很多方法需要聯合起來使用,如何靈活運用各種方法,就需要我們的經驗和智慧了。今天分享的文獻在Multi-regional characterisation of renal cell carcinoma and microenvironment at single cell resolution,幾乎用到了我們常見的所有的單細胞的分析思路和方法,當然了,生物學意義也進行了很好的詮釋,尤其是利用單細胞數據calling Mutation,大家多多學習和積累。
放一張我覺的最關鍵的圖
Abstract
腫瘤行為取決于癌細胞的致癌特性及其多細胞相互作用。 通過從 12 名腎腫瘤患者獲得的 270,000 個單細胞轉錄組和 100 個微解剖的完整外顯子組檢查這些依賴性(現在的單細胞數據都是以大數據量著稱)。 從腫瘤核心、腫瘤-正常界面、正常周圍組織和外周血的多個區域取樣組織(這個時候空間轉錄組更具有說服力)。 發現 CD8+ T 細胞克隆型的主要空間位置在很大程度上定義了衰竭狀態,而體細胞瘤內異質性無法解釋克隆型異質性。 從單細胞 RNA 測序數據中calling從頭突變使我們能夠譜系追蹤和推斷細胞的克隆性。 發現了六個區分腫瘤細胞功能的meta程序。 在腫瘤-正常界面富集的上皮-間質轉化meta程序似乎通過巨噬細胞表達的 IL1B 進行調節,可能形成治療靶點。
Introduction
Clear cell renal cell carcinoma (ccRCC) 是腎細胞癌 (RCC) 最常見的亞型,約占 RCC 病例的 75% 和the majority of deaths from kidney cancer。許多努力已經表征了 ccRCC 的基因組landscape,揭示了重要的驅動事件,例如 VHL 的雙等位基因失活(最常見的是伴隨著染色體 3p 的丟失和 VHL 中的突變/表觀遺傳沉默),隨后是染色質重塑和組蛋白修飾相關的突變基因 PBRM1、BAP1 和 SETD2。已經系統地研究了 ccRCC 演變過程中啟動事件的時間。正如之前的多區域外顯子組測序研究所揭示的那樣,隨后突變事件的腫瘤內異質性 (ITH) 似乎是 ccRCC 的一個顯著特征。相比之下,ccRCC 在轉錄水平上的 ITH 不太清楚,部分原因是包含腫瘤微環境 (TME) 的多細胞生態系統的復雜性。特別是,ccRCC TME 中惡性和非惡性細胞的表型異質性及其與空間定位的關系仍然不清楚。
ccRCC 是一種免疫細胞大量浸潤的癌癥類型。免疫檢查點阻斷 (ICB) 治療已被證明可有效提高患者的生存率,突出了探索 ccRCC 免疫微環境的重要性。以前的研究使用批量測序分析了 ccRCC 的免疫狀況,這限制了它們剖析不同免疫細胞群的能力。使用質譜流式細胞術的 ccRCC 綜合免疫圖譜揭示了 ccRCC 腫瘤生態系統中的免疫細胞多樣性。單細胞 RNA 測序 (scRNA-seq) 的最新進展及其在癌癥研究中的應用徹底改變了我們對腫瘤細胞表型異質性、腫瘤免疫landscape、TME 的復雜性和可塑性以及 TME 中細胞間通訊的理解。具體而言,在 ccRCC 中,最近的一項 scRNA-seq 研究提供了支持其起源于近端腎小管細胞的證據。其他研究利用 scRNA-seq 研究 ccRCC 的免疫狀況,主要關注 ICB 治療相關隊列和不同疾病階段,揭示與治療效果或疾病進展相關的關鍵特征。
在考慮 TME 的異質性時,感興趣的空間區域擴展了與突變 ITH 相關的區域。更廣泛的目標區域包括循環血液、腫瘤-正常界面或腫瘤假包膜(代表腫瘤與相鄰正常腎臟之間的邊界)、相鄰正常腎臟和腎周脂肪組織。假包膜的纖維結締組織似乎在空間上限制了生長,侵襲與腫瘤分期和分級相關。由于 RCC 中的obesity paradox,腎周肥胖引起了人們的興趣,其中肥胖是診斷腎癌的最強風險因素之一,但也與腫瘤學結果的改善有關。了解 ccRCC 在腫瘤細胞、各種免疫/基質細胞方面的空間異質性和進化,以及它們在更廣泛的 TME 中的相互作用仍然缺乏。為了解決這個問題,對 12 名患者進行了基于多區域的 scRNA-seq,對外周血、正常腎臟、腫瘤核心的四個不同空間區域和腫瘤-正常界面進行了采樣,同時對激光捕獲顯微切割進行了局部詳盡的外顯子組測序(LCM) 衍生的腫瘤樣本。
Results
Multi-region based genomic and single-cell transcriptomic profiling of RCC
對 12 名接受放射學診斷腎腫瘤手術切除的患者進行了多區域基因組和單細胞轉錄組分析。 在組織病理學檢查后,12 名患者中有 10 名的腫瘤被評估為 ccRCC,1 名(PD47172)為嗜酸細胞瘤,1 名(PD44714)為大的良性厚壁囊腫。 在每位患者中,從外周血、正常腎臟、腫瘤核心的四個不同空間區域以及腫瘤-正常界面采集組織。 此外,如果有的話,還從腎周脂肪、正常腎上腺、腎上腺轉移和腫瘤血栓中取樣。
在可以從這些樣本中提取足夠數量的活單細胞的情況下,使用 10x 平臺進行了基于液滴的 5' scRNA-seq 和 T 細胞受體 (TCR) 富集。 同時,在執行全外顯子組測序 (WES) 之前,使用 LCM 從每個含有腫瘤組織的區域解剖每個患者的微活檢樣本。 LCM 方法使我們能夠通過詢問亞毫米大小的活檢來探索 ITH 的極限。 基于 WES 數據,確定了在 ccRCC 中報告為復發/驅動事件的基因組改變。 9 名 ccRCC 患者中有 7 名(一名 ccRCC 患者沒有數據)具有 VHL 突變,4 名具有 PBRM1 突變,3 名攜帶 BAP1 突變。 在所有 9 名患者中都檢測到染色體 3p 的拷貝數丟失。 嗜酸細胞瘤攜帶整個 1 號染色體的特征性拷貝數丟失。
使用 scRNA-seq,在嚴格的質量控制后從大約 270,000 個細胞中捕獲轉錄組,根據典型標記基因的表達可以將其大致分為 12 種主要細胞類型
由于合適的單細胞分離方案,T 細胞(表達 CD3D、CD3G 和 CD3E)在數據中最為豐富,其次是骨髓細胞(表達 CD68 和 CD14)和自然殺傷 (NK) 細胞(表達 NCR1 和 KLRC1 )。還捕獲了大量其他免疫細胞群:B 細胞(表達 CD79A 和 MS4A1)、漿細胞(表達 IGKC 和 IGHG1)、肥大細胞(表達 TPSAB1 和 TPSB2)和漿細胞樣樹突細胞(pDC;表達 IRF7 和 LILRA4) .除了免疫區室,數據中還鑒定了四種基質細胞類型:內皮細胞 (EC)(表達 PLVAP 和 TIMP3)、成纖維細胞(表達 ACTA2 和 TAGLN)、近端腎小管 (PT) 細胞(表達 SLC22A8 和 GPX3)和非 PT 上皮細胞(表達 DEFB1 和 UMOD)。從 scRNAseq 數據推斷,RCC 腫瘤細胞在特異性表達 CA9 并在其基因組中具有廣泛拷貝數變異 (CNV) 的cluster內被鑒定出來。接下來,我們研究了 12 種主要細胞類型的起源組織,并觀察了這些細胞類型的不同組織分布(分析中合并了四個區域)
- 注:(A) Heatmap illustrating the clinical features (left panel) and the genomic landscape (middle panel) and copy number profiles (right panel) of the tumours sequenced. (B) UMAP, (C) cell type, and (D) sampled region depicting the interpatient variability of scRNA-seq results. (E) UMAP showing marker gene expression for all cells. (F) Copy number inference based on scRNA-seq data.
進一步研究中涵蓋的主要細胞區室進行了亞群聚類分析。 NK 細胞的亞群產生了 14 個具有差異表達基因 (DEG) 和異質組織來源的cluster。在這些cluster中,確定了眾所周知的 CD56 (NCAM1) 和 CD16 (FCGR3A) 表達群體。先天淋巴細胞 (ILC) cluster的特征在于 IL7R 和 FXYD7 的表達。兩個 NK cluster(cluster 2 和 6)顯示干擾素γ(IFNG)的高表達,cluster 6 也高表達細胞因子 CCL4L2,并可能在正常腎上腺中富集。確定了一些特征較少的 NK cluster,例如cluster 4,它特異性表達 KRT81 和 KRT86。這種 NK 細胞亞群之前曾在肝細胞癌中報道過,但其功能尚不清楚。 B/漿細胞區室被分為 13 個cluster,其中確定了眾所周知的主要 B 細胞群,如幼稚、轉換記憶和非轉換記憶 B 細胞。活化的 B 細胞(AREGhigh 和 RHOBhigh cluster)可能在腫瘤中富集,而 AREGhigh cluster在腎周脂肪中更富集。與主要細胞類型的外周血組織分布相比,發現血漿 IgA、IgG 和循環細胞(分別表達 IGHA1、IGHG1 和 MKI67)在組織中富集。
- 注:(A&E) UMAPs, (B&F) dotplots of marker genes, (C&G) tissue distribution, and (D&H) regional enrichment of NK and B cells.
CD8+ T cell lineages reveal evolutionary trajectories and the influence of spatial location on exhaustion
T 細胞包含數據中最豐富的細胞類型,大致分為兩個主要部分:CD4+ 和 CD8+ T 細胞(包括 gamma delta T 細胞)。 CD8+ T 細胞區室的亞聚類導致鑒定出 18 個具有不同 DEG 和異質組織位置的cluster。
總的來說,根據典型標記基因的表達確定了典型的 CD8+ T 細胞cluster,它們代表了不同的 T 細胞功能狀態,包括幼稚、效應、記憶、前功能障礙和功能障礙。發現高表達 LEF1 和 CCR7 等基因的幼稚/中樞記憶 (CM) CD8+ T 細胞主要在外周血中富集。鑒定了常駐記憶 (RM) T 細胞,因為它們表達組織駐留標志物(即 ITGAE 和 CD69),并且主要在正常腎臟中富集。特別是,cluster 10 還高表達 CXCL13,它可能在 B 細胞募集和三級淋巴結構的形成中發揮潛在作用。我們發現cluster 6 高度表達 FGFBP2 和 CX3CR1,并且在外周血中大量富集,因此該cluster可能代表最近激活的效應記憶 T 細胞(CD8+ T_EMRA)。基于包括 LAG3、TIGIT、PDCD1、HAVCR2 和 CTLA4 在內的基因表達升高,鑒定了兩個耗盡的 T 細胞cluster(cluster 7 和 8)。有趣的是,我們發現cluster 8 具有最高的 LAG3 表達,并特異性表達免疫抑制細胞因子 IL10。該cluster可能代表具有極高效應子和功能障礙水平的 CD8+ T 細胞,它們通過產生 IL-10 發揮調節功能。發現粘膜相關不變性 T (MAIT) 細胞高表達 TRAV1-2 和 IL7R。鑒定出兩個循環細胞cluster:一個(表達MCM5和PCNA)代表細胞周期G1/S期的細胞,另一個(表達TOP2A和MKI67)代表G2/M期的細胞。除了傳統的 CD8+ T 細胞cluster,我們還鑒定了兩個 gamma delta T 細胞cluster:gdT_Vd1(表達 TRDV1)和 gdT_Vd2(表達 TRDV2)。我們還對 CD4+ T 細胞群進行了亞群聚類分析,揭示了各種亞型,例如 CD4+ na?ve/CM 和 CD4+ 調節性 T 細胞 (Tregs) 及其不同的組織分布.
- 注:(A) UMAP of the subclustering result, (B) UMAP and (C) barplot showing tissue distribution, and (D) regional enrichment of CD8+ T cell population. (E) UMAP showing the RNA velocity result and (F) exhaustion score across the pseudotime trajectory of CD8+ T cells. (G) UMAP of the sub-clustering result, (H) dotplot showing marker gene expression, and (I) UMAP of tissue distribution of CD4+ T cells. (J) Barplot showing the comparison of TCR clonal expansion between CD8+ and CD4+ T cells, breaking down into three different locations: blood, tumour and other regions
接下來,我們使用 Monocle 3 和 RNA 速度分析對 CD8+ T 細胞進行了偽時間軌跡分析,不包括 gamma delta T 和循環cluster。沿著假時間軌跡,我們發現細胞毒性相關基因(即 KLRG1、GNLY 和 GZMH)是逐漸下調而功能障礙相關基因(即 CTLA4、HAVCR2 和 LAG3)逐漸上調。典型的 T 細胞功能障礙前相關基因(即 CXCR4、GZMK 和 GZMA) 最初被上調,然后沿著偽時間軌跡下降。因此,這個偽時間軌跡概括了 CD8+ T 細胞從細胞毒性狀態經過功能障礙前狀態到功能障礙狀態的進展,同時耗竭程度逐漸升高。假時間和耗竭評分之間的正相關也支持這種進展。此外,將前 10 個擴展的 TCR 克隆型投影到軌跡上導致觀察到單個 TCR 譜系通常僅限于類似的表型狀態,而不是分布在整個軌跡上。在所有腫瘤中,發現 90% 的具有 23 個或更多細胞的克隆型被限制在假時間值范圍內(Wilcoxon 檢驗,p < 0.05)。在多位患者中觀察到每個克隆超過 100 個細胞的高度擴增的 TCR 克隆,其中顯著高達 30% 的 CD8+ T 細胞可以來自單個克隆型。相比之下,與 CD8+ 群體中的 TCR 克隆型相比,CD4+ 群體中的 TCR 克隆型擴展較少。許多擴增最多的 CD8+ TCR 克隆具有相當比例的循環細胞,但在較少消耗的克隆型中觀察到的情況除外。這一發現表明 RCC 中高度耗竭的 T 細胞的增殖并未完全停止,類似于先前在黑色素瘤中的發現。
檢查了血液中檢測到的 TCR 克隆型是否反映了在其他區域檢測到的那些。研究發現,無論克隆大小如何,平均耗竭程度(推斷的假時間)和在外周血中檢測到 CD8+ TCR 克隆的概率都具有很強的反相關性,以至于在血液中很少檢測到耗竭的克隆型。這一發現出乎意料,表明組織駐留的耗竭 CD8+ T 細胞克隆似乎不會在外周血中再循環。為了進一步說明 T 細胞耗竭、克隆擴增及其組織分布之間的關系,我們根據 CD8+ T 細胞是單細胞還是擴增以及它們的主要組織位置(血液、正常組織或腫瘤)對它們進行分類。腫瘤中擴增的 T 細胞進一步細分為出現在所有腫瘤區域的那些和不出現的(腫瘤同質和異質)。值得注意的是,CD8+ T 細胞的表型狀態,就耗竭程度而言,表現出對克隆擴增和組織位置的強烈依賴。同時,clones that were private to one tumour region were not significantly more exhausted than those shared between different regions 。
- 注:(A) Dotplot showing marker gene expression defines principal CD8+ cell types. EM, effector memory; Act, activated; EFF, effector; EX, exhausted. (B) UMAP depicting the pseudotime inference of CD8+ cells。 (C) Expression of canonical exhaustion markers across cells ordered by pseudotime analysis. All marker genes are statistically significant across pseudotime values (q value = 0). (D) UMAP showing the 10 most expanded clones from patient PD43948. Grey dots represent cells outside the 10 most expanded clones. (E) Boxplot depicting the most expanded clonotypes (>100 cells) across all patients, ordered by their mean pseudotime values, showing the median, interquartile range and outlier pseudotime values (top panel); barplots showing the maximum expansion for the most expanded region (middle panel) and percentage of cycling cells (lower panel). (F) The probability of detecting a given TCR clone in peripheral blood as a function of minimal clone size and mean pseudotime value of the clone. (G) Mean pseudotime values based on the categorisation of clonotypes according to their principal region of enrichment.
Spatial localisation rather than intra-tumoural heterogeneity primarily influences CD8+ clonotypic heterogeneity
使用從 WES 數據中calling的體細胞突變,構建了系統發育樹來闡明我們研究中腫瘤中的克隆進化和 ITH。 總體而言,我們發現所有腫瘤克隆共享一個長主干但有短分支
- 注:Reconstructed phylogenies from WES of multi-regional LCM biopsies. Each node represents a mutant clone present in one or more of the biopsies.
這表明大多數體細胞突變在個體腫瘤中普遍存在,只有少數個體突變被檢測到。大多數檢測到的驅動突變和關鍵 CNV(即 VHL 突變和染色體 3p 雜合性丟失 (LOH))由個體腫瘤內的所有腫瘤克隆共享,因此位于系統發育樹的樹干上。此外,根據變異等位基因頻率分布,我們測序的絕大多數 LCM 樣本都出現了克隆性。綜上所述,WES 顯示我們隊列中腫瘤的 ITH 范圍是有限的。先前的研究通過比較在來自腫瘤不同空間定位的樣本中檢測到的體細胞突變,廣泛研究了各種癌癥的腫瘤內遺傳異質性。然而,體細胞異質性對不同空間定位的局部腫瘤微環境的影響,尤其是抗腫瘤免疫反應,在很大程度上仍未得到表征。在這里,我們系統地比較了個體腫瘤中 CD8+ T 細胞的體細胞突變、空間定位和 TCR 克隆型之間的關系。
- 注:Comparison of WES derived phylogenies (left) with geographic location (centre) and CD8+ TCR clonotype expansion (right). Colours reference somatic clones to spatial localisation. Each column in the right panel represents a TCR clonotype, those with significant regional enrichment are highlighted in red. a, c, d, and e represents four different regions of the tumour core; g, tumour-normal interface; n, normal kidney; b, peripheral blood; h, normal adrenal gland.
出乎意料的是,發現 T 細胞克隆型在不同的空間定位中具有高度異質性和差異性,即使在僅觀察到體細胞突變異質性可忽略不計的腫瘤區域也是如此。 在腫瘤細胞上產生新抗原的體細胞突變被認為是抗原呈遞時 T 細胞克隆擴增的驅動因素。 我們的發現表明 TCR 克隆擴增的異質性更多地與 T 細胞在組織中的不同空間定位相關,而不是與體細胞突變的 ITH 相關。 為了正式檢驗這一點,我們計算了 T 細胞克隆型距離與 1) 突變距離之間的相關性; 2)空間定位距離
- 注:Scatter plot of the Mantel correlation between tree distances. x-axis represents the correlation coefficient between WES derived clones and TCR clonotype distances. y-axis represents the correlation coefficient between spatial localisation and TCR clonotype distances.、
通過比較這兩種相關性,我們發現 CD8+ T 細胞中的 TCR 異質性與空間定位而非體細胞異質性的相關性更強(配對 Wilcoxon 檢驗,p < 0.05)。
Precise de novo somatic mutation calling from scRNA-seq data
從轉錄組序列檢測單個細胞內的體細胞突變可能有助于推斷它們的克隆關系。 盡管理論上可以從 scRNAseq 數據中calling突變,但目前沒有高精度的方法可用。 在這里,我們開發了一種算法/pipeline來從 scRNA-seq 數據執行從頭體細胞突變calling。 簡而言之,我們在初始過濾步驟之前使用 bcftools 從單細胞 BAM 文件中calling突變,以去除單個細胞中存在的突變和不同細胞譜系之間共享的突變。 在應用二項式過濾器之前,我們檢查了初始步驟中calling的所有位點的參考和變異等位基因計數。 然后,我們在對變體進行注釋后應用了一組最終的過濾指標
- 注:Schematic of the de novo mutation calling algorithm.
為了對我們的突變calling方法進行基準測試,我們首先比較了從腫瘤細胞的 scRNA-seq 數據calling的體細胞突變與從腫瘤 WES 數據calling的那些突變。所有檢測到的突變都被歸類為真陽性(由突變calling檢測到,或未被突變calling者calling但在原始數據中有足夠的支持證據)、假陽性、假陰性或不確定(其中突變在沒有足夠的 WES 覆蓋來驗證呼叫)。總體而言,我們的方法取得了良好的性能,精度為 0.64(僅考慮外顯子突變時為 0.70),靈敏度為 0.53。我們還能夠在 CD8+ T 細胞中對該方法進行基準測試,結果表明 84% 的被calling突變僅限于單個 TCR 克隆。這證實了預期的發現,即在 CD8+ T 細胞中calling的大多數突變僅限于克隆型,因為在胸腺成熟前 T 細胞克隆之間可以共享的突變數量非常有限。
- 注:Benchmarking results for scRNA-seq derived calls against WES data for each patient donor
使用這些突變calling,我們研究了不同細胞類型表達的突變數量,這可能有助于揭示它們的克隆擴增程度。我們計算了具有一個、兩個、三個或三個以上突變的細胞的比例。我們需要來自每個細胞譜系和患者的至少 100 個細胞來解釋稀有細胞群中缺乏辨別力的問題。正如預期的那樣,表達所謂突變的細胞數量最多的譜系是腫瘤細胞,這主要由譜系的已知克隆結構來解釋,但也由于與正常細胞類型相比突變負擔增加的可能性。出于類似的原因,基質細胞通常不會有可辨別數量的細胞具有不止一種被稱為突變的細胞。然而,我們觀察到大量表達突變的骨髓細胞,表明這些細胞中有相當大的比例是無性系相關的。隨后是成纖維細胞和 CD8+ T 細胞(我們知道這些細胞是根據 TCR 測序結果進行克隆擴增的)。極少比例的 CD4+ T 細胞表達突變,與基于 TCR 分析的低克隆度一致。
- 注:Somatic mutation analysis and the relationship with TCR heterogeneity. (A) Density plots showing the VAF distribution of mutations called from WES data from LCM biopsies of tumour samples. (B) Comparison of WES derived phylogenies (left) with geographic location (centre) and CD8+ TCR clonotype expansion (right) for each patient with matching data. Colours reference somatic clones to spatial localisation. Each column in the right panel represents a TCR clonotype, those with significant regional enrichment are highlighted in red. a, c, d, and e represents four different regions of the tumour core; g, tumour-normal interface; f, perinephric fat; n, normal kidney; b, peripheral blood; h, normal adrenal gland; i, adrenal metastasis; t, thrombus. (C) Bar chart showing benchmarking results of the number of called mutations in CD8+ T cells derived from scRNA-seq data that are restricted to individual TCR clonotypes. (D) Comparison of the proportion of cells with one, two, three, and more than three mutations across the major cell types.
Regional characterisation and evolution of myeloid populations
Overall, we captured transcriptomes from 50,603 myeloid cells in our dataset, which were categorised into 19 clusters in sub-clustering analysis
我們首先根據典型標志物的表達和細胞的組織起源對這些cluster進行了廣泛的注釋
cluster 1、2、3 和 4 主要存在于血液中,CD14 高表達但缺乏 FCGR3A 表達,因此代表循環經典單核細胞。 cluster 5 代表循環非經典單核細胞,具有 FCGR3A 高表達但缺乏 CD14 表達。 我們確定了三個樹突狀細胞 (DC) cluster:pDC、1 型和 2 型常規 DC(cDC1 和 cDC2),分別以 JCHAIN、CLEC9A 和 CD1C 的特異性表達為特征。 與其他區域相比,cDC1 在三個 DC cluster中顯示出在腫瘤核心中的富集。 我們發現以 TPSAB1 特異表達為特征的肥大細胞可能在腫瘤核心中富集,這與之前的報道一致。 值得注意的是,我們根據 CD163 和 C1QC 的高表達確定了 9 個巨噬細胞cluster(cluster 6-8、11-16),反映了 RCC 中巨噬細胞群的顯著異質性。
- 注:Sub-clustering analysis of myeloid cell compartment. (A) UMAP depicting interpatient variation, (B) tissue distribution, and (C) patient contribution to the different regions sampled. (D) UMAPs showing marker gene expression in myeloid cells. (E) Scatter plot of M1 versus M2 polarisation for all of the macrophages showing individual cells (grey), and mean values for each subtype (coloured). (F) Heatmap plotting the similarity of myeloid clusters derived in our study (G) Violin plots showing expression levels of SPP1 and GPNMB across all myeloid cell subtypes.
為了進一步表征我們數據集中的異質巨噬細胞群,我們探索了 DEG 和九個巨噬細胞cluster的組織富集。 我們發現與其他正常組織相比,六個巨噬細胞cluster(cluster 11-16)優先富集在腫瘤核心/界面中,因此被定義為腫瘤相關巨噬細胞(TAM)。 其余三個cluster(cluster 6、7、8)在正常組織中富集,被認為是組織駐留巨噬細胞 (TR Mac)。 在六個 TAM cluster中,MHC-II TAM(cluster 14)高表達 HLA-DRB5、APOE 和 APOC1,與腫瘤-正常界面相比,腫瘤核心更富集。 相比之下,其他五個 TAM cluster在腫瘤核心和界面中顯示出相當程度的富集。 促炎性 TAM(clster 11)高表達趨化因子 CXCL9/10 和 NLRP3 炎癥小體組裝激活劑 GBP1/5,表現出 M1 極化的主要特征。
FN1+ TAM(cluster 15)高表達纖連蛋白 1 (FN1) 和清道夫受體 MARCO,此前曾報道其為腎癌中的特定巨噬細胞亞群。我們發現 FN1+ TAM 可能在 ccRCC 中促腫瘤,這反映在髓源性抑制細胞 (MDSC) 特征和 M2 極化基因的高表達上。我們在我們的數據集中發現了一個 SPP1+ TAM cluster(cluster 16),該cluster已在各種癌癥類型中有所報道,但在腎癌中不存在。有趣的是,我們發現 ccRCC 中的 SPP1+ TAM 表達 GPNMB,并顯示出與先前研究確定的 GPNMB+ TAM 高度相似。考慮到我們還確定了一個 GPNMB+ TAM cluster(cluster 15)并且可以在多個 TAM cluster中檢測到 GPNMB 的表達,這一發現表明 SPP1+ TAM 可能代表 GPNMB+ TAM 的一個subset。除了表達 SPP1,我們發現 SPP1+ TAM 還表達 TREM2 并具有高血管生成評分。 TREM2+ 巨噬細胞與各種生物和病理過程有關,例如肥胖和癌癥。
在三個 TR Mac cluster中,TR Mac.2 高表達白細胞介素 IL1B 和表皮生長因子受體配體 AREG,這可能反映了其在體內平衡組織修復中的可能作用。 TR Mac.3,顯示SEPP1和MRC1的高表達,并且在正常腎上腺中極其富集。 有趣的是,TR Mac.3 表現出極高的 M2 表達和吞噬特征,并顯示出與促腫瘤 TAM cluster(即 FN1+ TAM)相似的通路激活。 在該數據集中,我們無法清楚地區分胚胎接種的組織巨噬細胞與單核細胞衍生的組織巨噬細胞。
- 注:Heatmap showing the results of pathway enrichments of macrophage subsets using GSVA analysis
接下來,我們探索了在我們的研究中確定的不同 TR Mac 和 TAM 集群的潛在起源。 使用 RNA 速度分析,我們發現從循環單核細胞到組織中的巨噬細胞有兩個明顯的定向流動:(1)經典 mono.3 到 TR Mac.2 和(2)非經典單核細胞到 TR Mac.1。 TR Mac.1 和 TR Mac.2 然后可能在組織中產生其他巨噬細胞
- 注:UMAP with superimposed RNA velocity analysis of the monocyte and macrophage subsets with zoomed windows highlighting possible directional flows from monocytes to macrophages.
為了確定巨噬細胞亞群與循環單核細胞的關系,我們利用體細胞突變進行譜系追蹤,其方式類似于通過共享 TCR 克隆型確定 T 細胞表型狀態的關系。 在這里,我們構建了一個鄰接樹來描述不同單核細胞和巨噬細胞cluster的關系,利用從 scRNA-seq 數據calling的體細胞突變
- 注:Neighbour-joining tree depicting the relationship of different monocyte and macrophage clusters, utilising the somatic mutations called from scRNA-seq data. The numbers of supporting votes in bootstrapping (100 times) are labelled.
我們發現循環單核細胞與組織中的巨噬細胞分離,與其他經典單核細胞相比,非經典單核細胞(cluster 5)與組織中的巨噬細胞顯示出更密切的關系。 我們的數據支持代表循環單核細胞和巨噬細胞之間中間狀態的非經典單核細胞,大多數巨噬細胞似乎來自單核細胞祖細胞而不是卵黃囊起源。
Regional heterogeneity of endothelial cells, fibroblasts and epithelial cells
我們在數據集中觀察到異質基質細胞群。 內皮細胞 (EC) 區室的亞cluster顯示 11 個具有不同 DEG 和組織位置偏好的cluster。
Pericytes(cluster 11),以 RGS5 和 TAGLN 的表達為特征,優先富集在腫瘤核心中。發現一個小cluster(cluster 9)在腎周脂肪中極度富集,并高度表達 TFF3 和 PDPN,因此代表淋巴 EC。其余 9 個cluster代表血管 ECs,其中cluster 10 代表循環 EC,高表達 TOP2A 和 MKI67。我們確定了三個潛在的腫瘤相關 EC cluster:膠原蛋白 EC、IGFBP3+ EC 和 ACKR1+ EC,因為它們在腫瘤組織中顯示出相當多的富集。在這三個cluster中,發現膠原蛋白 EC(表達 COL4A1 和 COL15A1)在界面中更加豐富,這可能通過細胞外基質 (ECM) 產生與其他細胞相互作用。 ACKR1+ EC 特異性表達非典型趨化因子受體 ACKR1,其支持免疫細胞的粘附和組織遷移。我們發現 IGFBP3+ EC 也表達高水平的免疫抑制酶 IDO1,暗示其在 TME 中的免疫調節作用。我們發現 CRHBP+ EC 和 IGF2+ EC 優先富集在正常腎組織中,而 DNASEL3+ EC 顯示在正常腎上腺中富集
我們在sub-clustering分析中確定了九個成纖維細胞(Fibro)cluster。 與 EC 類似,我們發現了一組成纖維細胞(cluster 8)高表達的膠原相關基因(COL1A1 和 COL6A2)并優先富集在interface。
這表明不同的產生 ECM 的基質細胞傾向于在界面中富集和共定位,發揮不同的功能,包括細胞外環境重塑和細胞間相互作用。 MMP 纖維的特點是基質金屬蛋白酶 MMP2、補體因子 CFD 和 lumican LUM 的高表達。 發現 MMP 纖維富含腎周脂肪和腎上腺。 Cluster 7 高度表達 MYH11、SNCG 和 RERGL,因此被認為是平滑肌細胞 (SMC),如成纖維細胞。 發現 SMC 樣纖維在正常腎組織中富集
數據集中的正常上皮細胞群表現出預期的多樣性,并在sub-clustering分析中分為 13 個聚類。 我們鑒定了兩個近端腎小管 (PT) 細胞cluster(均表達 NAT8 和 PDZK1IP1):cluster 1 具有更高的金屬硫蛋白 MT1H 和 MT1G 表達,因此可能代表 PT3 細胞,而cluster 2 可能代表 PT1/2 細胞,因為它表現出更高的 PT2 標記 SLC22A6,和 PT1 標記 SLC5A12 和 SLC5A2。
兩個 Henle 環(LoH)cluster:cluster 3 代表升細肢(ATL)細胞,表達 CLDN3 和 TACSTD2; cluster 8 代表厚升肢 (TAL) 細胞,其特征在于 SLC12A1 和 UMOD 的表達。 確定了三個集合管 (CD) 上皮細胞cluster:A 型插入細胞(表達 SLC4A1)、B 型插入細胞(表達 SLC4A9)和 CD 主細胞(表達 AQP2 和 FXYD4)。 我們鑒定了特異性表達 SLC12A3 的遠曲小管 (DCT) 細胞(7 cluster)、高表達 SLC8A1 和 CALB1 的連接小管細胞(10 cluster)、顯示 PSCA 和 KRT17 特異性表達的盆腔尿路上皮細胞(13 cluster)和足細胞(11 cluster) ) 專門表達 PTGDS 和 PTPRO。
RCC expression meta-programmes show differential abundance at the tumour-normal interface and affects prognosis
為了探索腫瘤細胞群中的腫瘤內表達異質性,我們首先使用非負矩陣分解(NMF)定義了由每個腫瘤中的共表達基因組成的腫瘤內表達程序。這些表達程序代表了每個腫瘤中僅由腫瘤細胞亞群高度表達的基因模塊,如代表性腫瘤 PD45816 中的 NMF 結果所示。總的來說,我們從 10 個 ccRCC 腫瘤中剖析了 45 個腫瘤內表達程序。其中一些程序雖然是個體腫瘤中的亞群事件,但被發現由不同的腫瘤共享,因此被定義為 ccRCC 中腫瘤細胞表達的meta程序。通過聚類分析確定了六個meta程序。第一個meta程序 (MP1) 的特征是 FOS 和 JUN 等基因的表達,因此代表了腫瘤細胞中與應激反應相關的特征。 MP2 由近端腎小管 (PT) 細胞特異性表達的基因 (即 NAT8 和 ACSM2B) 組成。腫瘤細胞中 PT 特征的存在證實了先前的發現,即 PT 細胞是 ccRCC 的細胞類型。有趣的是,我們發現第三個meta程序 (MP3) 富含 TGFBI 和 MT2A 等與上皮間質轉化 (EMT) 相關的基因。這表明 MP3 可以概括 ccRCC 中的 EMT 過程,這在之前的 RCC scRNA-seq 研究中尚未報道。 MP4 由 NEAT1 和 HCG18 等非編碼 RNA 基因組成,可能反映了一些壓力或細胞死亡 (CD) 相關的細胞狀態。 MP5 的特點是表達 MHC-II 相關基因,如 CD74 和 HLA-DRA。 MP6中發現TOP2A、MKI67等基因,說明該meta程序與腫瘤細胞增殖有關。
接下來,我們整合了來自十個腫瘤的腫瘤細胞,通過去除批次效應來減輕患者間的異質性。通過sub-clustering和 DEG 分析,我們驗證了腫瘤細胞中六個meta程序的存在。我們計算了使用 NMF 破譯的六個meta程序的基因評分,并將它們映射到腫瘤細胞的 UMAP 上。這再次反映了在腫瘤細胞中亞群的meta程序的表達。有趣的是,我們發現 PT 和 EMT 程序的表達顯示出反轉模式,這通過在 TCGA 樣本的大量 RNA-seq 數據中計算的 PT 和 EMT 分數之間的反相關性得到進一步證實。此外,我們發現與腫瘤核心相比,EMThigh 腫瘤細胞在腫瘤-正常界面(腫瘤的前沿)更豐富,這反映了 EMT 狀態代表腫瘤細胞更具侵襲性和遷移性的事實。 PT/EMT 程序的異質表達與腫瘤細胞的空間位置偏好相結合,以個體腫瘤為例。例如,在腫瘤 PD45815 中,我們發現當通過 EMT 評分對腫瘤細胞進行排序時,PT 程序是反向表達的。同時,EMThigh腫瘤細胞傾向于定位在界面,而PThigh細胞相對更富集在腫瘤核心的R1和R2區域。最后,通過對 TCGA 樣本的大量 RNAseq 數據進行評分,我們發現根據 TCGA 研究顯示出最差預后的 TCGA 分子亞型 m3,與其他亞型相比,顯示出顯著更高的 EMT 評分但較低的 PT 評分。這一發現表明我們的meta程序可以成為患者生存的潛在指標.
-
注:RCC cell expression programmes, regional enrichment and prognosis. (A) Heatmap showing expression programmes derived in a representative patient using NMF. (B) Heatmap depicting shared expression meta-programmes across all patients. (C) UMAP representing clusters of tumour cell population. (D) Relative expression scores of meta-programmes in each RCC cell cluster (left) and the distributions of cells with different meta-programmes in tumour core and tumour-normal interface. (E) Cells from patient donors PD45815 and PD45816, ranked by decreasing EMT score with corresponding PT score and cell location. (F) Box plots showing the EMT and PT scores of TCGA samples in different molecular subtypes. ***, P < 0.001 (Wilcoxon rank sum test)
image.png
Cellular interactions associated with spatial location reveal biological insights and promising therapeutic targets
為了表征 RCC 微環境中不同空間位置的細胞間通訊,我們使用 CellPhoneDB 評估了正常腎臟、腫瘤-正常界面和腫瘤核心中主要細胞類型之間的細胞間相互作用。有趣的是,界面和腫瘤核心中 12 種主要細胞類型之間發生的細胞間相互作用的數量相對可比,即使我們排除了那些涉及腫瘤細胞的相互作用,也比正常腎組織中的數量高出約兩倍.接下來,我們比較了在正常腎臟、腫瘤-正常界面和腫瘤核心的不同細胞類型上表達的特定配體-受體對介導的細胞-細胞相互作用。首先,該分析揭示了腫瘤與正常微環境之間相互作用的顯著差異。例如,在 CD8+ T 細胞和 ECs 之間,我們發現 EC 募集(CCL5-ACKR1)和免疫抑制(LGALS9-HAVCR2)信號在界面和腫瘤核心中更加活躍,反映了腫瘤中血管生成和免疫抑制水平的升高。到正常組織。其次,我們始終觀察到腫瘤邊緣和核心之間的差異。例如,由 PVR-TIGIT 介導的潛在免疫抑制相互作用分別在腫瘤核心中更活躍,而細胞生長/遷移相關相互作用 IGF-IGF2R 在界面中更活躍。第三,界面處的腫瘤細胞表達轉錄物,預測其介導獨特的細胞間相互作用,可能促進腫瘤發生。例如,在界面中,與腫瘤核心中的相比,髓系細胞表達增強的細胞遷移相關信號,可以與腫瘤細胞相互作用(THBS1-整合素α3β1)。
- 注: (A) Comparison of the number of cell–cell interactions between cells present in the adjacent normal kidney, tumour-normal interface, and the tumour core. (B) Dot plots representing mean expression levels and significance of important differentially expressed ligand receptor pairs by spatial region.
我們的結果表明,具有高表達 EMT 特征的腫瘤細胞(EMThigh 腫瘤細胞)優先定位于腫瘤的前緣。這促使我們探索界面處是否存在任何可能促進腫瘤細胞 EMT 的活躍細胞間相互作用。我們使用 NicheNet 分析將來自 TME 中細胞的配體與腫瘤細胞中的 EMT 程序聯系起來。從該分析中,我們發現巨噬細胞表達的配體可能調節在腫瘤細胞上表達的大量 EMT 基因。特別是,巨噬細胞來源的 IL1B 對這些 EMT 基因顯示出高度和廣泛的調節潛力,可能是通過腫瘤細胞中表達的受體 IL1R1。有趣的是,我們發現 IL1B 由 TR Mac.2 特異性表達,其再次在腫瘤正常界面優先富集。總之,我們的研究結果表明,表達 IL1B 的巨噬細胞 (TR Mac.2) 優先存在于腫瘤-正常界面,通過產生 IL1B 上調腫瘤前沿腫瘤細胞中的 EMT 程序。這種致癌途徑可能最終促進腫瘤細胞的遷移和侵襲
- 注: (C) Heatmap depicting the potential regulation of genes expressed by the EMT meta-programme and ligands expressed by macrophages. (D) Schematic illustrating the importance of IL1B signalling between IL1B+ macrophages and RCC cells in promoting EMT.
DISCUSSION
我們使用基于多區域的基因組和單細胞轉錄組測序來表征 ccRCC 的表型異質性和多細胞生態系統。 總體而言,我們的研究描繪了 ccRCC 的 TME 的綜合圖譜以及 ccRCC 中已建立的 ITH,包括腫瘤細胞和免疫/基質細胞的表型分類,以及它們在 TME 中的細胞間通訊,主要與其地理定位相關。
擴增的 CD8+ TCR 克隆型內的細胞在很大程度上受到耗竭評分的限制。最近在黑色素瘤中報道了類似的觀察結果。克隆型的表型限制可能主要與給定克隆的時間成熟有關,而不是環境因素,因為個體腫瘤在完全不同的狀態下都具有克隆型。除了表型限制之外,我們還發現擴增的 TCR 克隆型在一個或多個宏觀腫瘤活檢中也經常受到空間限制。由于我們的研究中觀察到的體細胞突變的 ITH 有限,因此無法通過暴露于不同的突變相關新抗原來完全解釋 TCR 克隆擴增的這種空間限制。我們無法在 TME 中定義任何其他可以預測這種克隆型空間異質性的因素。感知到的 T 細胞克隆型的隨機定位可能是物理和環境因素驅動細胞從外周循環到腫瘤駐留的初始遷移的結果。可以采用縱向取樣策略或方法來確定準確的 T 細胞系統發育,以詢問 T 細胞擴增和遷移的精確時間。我們對擴增 TCR 克隆區域限制的觀察是否在其他癌癥類型中更廣泛地被發現,可能需要部署類似采樣和測序策略的額外研究。
外周 TCR 用于非侵入性癌癥檢測和監測的效用顯示出前景,尤其是在循環腫瘤 DNA 片段稀缺的 RCC 中。 雖然我們發現在血液和腫瘤區域都存在許多擴增克隆型,但我們觀察到衰竭程度與外周血中檢測到 TCR 克隆的概率呈負相關,以至于在血液中很少檢測到衰竭克隆型。 研究結果表明,一旦 T 細胞克隆浸潤到腫瘤中并經歷從激活到功能障礙的表型轉變,它們就很少再循環,這可能是由于 CD69 所證明的組織駐留表型。 因此,對腫瘤反應性 TCR 的外周采樣更有可能檢測到耗盡的腫瘤駐留克隆的前因,而不是那些目前在腫瘤中活躍的克隆.
作者開發了一種策略 (deSCeRNAMut),可以根據基于液滴的 scRNA-seq 數據準確檢測不同細胞群中的體細胞突變。使用許多過濾指標(包括不同細胞類型譜系之間共享胚胎后突變的不可信性)消除了缺乏一致覆蓋、低讀取深度和容易出錯的測序讀取的主要挑戰。我們檢測到我們數據集中不同細胞譜系的體細胞突變,并確定了骨髓細胞中的高度克隆擴增。我們使用從這種方法calling的體細胞突變來構建巨噬細胞和單核細胞中的相鄰連接樹,以推斷非經典單核細胞可能是腎癌中循環單核細胞和大多數組織駐留巨噬細胞之間的中間狀態。我們設想在未來,使用空間成像技術來可視化一系列細胞類型中表達基因的突變將有助于破譯多細胞 TME 的系統發育組織。
EMT meta程序是通過每個患者的腫瘤細胞亞群的表達來定義的,并且在我們的研究中由多個 ccRCC 腫瘤共享。 更豐富的腫瘤細胞群和幫助規避具有挑戰性的批次變化的方法的使用使我們能夠發現這個以前未報告的特征。 EMT 程序在 ccRCC 腫瘤細胞中的表達與 PT 程序(一種上皮表達特征)的表達呈負相關。 同時,ccRCC中的EMThigh腫瘤細胞傾向于定位于腫瘤-正常界面,這是腫瘤的前沿和遷移邊緣。 這些發現與頭頸癌的 scRNA-seq 研究中報道的結果相似,反映了 EMT 的定義特征:細胞中上皮特征的喪失,有利于促進其遷移和侵襲能力。
分析細胞間相互作用揭示了與 ccRCC 的 TME 中不同空間定位相關的預測細胞間通訊的異質性。特別是,通過使用 NicheNet 連接配體和目標基因,我們發現 IL1B,由在腫瘤-正常界面 (TR Mac.2) 富集的組織駐留巨噬細胞亞群特異性表達,可能促進腫瘤細胞進行 EMT。據報道,IL1B 的表達與 RCC 的腫瘤分期呈正相關,并且與招募到癌癥基因組圖譜的患者中 RCC 患者的較差預后相關。此外,在 RCC 中抑制 IL1B 已顯示在 RCC 的同源小鼠模型中誘導腫瘤消退。 IL1B 阻斷劑也被證明可以減少動脈粥樣硬化患者肺癌的發生率,目前正在幾項臨床試驗中研究其使用。在我們的數據中,我們表明導致 IL1B 在 RCC 中不利作用的潛在機制通過巨噬細胞衍生的 IL1B 信號傳導促進 EMT 起作用。利用這一途徑可能在治療上是有用的。
Method
scRNA-seq merge and QC
Cell type sub-clustering and annotation
Pseudotime inference, TCR analysis
De Novo Mutation Calling from scRNA-seq Data 重點
Inferring copy number variations based on scRNA-seq data
Cell subtype abundance in different tissues
Correlation between spatial, somatic RCC evolution and TCR clonotype evolution
Gene set enrichment analysis and gene signature scoring in macrophage population
RNA velocity analysis
Lineage tracing using scRNA-seq called somatic mutations
Deciphering intra-tumour expression programmes and meta-programmes
Integrating and analyzing tumour cells from different patients
細胞通訊分析
生活很好,有你更好