hello,新的一周,周一是開始,不知道大家感覺2022年初怎么樣呢???是不是覺得很不錯???不過我工作了幾年領悟了一個道理,那就是干什么事情都要低調,別張揚,做好自己的事情,就是對自己最大的負責。好了,我們要繼續單細胞空間的聯合分析了,文章在Recurrence of cancer cell states across diverse tumors and their interactions with the microenvironment,目前空間轉錄組的文章大部分還是老外在發,國內寥寥無幾,可能對空間轉錄組的認識及運用不足,希望我們的分享,能讓大家更加深刻認識到空間轉錄組的作用。
先來總結一下重點內容
- 免疫療法在多種癌癥中的臨床成功暗示了癌細胞與腫瘤微環境 (TME) 之間相互作用的共性,腫瘤前沿的部分上皮間質轉化 (pEMT) 癌細胞群與癌癥相關的成纖維細胞相互作用并介導侵襲。
- NMF識別腫瘤細胞狀態(NMF是是單細胞空間分析的一個重點,大家可以參考文章10X單細胞空間數據分析之表征細胞狀態和生態型(EcoTyper)、10X單細胞空間數據分析之表征細胞狀態和生態型(EcoTyper示例代碼))
- 癌細胞狀態可能反映了常見的物理限制以及與其微環境中細胞成分的相互作用,免疫療法在一系列癌癥類型中的成功表明癌細胞和免疫細胞之間存在保守的相互作用,這導致我們質疑與免疫系統的相互作用是否塑造了一系列發生的癌細胞狀態。尤其是干擾素反應模塊可能涉及癌細胞和 TME 之間的相互作用。
- 空間轉錄組數據解卷積,分析空間細胞分布(單細胞空間聯合還是非常重要的)
- 根據癌細胞狀態來查詢細胞鄰域的組成。使用鄰域和鄰近度量將這種分析擴展到所有細胞類型和模塊對,確定了細胞狀態與 TME 細胞類型的其他一致的共定位(空間共定位分析也非常重要)。
ABSTRACT
雖然遺傳腫瘤異質性早已得到認可,但最近的工作揭示了癌細胞在表觀遺傳和轉錄水平上的顯著差異。在單個癌癥類型中對單細胞水平的腫瘤進行分析表明,轉錄異質性被組織成癌細胞狀態,這意味著不同的細胞狀態可能代表在腫瘤維持和進展中具有互補作用的穩定和功能單元。然而,尚不清楚這些狀態在多大程度上跨越了腫瘤類型,構成了癌癥的一般特征。此外,癌細胞狀態在腫瘤進展中的作用及其與腫瘤微環境細胞的特異性相互作用仍有待闡明。在這里,對 15 種癌癥類型進行泛癌單細胞 RNA-Seq 分析,并確定了 16 個基因模塊的catalog,其表達定義了復發性癌細胞狀態,包括“壓力”、“干擾素反應”、“上皮-間質轉化” ','metal response’, ','basal'和'纖毛'。使用小鼠模型,發現干擾素反應模塊的誘導因腫瘤位置而異,并且在消除淋巴細胞后減弱。此外,空間轉錄組分析進一步將癌細胞中的干擾素反應與腫瘤微環境中的 T 細胞和巨噬細胞聯系起來。分析工作為研究癌細胞狀態如何與腫瘤微環境相互作用以形成能夠免疫逃避、耐藥性和轉移的有組織的系統提供了一個框架。
Introduction
癌癥中的轉錄異質性越來越被認為是腫瘤進展、轉移和治療失敗的驅動因素。單細胞 RNA 測序 (scRNA-Seq) 能夠對單個腫瘤細胞進行無偏見的轉錄組分析,并揭示同一腫瘤的惡性細胞之間存在 striking 異質性。此外,有證據表明轉錄異質性被組織成共表達基因的模塊。來自膠質母細胞瘤、少突膠質細胞瘤、星形細胞瘤、頭頸癌和黑色素瘤等的數據表明,在腫瘤內,癌細胞的分化程度是異質的,從干細胞或祖細胞樣到完全分化。這些在多種癌癥類型中進行的研究也表明存在與應激反應、干擾素反應和缺氧相關的癌細胞狀態。雖然在多項研究中發現了某些狀態,但仍有待建立跨癌癥類型的細胞狀態的一般 catalog。這樣一個連貫的框架——如果存在的話——將能夠尋找不同癌癥類型的共同主題,并了解腫瘤是如何獨立于其起源而組織的。
除了惡性細胞外,腫瘤還由復雜的微環境組成,包括免疫細胞和基質細胞,它們在腫瘤發生中也起著關鍵作用。 特別是,免疫療法在多種癌癥中的臨床成功暗示了癌細胞與腫瘤微環境 (TME) 之間相互作用的共性。 TME 的特定 elements 與癌細胞狀態之間存在因果關系。 在一項頭頸癌研究中,腫瘤前沿的部分上皮間質轉化 (pEMT) 癌細胞群與癌癥相關的成纖維細胞相互作用并介導侵襲。 在膠質母細胞瘤和三陰性乳腺癌中,TME 因子似乎誘導惡性細胞呈干細胞樣狀態。 這些工作表明需要對癌細胞狀態進行系統分析,特別關注與 TME 的非惡性細胞類型的關系。
在這里,通過系統分析 15 種癌癥類型來描述復發性癌細胞狀態及其與 TME 的關系,以使用以基因為中心的方法識別復發性癌細胞狀態catalog。通過分析來自先前發表的數據以及新收集的腫瘤的 scRNA-Seq 數據,確定了 16 個連貫基因模塊并量化了它們在每個樣本的惡性細胞中的表達。該catalog包括所有研究腫瘤中存在的模塊,以及特定于特定癌癥類型的其他模塊。為了進一步研究癌細胞狀態,使用實驗模型來擾亂腫瘤微環境并測試對癌細胞狀態的不同影響。雖然一些狀態與癌癥生物學的已知方面有關,但提供證據表明這些過程是異質的由同一腫瘤的細胞部署,并且這種異質性在廣泛的癌癥類型中重現。對干擾素反應模塊的詳細分析進一步引導我們研究其在 TME 擾動背景下的體內依賴性,并確定其在癌癥類型中與巨噬細胞和 T 細胞的接近性。總體而言,癌細胞狀態catalog是腫瘤組成的coherent representation,并為分析和測試腫瘤發生的特征提供了框架。
Result
Recurring gene modules across diverse cancer types
在手術后立即收集了 19 個新鮮的原發性未治療患者腫瘤,涵蓋 9 種癌癥類型。分離每個腫瘤以獲得單細胞懸浮液,并在沒有事先分選的情況下處理 scRNA-Seq,以確保對腫瘤細胞組成進行公正的評估。腫瘤收集包括 9 種癌癥類型:卵巢癌 (OVCA)、子宮內膜癌 (UCEC)、乳腺癌 (BRCA)、前列腺癌 (PRAD)、腎癌 (KIRC)、肝癌 (LIHC)、結腸癌 (COAD) 和胰腺癌 (PDAC) ,以及一種非上皮癌類型,胃腸道間質瘤 (GIST)。首先通過使用標記基因、singleR 注釋和推斷的拷貝數變異的組合分析轉錄組,并控制雙細胞的可能性來識別數據集中的惡性細胞。在樣本中,注釋了 9,036 個惡性細胞和 18,546 個非惡性細胞。為了擴展數據集,還對先前報道中的腫瘤進行了這種分析,包括額外的 PDAC 和 LIHC,以及其他腫瘤類型:膽管癌 (CHCA)、肺腺癌 (LUAD)、頭頸部鱗狀細胞癌 (HNSC)、皮膚鱗狀細胞癌 (SKSC)、多形性膠質母細胞瘤 (GBM) 和少突膠質細胞瘤 (OGD),最終得到來自 15 種癌癥類型的 62 個未經治療的原發性腫瘤的總共 19,942 個惡性細胞。
定義細胞狀態的方法包括首先對底層基因模塊進行分類,最近的工作已將基因模塊確定為細胞狀態的定義特征。這是一種靈活的方法,因為它允許細胞表達模塊的組合,因此允許細胞狀態的復雜性。使用非負矩陣分解 (NMF) 分析惡性細胞(NMF是是單細胞空間分析的一個重點,大家可以參考文章10X單細胞空間數據分析之表征細胞狀態和生態型(EcoTyper)、10X單細胞空間數據分析之表征細胞狀態和生態型(EcoTyper示例代碼)),以將基因模塊識別為共表達基因的集合。方法檢測樣本中共同表達的基因,即在細胞子集中連貫表達的基因。為了在腫瘤中尋找重復出現的基因模塊,隨后比較了已識別模塊的基因組成。因此,通過在基因模塊而不是表達矩陣的水平上進行整合,樣品和研究中技術變化的影響是有限的。盡管這些模塊在各種癌癥類型中的獨立鑒定——因此不假定復發——發現在不同腫瘤中獲得的模塊顯著重疊。重要的是,this finding of recurrence rather than uniqueness would not be the result of batch effects。
基因模塊的重現能夠構建一個包含 16 個共有模塊(以下稱為“模塊”)的catalog,每個模塊的中位數為 37 個基因。為了確定一個模塊是否顯著存在于每個腫瘤的癌細胞群中,使用了基因集過度分散度量。一些模塊富集特定的器官系統(如大腦或婦科器官),而其他模塊則跨越多個器官系統和組織學。還在代表輸卵管、乳房和肝臟的正常上皮細胞的獨立數據集中測試了模塊的過度分散,以query模塊是否反映了正常組織中發現的異質性的重構。對于大多數模塊,發現正常上皮樣本中的過度分散較低,這表明它們在正常組織中沒有差異表達。然而,在正常組織中確實在一定程度上檢測到模塊catalog這一事實表明,這些模塊并不是癌癥特有的,而是從現有的模塊中選擇出來的,并且表達得更加不均勻。還研究了模塊的基因組成和癌癥類型特異性,將與細胞過程相關的模塊與與細胞身份相關的模塊區分開來。
正如預期的那樣,恢復了一個由細胞周期基因(例如 TOP2A、PCNA)組成的高度復發模塊,在采樣時捕獲任何循環腫瘤中的癌細胞亞群。 另一個在腫瘤類型中反復出現的過程是應激反應(例如,JUN、FOS、HSPA1B),先前已經描述并顯示其在黑色素瘤的耐藥性中起作用。 分析還在下面提供了空間轉錄組學數據,這些數據為在沒有解離的情況下癌細胞中這種狀態的體內存在提供了額外的支持。
一種已在轉移性卵巢癌中發現的干擾素反應模塊被檢測為廣泛存在,表明惡性細胞中的干擾素反應在一系列實體瘤類型中是異質的。除了干擾素刺激的基因(如 STAT1 和 IFIT1)外,該模塊還包含抗原呈遞的成分,這是干擾素的一種充分表征的作用,包括 HLA-A 等 MHC I 基因和包括 HLA-DRA 在內的 MHC II 基因。雖然 MHC II 表達通常與專業抗原呈遞細胞相關,但該途徑也已顯示在正常上皮細胞和癌細胞中表達。干擾素反應通常用作招募和激活免疫細胞的防御反應,并已在癌癥中進行了廣泛研究。在這種情況下,干擾素配體可能由癌細胞和樹突狀細胞 (DC)(對于 I 型干擾素,IFNα 和 IFNβ)或由自然殺傷 (NK) 和 T 細胞(對于 IFNγ)分泌。或者,干擾素反應可能是癌細胞固有的,即獨立于其他細胞類型的信號激活;事實上,最近一項比較體外癌細胞系基因模塊的研究也發現了干擾素反應模塊,支持了不依賴于 TME 的反應的可能性。
在一系列癌癥類型中還發現了與代謝過程相關的兩個模塊:缺氧模塊(例如 VEGF、ADM)和氧化磷酸化模塊(例如 ATP5H、LAMTOR2)。 實體瘤中對缺氧的代謝適應,隨著糖酵解增加和血管生成的誘導,與癌癥進展、耐藥性、侵襲和轉移有關。盡管如此,最近的研究表明氧化磷酸化在幾種癌癥類型中的作用,這表明癌細胞可能 依靠糖酵解和氧化磷酸化來產生能量。 金屬硫蛋白基因的另一個基因模塊——我們在此稱為金屬反應模塊——可能在幾種癌癥類型的增殖和耐藥性中起作用。
另一組模塊對應于細胞身份,似乎與起源的組織和細胞有關。所分析的大多數腫瘤是上皮起源的,因此我們確定了與已知上皮細胞類型標志物重疊的模塊:如預期在 LUAD 中特別存在的肺泡模塊(例如,AGER、CAV1),以及基底(例如, KRT5 和 KRT15)、鱗狀細胞模塊 (例如 KLK10、LY6D) 和腺細胞模塊 (例如 CLU、MUC5B)。由纖毛相關基因(例如 FOXJ1、PIFO)組成的模塊存在于婦科腫瘤以及 LUAD 和 GBM 中。在卵巢和子宮內膜腫瘤中,該模塊僅存在于子宮內膜樣樣本(OVCA NYU2-3、UCEC NYU2-3)中,而不存在于高級漿液樣本(OVCA NYU1、UCEC NYU1)中,表明纖毛形成是一種特征子宮內膜樣組織學。該模塊在正常輸卵管和肺上皮組織中的存在表明其在癌癥中的差異表達反映了起源組織的異質性。在腫瘤內觀察到的分化模塊的異質表達可以從臨床病理學角度提供對腫瘤結構的更詳細的理解,其中評估每個腫瘤的分級和組織學亞型。
跨越多種癌癥類型的兩個模塊與上皮間質轉化 (EMT) 相關:一個完整的間充質模塊 (cEMT)(例如,COL1A1、FN1)和一個缺乏規范的部分間充質模塊 (pEMT)(例如,LAMC2、VIM)。 間充質標志物,如膠原基因。 pEMT 模塊最近在 HNSC10 和 SKSC31 中得到了表征,但也在 GBM7 中發現,這表明來自不同譜系的細胞在癌癥中會聚到這種特性上。 我們在少數樣本中檢測到 cEMT 模塊的存在,但在一系列癌癥類型中:主要是 PDAC、CHCA、LUAD 和 GBM。 最近的一項研究表明,pEMT 和 cEMT 可以發生在一系列癌癥類型中,并且可能代表兩種途徑,它們融合了間充質分化賦予的表型特性,包括遷移和耐藥性。 使用 TCGA 數據,我們確實發現 pEMT 基因模塊的表達與無進展生存期降低有關。
最后,確定了三個神經系統癌癥特異性模塊:星形膠質細胞 (AC) 樣(例如 APOE、ALDOC)、少突膠質祖細胞 (OPC) 樣(例如 OLIG1、OLIG2)和神經祖細胞(NPC)- 像(例如,DLX1、DLX5)模塊。
這些模塊在一系列癌癥類型中的廣泛應用突出了分化程序的重新部署以及癌癥和正常組織中不同的表達水平。 此外,雖然已鑒定的許多基因與癌癥生物學的各個方面有關,但單細胞方法使我們能夠證明它們在腫瘤的惡性細胞中異質表達,并且通常在惡性上皮細胞與正常上皮細胞中以更高的水平表達。
為了測試是否也可以使用獨立方法檢測 16 個模塊的catalog,使用了 SCENIC,這是一種識別表達相關且受相同轉錄因子調節的基因的方法。 發現catalog的每個模塊與幾個 SCENIC 調節子有顯著重疊。例如,干擾素響應模塊與幾個用轉錄因子 STAT1 和 IRF1 注釋的 SCENIC 調節子重疊。
Defining cancer cell states by gene module expression
在建立了癌癥基因模塊的catalog之后,接下來試圖了解它們通常是如何在單個細胞水平上assembled。 特別是,query細胞是否受限于它們可以表達的模塊或模塊組合。 為此,對每個惡性細胞的每個模塊的表達進行評分。 例如,在 SKSC Ji1 樣本中,基底、鱗狀和循環模塊的表達是相互排斥的,但這些模塊中的每一個都與壓力或 pEMT 模塊共表達。 更一般地說,發現大多數細胞表達模塊的組合,盡管并非所有組合都是可能的。 這些結果支持這樣一種觀點,即在定義癌細胞狀態時,檢查表達的完整基因模塊集至關重要。
由于模塊在癌癥類型中重復出現,推斷細胞模塊評分可以作為比較不同患者癌細胞的自axes。最值得注意的是,該空間中的癌細胞不按患者或癌癥類型分組,而是按其最高表達的模塊分組。這與以下發現形成鮮明對比:在基因表達空間中,癌細胞按患者聚集,并在去除單個基因引起的變異時突出顯示癌癥類型的共性。如 SKSC Ji1 所述,某些模塊之間存在一定程度的共表達:例如 pEMT 與壓力和干擾素反應共表達。Together with the fact that cells do not form distinct clusters,這支持了癌細胞狀態通常不代表離散實體的觀點。然而,確實觀察到了與表達循環或纖毛模塊的細胞相對應的離散clusters。These clusters are also identified when examining tumors individually in gene expression-based dimensionality reductions, and are therefore not artifacts of the module score dimensionality reduction。
由于某些模塊也存在于非癌癥樣本中,這里query表達每個模塊的細胞比例是否在惡性和非惡性上皮細胞之間變化。 為此,將惡性細胞中的模塊表達頻率與匹配樣本的非惡性細胞中的模塊表達頻率進行了比較,雖然對于 LUAD、SKSC 和 THCA,與成對的相鄰正常樣本的上皮細胞進行了比較,但在 PDAC 中,來自相同樣本的非惡性導管細胞用作成對的正常比較。
與正常情況相比,pEMT 模塊在所有三種癌癥類型中的表達頻率更高,這與 EMT 在上皮癌中的常見發生率一致。 相對于正常,干擾素反應模塊在 LUAD 和 SKSC 中表現出增加的表達頻率,但在 PDAC 中沒有變化。 這可以部分解釋為,用作參考的導管細胞是腫瘤本身的一部分,并且暴露于 TME。
正常肺和皮膚有鱗狀細胞成分,始終觀察到腫瘤樣本中鱗狀細胞表達沒有差異。相反,相對于正常導管細胞,在 PDAC 中誘導了鱗狀模塊,表明惡性細胞群中存在鱗狀分化。basal模塊也觀察到了類似的趨勢。基于bulk轉錄組學已經提出了幾種 PDAC 分類,包括經典(腺體基因的高表達,包括 TFF1 和 CEACAM6)和基礎亞型(鱗狀和基礎基因的高表達,包括 LY6D 和 KRT15)之間的區別。雖然鱗狀細胞胰腺癌很少見,但 PDAC 中鱗狀細胞表達頻率的增加表明部分化生向鱗狀細胞程序是常見的。 LUAD 和 PDAC 中腺模塊的表達相對于它們的正常對應物沒有變化,但在 SKSC 中相對于正常皮膚增加。這種模式表明,惡性細胞群保留了與其來源細胞類型相關的模塊的表達(例如,SKSC 中鱗狀模塊的保留)并進一步部署了來自其他細胞類型的基因模塊(SKSC 中腺模塊的表達增加)。
Expression of the interferon response is modulated by the tumor microenvironment(干擾素反應的表達受腫瘤微環境的調節)
癌細胞狀態可能反映了常見的物理限制以及與其微環境中細胞成分的相互作用。值得注意的是,免疫療法在一系列癌癥類型中的成功表明癌細胞和免疫細胞之間存在保守的相互作用,這導致我們質疑與免疫系統的相互作用是否塑造了一系列發生的癌細胞狀態。尤其是干擾素反應模塊可能涉及癌細胞和 TME 之間的相互作用。在腫瘤中,I 型干擾素由癌細胞和 DC 分泌,以響應激活 cGAS/STING 通路的 DNA 片段,并導致 T 細胞啟動和抗腫瘤活性。 IFNγ 主要由活化后的適應性免疫細胞產生,并導致 MHC I 基因的上調,最初促進腫瘤排斥,但最終通過免疫編輯導致 IFN 無反應性腫瘤。根據這些觀察結果,query適應性免疫細胞是否是必要的在體內引發癌細胞中的干擾素反應模塊。為此,使用了已建立的同種異體移植小鼠癌癥模型,其中 TME 很容易受到干擾。對四個原位胰腺腫瘤進行了 scRNA-Seq,以驗證基因模塊可以在原位模型中重現。像之前所做的那樣使用 NMF 識別基因模塊,發現在這個系統中概括了五個:循環、壓力反應、干擾素反應、缺氧和腺體分化。
同時,從四個缺乏 T 細胞和 B 細胞的 Rag1-/- 小鼠體內形成的原位腫瘤中收集了 scRNA-Seq 數據。分析來自這些腫瘤的惡性細胞中的基因模塊表達,發現循環、應激反應、缺氧和腺體分化在 Rag1-/- 和 WT 小鼠之間以相似的頻率表達。相反,干擾素反應模塊在來自 Rag1-/- 小鼠的腫瘤中以較低頻率表達(p < 10-10,Kolmogorov-Smirnov test)。此外,相對于其他癌細胞,干擾素反應模塊的所有基因在表達干擾素反應的細胞中均上調,這表明維持了協調反應——盡管在較少的細胞中。干擾素反應模塊的 MHC I 基因(B2m、H2-D1、H2-K1)在 Rag1-/- 小鼠中的總體表達較低(盡管它們在干擾素反應表達細胞中保持相對上調),表明淋巴細胞耗竭對 MHC I 基因的表達具有額外的影響,而 MHC I 基因與干擾素反應無關。
接下來測試了不同的腫瘤微環境是否也會調節干擾素反應模塊的表達。 在一項實驗中,將胰腺中的原位腫瘤(癌癥的起源部位)與腹膜中的異位腫瘤(常見的轉移部位)進行了比較。 發現腹膜中的腫瘤具有較低頻率的干擾素反應表達細胞(在 Kolmogorov-Smirnov test)。 在第二個實驗中,比較了兩個異位部位(腹膜和肝臟)的頻率,以便模擬體內不同的轉移部位。 在這里,發現干擾素反應模塊在肝臟中的表達頻率高于腹膜(p < 10-10,Kolmogorov-Smirnov test)。
總的來說,這組實驗提供了對癌癥中干擾素反應模塊發生情況的初步評估。 該模塊在多種癌癥類型、器官和免疫環境中的存在表明,干擾素反應在惡性細胞中的異質性是腫瘤的一個共同特征。 發現適應性免疫系統對于該模塊的大多數但不是全部表達是必需的。 淋巴細胞耗盡狀態下的剩余表達表明癌細胞中干擾素反應的其他原因,或者是癌癥外在的,例如 NK 細胞分泌的干擾素,或者是癌癥內在的,這與體外干擾素反應模塊的報道一致。 值得注意的是,這一發現并未區分引發干擾素反應的信號機制和導致選擇腫瘤內狀態的長期免疫編輯。
Spatial organization of malignant and non-malignant cell types in the tumor
為了進一步分析癌細胞狀態和 TME 細胞之間的組織和相互作用,轉向基于測序的空間轉錄組學 (ST)。 與解離后獲得的 scRNA-Seq 不同——導致任何空間信息的丟失——基于陣列的 ST 數據不是以單細胞分辨率捕獲組織內每個位置的 mRNA,而是每個點捕獲約 10 個細胞。 因此,試圖通過整合十個腫瘤(OVCA NYU1、OVCA NYU3、UCEC NYU3、BRCA NYU0、BRCA NYU1、BRCA NYU2、PDAC NYU1、GIST NYU1、GIST NYU2、LIHC NYU1)的配對數據來利用這兩種模式的特性。 十個腫瘤 ST 數據集中的每一個都由 6mm x 6mm 區域上的約 2,000 個spot(范圍從 1,351 到 2,624)組成。 ST 陣列上的光點相隔 100μm,能夠深入了解腫瘤微環境,例如,旁分泌信號在這樣的距離內發揮作用。
由于每個spot是一種或多種細胞類型的細胞組合,因此其轉錄組可以表示為細胞類型轉錄組的加權和。 為了推斷每種細胞類型在每個點的貢獻,使用來自配對單細胞數據的細胞類型的平均表達譜進行了非負線性最小二乘 (NNLS) 回歸。 然后,將每種細胞類型獲得的系數與隨機模型中獲得的系數進行比較,如果一個細胞的系數比隨機集中的平均值高出兩個以上標準偏差,則認為該細胞存在于一個點中。 工作團隊的病理學家(C.H. 和 D.F.D.)進一步驗證了這些注釋。 作為進一步分析的框架,根據它們的細胞類型注釋將斑點分為三類:“惡性”,僅包含惡性細胞,“正常”,僅包含免疫細胞和基質細胞,以及“兩者”,包含組合。
作為一種獨立的斑點分類方法,還直接比較了 10 個配對數據集的spot和單細胞轉錄組。通過調用相互最近鄰 (MNN) 集成和聯合降維,發現來自兩種模態的數據得到了很好的集成。單個細胞在外圍形成clusters,表明不同的細胞類型。 ST 點要么與單個單細胞clusters混合,表示純population,要么橋接多個cluster,表示細胞類型的組合。將 NNLS 方法確定的spot類別疊加到該圖上,始終觀察到“惡性”spot與惡性細胞cluster混合,“正常”spot位于非惡性細胞類型區域,“Both”spot跨越惡性和非惡性單細胞clusters。作為第二個例子,LIHC ST 數據集顯示了兩個空間上不同的腫瘤結節,左側有惡性和非惡性細胞之間的大量混合,右側幾乎只有惡性細胞。聯合降維分析反映了兩個相應的惡性clusters,當單獨考慮單細胞降維時,它們并不明顯。該分析強調了整合成對的空間和單細胞數據集以在其空間環境中錨定單細胞的潛力。
為了進一步測試 NNLS 方法注釋spot的準確性,對兩個源自患者的黑色素瘤異種移植物 (PDX) 進行了配對的 scRNA-Seq 和 ST。 在這種情況下,只有惡性細胞是人類來源的,因此表達人類基因,使我們能夠可靠地識別惡性細胞或spot。 在完整的小鼠和人類轉錄組上使用 NNLS 方法,首先為spot身份建立了“基本事實”。 然后,通過將小鼠基因轉換為人類直系同源基因來模擬患者樣本,從而消除物種信息。 以這種方式使用 NNLS 注釋點導致每個樣本的特異性分別為 99% 和 89%,從而支持其準確性。
每個樣本中“normal”和“both”spot的存在使我們能夠query在惡性細胞存在的情況下組織的細胞類型組成如何變化。在也含有惡性細胞的spot中,內皮細胞的比例始終較低,表明腫瘤的血管化不完全。相反,在“both”spot中發現的中性粒細胞數量較多。腫瘤相關巨噬細胞被廣泛定義為 M1 - 抗腫瘤/促炎 - 和 M2 - 促腫瘤/抗炎。在單細胞數據中,檢測到兩種巨噬細胞群,一種表達促炎基因(例如,TNF、SPP1、ISG15),另一種以抗原呈遞和補體為特征(例如,HLA-DRA、C1QA、CD163) .為了比較 M1 和 M2 巨噬細胞相對于癌細胞的位置,對每個包含巨噬細胞的點進行評分,以了解其表達兩個群體的特征,并計算 M1-M2 分數,這能夠比較整個點的巨噬細胞極性類別。在六個婦科樣本(卵巢癌、子宮內膜癌和乳腺癌)中,我們發現“both”點的 M1-M2 評分明顯高于“normal”點,這表明在癌細胞附近具有強大的抗腫瘤巨噬細胞活性。這與在結直腸癌中進行的一項研究的結果形成對比,該研究在腫瘤中檢測到相對于鄰近正常組織更高的 M2。這些結果表明在幾個 100μms 內存在圍繞惡性細胞的炎癥宿主反應,突出了以高分辨率研究腫瘤結構的價值。除了 M1/M2 二分法,巨噬細胞具有多種表型,包括促血管生成巨噬細胞和間充質像巨噬細胞一樣,正在成為腫瘤-免疫相互作用的關鍵參與者。對 T 細胞亞型(細胞毒性、輔助性和調節性)的類似分析并未顯示跨樣本的一致結果。
Cancer cell state analysis of tumor cellular neighborhoods(空間臨近分析)
在確定了每個腫瘤內的惡性和非惡性細胞類型之后,接下來試圖根據癌細胞狀態來查詢細胞鄰域的組成。為此,繪制了每個 ST 樣本中的癌細胞狀態,對每個“惡性”點的每個模塊的表達進行評分。為了確定這種評分方法的有效性,首先再次轉向 PDX 數據,并對模塊表達的“惡性”點進行評分。由于在該系統中可以明確地區分人類惡性細胞與小鼠 TME 細胞,首先使用單細胞數據來確認這些模塊由惡性細胞本身差異表達,并排除了源自 TME 污染的偽影的可能性。例如,pEMT 模塊包括通常由成纖維細胞表達的基因,但檢測到它存在于惡性細胞中。正如預期的那樣,干擾素反應模塊不存在,因為與 Rag-/- 小鼠一樣,這些小鼠缺乏淋巴細胞。
為了表征每個“惡性”點周圍的細胞類型組成,計算了每種細胞類型的兩個分數指數,旨在捕捉它們的微環境。 將“鄰域分數”定義為包含該細胞類型的周圍斑點的分數。 因此,該分數直接測量相鄰點的細胞類型組成。 鄰近度分數衡量感興趣spot與每種細胞類型的接近程度,并計算為與該類型細胞的最短距離的倒數。
將每個腫瘤的“惡性”點上的模塊分數和細胞類型鄰域圖關聯起來,揭示了 TME 的癌細胞狀態和細胞類型如何共同定位以形成“鄰域”。更密切地研究這種相關性證實了模塊評分和巨噬細胞鄰域評分之間這種正相關的重要性。當使用鄰近分數計算巨噬細胞的存在時,也觀察到一致的關系。為了探索所有樣本的這種關系,計算了巨噬細胞鄰域的相關分數(±log10(p 值))。與干擾素反應的相關性在所有樣本中均為正相關,并且對于 10 個樣本中的 8 個具有顯著性。任何其他模塊都不是這種情況。這表明巨噬細胞可能會引發干擾素反應模塊的表達,或者表達干擾素反應的癌細胞可能會募集巨噬細胞。事實上,最近的一項研究表明,刺激腫瘤中的干擾素反應途徑會導致巨噬細胞的募集和激活。
使用鄰域和鄰近度量將這種分析擴展到所有細胞類型和模塊對,確定了細胞狀態與 TME 細胞類型的其他一致的共定位。 除巨噬細胞外,根據這兩種測量方法,表達干擾素反應的癌細胞與 T 細胞共定位,這與淋巴細胞導致干擾素反應增加的體內發現一致。 需要進一步的工作來確定這些交互的模式和方向性。 接受 EMT 的癌細胞與成纖維細胞和內皮細胞呈正相關,與其他惡性細胞呈負相關,這與它們在腫瘤界面富集并與癌癥相關成纖維細胞相互作用的發現一致。
為了進一步研究巨噬細胞和 T 細胞與表達干擾素反應的惡性細胞的共定位,轉向 CO-Detection by indEXing (CODEX) - 一種多重蛋白質染色測定 - 能夠以單細胞分辨率進行空間分析。對于用于空間轉錄組學的四個樣本(OVCA NYU1、UCEC NYU3、LIHC NYU1、GIST NYU1),我們對 23 個標記進行了染色,包括 HLA-DRA 作為干擾素反應的標記。使用有監督的門控策略,確定了 TME 的惡性細胞和細胞,包括巨噬細胞、T 細胞、內皮細胞和成纖維細胞。 PanCytokeratin (PanCK)/EPCAM 陽性細胞的一個子集也對 HLA-DRA 呈陽性,這在蛋白質水平上提供了 MHCII 在腫瘤的惡性細胞中差異表達的證據。因此,將惡性細胞定義為干擾素反應陽性或陰性,并比較了它們與巨噬細胞和 T 細胞的接近程度。同樣,使用鄰近度和鄰域這兩個指標來研究細胞共定位。例如,對于巨噬細胞,惡性細胞與巨噬細胞的“接近度”定義為 1/(1+距離),取最近巨噬細胞的距離;并且“鄰域”被定義為在 100μm 半徑內注釋為巨噬細胞的細胞分數。對于給定樣本中的每個圖塊,使用干擾素陽性細胞和干擾素陰性細胞的平均測量值來計算對數比。對于巨噬細胞和 T 細胞,四個樣本的鄰近度和鄰域度量的平鋪對數中位數比率均為陽性,表明干擾素反應陽性的惡性細胞相對于干擾素反應優先與這兩種細胞類型共定位-陰性惡性細胞。這表明至少一部分癌細胞狀態與 TME 相互作用,要么由免疫細胞或基質細胞引發,要么改變其周圍環境的細胞類型組成。
Discussion
單細胞方法極大地促進了我們對腫瘤內異質性的理解,一些研究已經證明了癌細胞的狀態。 雖然在個別癌癥類型中發現了這種狀態,但我們在這里提供了第一個對惡性細胞之間轉錄異質性的泛癌分析。 我們對癌癥類型的系統分析使我們提出了支持復發性癌細胞狀態的基因模塊的統一catalog。 基于對個別癌癥類型的研究結果,確定了涵蓋此處研究的 15 種癌癥類型的 16 個模塊 - 包括循環、壓力反應、干擾素反應、缺氧和 pEMT - 以及對特定器官系統中的細胞特性更具體的模塊 - 包括 基底、鱗狀、腺狀和纖毛分化。 我們預計未來的工作將擴大癌細胞狀態及其癌癥類型或器官類型特異性以及泛癌特征的列表。
癌細胞狀態不能明確定義為細胞類型。 結果表明,這可能來自模塊組合的表達:由于這些通常不是相互排斥的,這導致連續變化而不是離散cluster。 相反,當基因模塊與其他基因模塊相互排斥時,可能會觀察到不同的狀態,如循環和纖毛基因模塊的情況。 因此,我們的分析支持這樣一種觀點,即腫瘤轉錄變異的基本單位是基因模塊,其組合產物定義了癌細胞狀態。 需要進一步的工作來解開與基因模塊在確定細胞狀態時的共表達和互斥性方面相關的關系。
在癌細胞中觀察到的許多異質性似乎是由于重新部署了通常在其他細胞和發育環境中表達的模塊。 事實上,我們的癌癥基因模塊目錄包括細胞生理學(循環)、特定過程和反應(應激、缺氧、氧化磷酸化、干擾素和金屬反應)和發育程序(EMT、肺泡、基底、鱗狀、腺體、 纖毛、AC 樣、OPC 樣、NPC 樣)。 相對于它們的正常對應物,癌細胞利用現有的基因模塊,以不同的水平和更異質的方式表達它們。 例如,干擾素反應模塊雖然通常與對病原體的細胞免疫反應相關,但在惡性細胞中被異質激活。
目前尚不清楚癌細胞之間的異質性在多大程度上是由它們接收的信號的異質性引起的,或者是由于細胞之間的內在差異——遺傳的、表觀遺傳的或隨機的。我們對多種癌癥類型的癌癥狀態的觀察提供了證據,表明癌細胞狀態不是由基因定義的,而是代表細胞可塑性。此外,體外和體內研究表明,癌細胞表現出高度的可塑性,可以從一種狀態轉變為另一種狀態。特別是,由單一狀態播種的群體恢復與原始腫瘤相同的狀態比例。因此,雖然各個state的身份具有高度可塑性,但它們的整體分布可能是一個穩定的屬性。有趣的是,在膠質母細胞瘤中,具有不同遺傳驅動因素的腫瘤具有相同的狀態集,但每種狀態的比例不同。根據這種觀點,腫瘤發生的早期階段會產生致癌背景,隨后的表觀遺傳變化將導致惡性人群之間的異質性。
在這里確定的幾個基因模塊可能會啟用 Hanahan 和 Weinberg 提出的標志,從而提高癌癥標志不需要由所有單個細胞組裝的可能性。相反,細胞狀態可能會在腫瘤生態系統內進行相互作用,從而導致整個腫瘤具有更高的適應度。例如,血管生成的誘導或免疫監視的下調可能由一部分癌細胞介導,以造福于其他細胞。為了理解這些復雜的關系,至關重要的是要考慮腫瘤的物理限制,包括相鄰細胞之間的信號傳導、氧氣和營養物質的擴散,以及分離到具有不同成分的壁龕中。觀察到的干擾素反應表達細胞與 T 細胞和巨噬細胞的共定位突出表明,可以通過分析腫瘤結構來理解癌細胞狀態的功能作用。最近的研究還表明,在膠質母細胞瘤中,巨噬細胞在惡性細胞中引發間充質狀態。此外,在頭頸部鱗狀細胞癌中,發現表達 pEMT 的細胞位于腫瘤的前緣,這一發現似乎適用于幾種癌癥類型。
癌癥中干擾素反應的存在已被廣泛研究,并已嘗試利用該反應進行治療。 在這里,發現參與干擾素反應的基因在此處研究的所有 15 種癌癥類型的腫瘤的惡性細胞中被共同調節和異質表達,這表明這種狀態的存在是腫瘤發生的必要特征。 事實上,缺乏 IFNγ 受體的腫瘤無法在小鼠模型中發育。 然而,矛盾的是,在同時含有干擾素反應性和無反應性細胞的腫瘤中,無反應性細胞的頻率增加。 因此,表達干擾素反應模塊的細胞亞群似乎支持腫瘤內其他細胞的生長。 這可以通過這些基因的雙重功能來解釋 - MHCI 和 MHCII 引發細胞的免疫檢測增強,但 PDL1 導致免疫耐受性的普遍增加。
Understanding cancer cell states has critical implications for therapeutic advances, as intratumoral heterogeneity is a recognized cause of treatment failure and relapse. In particular, the study of the relationships between cancer cell states and the TME – with an emphasis on immune cell populations – may shed light on the contribution of heterogeneity to tumor fitness, and highlight vulnerabilities that can be exploited for targeted therapy
Method(有一些分析方法需要額外關注)
細胞注釋
識別惡性細胞
NMF(重點)
Module annotation and receptor-ligand analysis
空間轉錄組解卷積(NNLS)
空間位點注釋
生活很好,有你更好