近日,《Nature Communications》發表了一篇關于空間轉錄組腫瘤微環境研究的創新性的算法(形態增強型空間轉錄組分析集成器(METI)),非常值得學習。
目錄
[TOC]
文章信息:
- 雜志,Nature Communications,IF 14.7
- 標題:METI: deep profiling of tumor ecosystems by integrating cell morphology and spatial transcriptomics
摘要
最新的空間轉錄組學(ST)技術在腫瘤微環境(TME)內的細胞相互作用方面提供了寶貴的見解。然而,大多數分析工具沒有考慮組織學特征,依賴于匹配的單細胞RNA測序數據,這限制了它們在TME研究中的有效性。為了解決這個問題,文章介紹了形態增強型空間轉錄組分析集成器(METI),這是一個端到端的框架,用于映射癌細胞和TME組分,分層細胞類型和狀態,并分析細胞共定位。通過整合空間轉錄組學、細胞形態學和經過篩選的基因簽名,METI增強了我們對組織內分子景觀和細胞相互作用的理解。文章在各種腫瘤組織生成的ST數據上評估了METI的性能,包括胃、肺和膀胱癌,以及癌前組織,還對METI與現有的聚類和細胞反卷積工具進行了定量比較,展示了METI的穩健性和一致性。
創新點
METI的創新之處在于其能夠通過以知識驅動的方式將組織形態學與轉錄組表達譜堅固地整合,以補償某一模態中的低質量數據。
問題導讀
- 組織形態學數據指什么?文章是如何利用的?
- 如果有高質量的基因表達數據,METI還有必要用嗎?
算法概述
METI以系統化、逐步的方式分析腫瘤微環境(TME),專注于細胞從正常到癌前再到惡性的演變過程,同時檢查每個組織切片中的淋巴細胞。METI輸入標準的空間轉錄組(ST)數據,包括spot-基因矩陣、相應組織切片的H&E圖像,以及將每個spot的位置映射到圖像上的X、Y坐標。METI的目標是在TME中精確識別各種細胞類型及其各自的狀態。
METI的兩個主要功能:
- 使用TESLA進行分辨率增強,基于細胞類型Meta基因的表達進行細胞類型富集區域鑒定。
- 基于圖像進行細胞核分割,根據細胞類型的形態學特點進行細胞類型富集區域鑒定。
METI的工作流程分為五個模塊:
- 正常和癌前細胞映射:利用特定的基因標記和形態學特征來識別和注釋正常及癌前細胞,例如胃中的杯狀細胞。
- 癌細胞域和異質性識別:通過癌癥細胞標記來識別腫瘤區域,并進一步表征癌細胞狀態的異質性,例如增殖性癌細胞和干細胞樣癌細胞。
- T細胞映射和表型分析:識別T細胞富集區域及其不同狀態,如CD4+ T細胞、CD8+ T細胞、調節性T細胞(Treg)和耗竭T細胞(Tex)。
- 其他免疫細胞的深入分析:檢測腫瘤微環境中除了T細胞之外的其他免疫細胞類型,包括中性粒細胞、巨噬細胞、B細胞和漿細胞。
- 癌癥相關成纖維細胞(CAFs)分析:分析腫瘤微環境中的基質細胞成分,包括CAFs及其亞型,如肌成纖維細胞(myCAFs)、炎癥成纖維細胞(iCAFs)和抗原呈遞成纖維細胞(apCAFs)。
主要結果
以文章結果第一章節為例說明整個算法的工作流程,文章其余部分結果相似。
章節標題:繪制正常細胞和癌前細胞
該部分主要內容為對胃腺癌(STAD)樣本中goblet cell富集區域的鑒定。那為什么聚焦goblet cell細胞呢?首先在疾病背景下,腸道中杯狀細胞的異常存在是被稱為腸上皮化生的一種癌前狀況的關鍵特征,對應了標題中提到的癌前細胞。其次,goblet cell在H&E染色圖像中表現出獨特的形態特征,形狀像酒杯,頂部有淡色、幾乎白色的囊泡,底部有橢圓形的細胞核。
關于goblet cell富集區域的鑒定分為兩部分,第一部分基于基因表達,第二部分基于形態學特征。首先基于已發表達文獻,整理goblet cell元基因signature(MS4A10, MGAM, CYP4F2, XPNPEP2, SLC5A9, SLC13A2, SLC28A1, MEP1A,ABCG2, ACE2)。使用TESLA進行分辨率增強,生成接近單細胞分辨率的表達矩陣,基于元基因的表達,利用METI進行區域注釋。但是因為在切片中region4的UMI分布較低,導致本來存在goblet cell富集的區域沒有被鑒定出來。
這時候,第二部分登場,METI基于H&E圖像進行細胞核分割,利用K-means聚類首先識別不同的形態學成分,如背景、細胞核、纖維、腺體和壞死。然后通過顏色、形狀、大小等過濾(元素的面積>40、固體度>0.5和長寬比<3的過濾器),METI識別到了region4區域的goblet cell。
通過整合基因表達和圖像分析的結果,METI成功地識別了所有四個富含杯狀細胞的區域,如圖2g所示。這種綜合方法用于杯狀細胞的檢測,克服了UMI計數低所帶來的限制,為分析樣本中的杯狀細胞提供了更為準確的特征描述。
其它章節:
文章依據基因的表達對癌細胞區域進行注釋,如EPCAM。此外,在生物組織內空間量化細胞的分布和密度對于多種應用至關重要,特別是在病理學和腫瘤學領域。文章通過核分割方法生成了癌細胞3D密度圖。
文章其余部分提到的對細胞狀態和異質性的分析,就只能依據marker基因表達進行了。比如對CD4 Treg和CD8 Tex亞型分布的鑒定,以及增生性癌細胞、干細胞樣癌細胞的鑒定。
文章最后對METI算法針對低質量圖片的魯棒性進行了說明。相機聚焦失誤導致的模糊不清掩蓋了細胞邊界,應用METI進行B細胞的注釋。B細胞和其它淋巴細胞一樣,可以通過它們在H&E圖像中的小而深紫色的細胞核來區分。因此,使用METI的第一步是在H&E圖像上識別淋巴細胞。圖像的模糊導致了大量假陽性的淋巴細胞檢測,這些細胞特別分散在組織邊緣周圍。METI的后續步驟是使用特定的基因標記,包括MS4A1和CD19,來識別B細胞。METI通過將B細胞數據與圖像分析中識別的淋巴細胞區域疊加來進一步完善檢測,證明了METI的魯棒性。
應用前景
METI的框架內集成了一組預定義的細胞類型marker和模型參數,而且為更高級的用戶提供靈活性。研究人員可以通過輸入自己感興趣的marker來定制METI,以適應正在研究的特定組織或疾病。
文章中提到的細胞類型,如杯狀細胞、淋巴細胞、中性粒細胞、成纖維細胞可能屬于在形態學上容易區分的類型,但是文章也沒有給出針對每種細胞類型的形狀、顏色、大小、面積等過濾器參數,可見這一部分的內容針對不同的樣本存在非常大的調整空間,也昭示著實際分析過程中的不斷調參調整的過程。
研究團隊也指出了METI對轉錄組數據的依賴,這些數據可能容易受到技術波動、受限的樣本質量、丟失事件以及對用戶提供的基因簽名的依賴,可能導致產生假陰性結果。此外,METI分割功能的性能可能會因所分析圖像的質量和分辨率而異。
一句話評價
高端玩家的精細化之作。