hello,大家好,今天給大家分享一個很重要的空間轉錄組的分析內容,空間臨近通訊網絡,參考文獻在Learning directed acyclic graphs for ligands and receptors based on spatially resolved transcriptomic analysis of ovarian cancer,非常好的方法,有助于建立通訊的空間結構網絡,我們來看看如何做的。
Abstract
了解腫瘤樣本中免疫激活和抑制機制的關鍵瓶頸步驟是識別腫瘤微環境 (TME) 中腫瘤細胞與免疫/基質細胞之間細胞間通訊的轉錄信號。細胞間通訊廣泛依賴于分泌配體和細胞表面受體之間的相互作用,它們通過許多配體-受體路徑創建高度連接的信號網絡。原位組學分析的最新進展,如空間轉錄組學 (ST) 分析,為直接表征支持細胞間通訊的配體 - 受體信號網絡提供了獨特的機會,這在基于bulk或單細胞組學的基礎上是不可行的數據。在本文中,分析專注于高級別漿液性卵巢癌 (HGSC),并提出了一種新的統計方法 DAGBagST,基于空間轉錄組數據來表征卵巢腫瘤中相鄰腫瘤和基質細胞之間的配體-受體相互作用網絡。 DAGBagST 利用directed acyclic graph (DAG) 模型和一種新穎的方法來處理在 ST 數據中觀察到的零膨脹分布(關于零膨脹分布,大家可以參考我之前的分享零膨脹負二項模型(ZINB,10X單細胞和10X空間轉錄組的基礎知識))。它還利用現有的配體-受體調節數據庫作為先驗信息,并采用引導聚合策略來實現穩健的網絡估計。將 DAGBagST 應用于來自四名 HGSC 患者的腫瘤樣本的 ST 數據集,并確定了相鄰腫瘤和跨多個腫瘤的基質網格之間常見和不同的配體-受體調節。這些結果揭示了與這些卵巢腫瘤中腫瘤和 TME 細胞之間的通訊相關的生物學過程。
Introduction
高級別漿液性卵巢癌 (HGSC) 是最致命的婦科惡性腫瘤,幾十年來其令人生畏的總生存率沒有顯著變化。盡管通過大規模下一代測序分析對 HGSC 基因組landscope的可重復描繪做出了巨大努力,但對于具有化學抗性的 HGSC 患者,仍然缺乏治療上可行的預測生物標志物或治療靶點。充分理解 HGSC 的腫瘤進展機制和化學耐藥性的一個主要挑戰是其高度的腫瘤內異質性,包括腫瘤克隆異質性和組織結構異質性。后者反映在卵巢腫瘤微環境 (TME) 中的異質基質和免疫細胞群。原位組學分析的最新進展表明,TME 中腫瘤/免疫/基質細胞之間的細胞間相互作用與腫瘤進展以及治療耐藥性之間存在重要聯系。然而,在 HGSC 中形成這些細胞-細胞相互作用的分子機制在很大程度上仍未得到探索。
一種主要類型的細胞-細胞信號傳導是通過一個細胞的配體與相鄰細胞的同源受體之間的相互作用來驅動的。 空間轉錄組學 (ST) 分析技術的最新發展為全面表征相鄰細胞(例如 ST 載玻片上相鄰網格的細胞)之間的配體 - 受體相互作用提供了前所未有的機會,這在基于bulk細胞或單細胞的情況下都是不可行的 RNA profiles。 在本文中,旨在基于使用 ST 平臺從四個 HGSC 卵巢樣本收集的空間轉錄組數據來表征 HGSC 中的配體-受體調節網絡。
使用基于網絡的系統學習方法檢測基因或通路中疾病相關調節模式的能力已在許多疾病研究中得到證實,包括癌癥、COPD 等。具體而言,基于組學數據構建的directed acyclic graph (DAG) 最近已被用于推斷重要的基因-基因相互作用。然而,由于存在多重挑戰,現有的 DAG 方法不能直接應用于 ST 數據來構建配體-受體網絡。首先,需要在配體-受體網絡學習中同時結合空間信息和組學特征,而現有的 DAG 方法/軟件并不容易支持這一點。其次,在 ST 實驗中一個組織點的測序輸出中,由于生物學因素(例如該基因未在該網格的細胞群中表達)和技術因素(例如讀取實驗深度有限)。由此產生的表達測量值的零膨脹分布給有效的網絡推理和機械解釋帶來了統計和計算挑戰。第三,一個組織樣本不同點的 UMI 計數水平受技術變化(例如不同的文庫大小)和生物學變化(例如細胞類型組成)的影響。因此,在下游分析之前,需要正確實施標準化。
為了應對這些挑戰,作者開發了 DagBagST,這是一種基于 ST 數據構建配體-受體網絡的新工具。在 DagBagST pipeline中,我們引入了Neighbor Integrated Matrix (NIM) 來整合 ST 數據中的空間信息和分子信息。 DagBagST 然后使用二元變量以及節點空間中每個配體/受體的連續變量,這樣(i)二元指示符代表配體/受體的開/關狀態,即是否有活性/表達或沉默/不表達,while (ii)給定配體/受體表達,連續變量代表配體/受體表達的豐度。這種編碼策略不僅可以模擬 ST 數據中的零膨脹,而且還可以更好地檢測那些主要通過配體/受體的活動/非活動狀態發出信號的相互作用。為了解決在一次 ST 實驗中跨網格spot大小的變化,DagBagST 采用了一種聚合框架,該框架將 DAG 學習的引導(bagging)過程與基于下采樣的歸一化相結合,以更好地控制假邊緣檢測。這種聚合框架還使 DAGBagST 能夠靈活地獲取邊緣方向的先驗信息,例如來自現有配體-受體數據庫的信息。
DagBagST 分析pipeline應用于 4 個 HGSC 樣本的 ST 數據集。 利用來自相關數據庫的已知配體-受體調控信息作為先驗信息來限制構建 DAG 時的搜索空間。 推斷的配體-受體網絡揭示了一個共同的樞紐節點 LRP1:LRP1 在富含腫瘤細胞的網格中的表達水平(顯著)與在富含基質細胞的相鄰網格中 PSAP、A2M、CALR 和 LRPAP1 的表達相關 四個腫瘤中至少有三個。 這些結果表明 LRP1 及其相互作用配體在 HGSC 中可能具有重要的免疫功能。
Method
Background of Directed Acyclic Graph
directed acyclic graph 由節點集 V 和邊集 E 組成,邊集 E 具有從父節點到子節點的有向邊。在 DAG 模型中,節點集對應一組隨機變量,邊集編碼這些隨機變量之間的條件依賴關系。 DAG 結構學習相當于識別圖中每個節點的父集(也稱為鄰域)。盡管不同的 DAG 可以編碼相同的一組條件依賴(形成 DAG 的等效類),但表明,當且僅當兩個 DAG 具有相同的骨架邊和
-結構集時,它們才是等價的。骨架邊是通過從有向邊中移除方向而獲得的,并且
-結構是節點 (x1; x3; x2) 的三元組,使得 x1 → x3 ∈
; x2→ x3 ∈
和 x1, x2 不相鄰。 DAG結構學習的方法主要分為三類,分別是基于分數的方法、基于約束的方法,例如PC算法(PC-alg)和混合方法,例如Max-Min Hill Climbing(MMHC).
DAGBagST
DAGBagST - 用于學習基于空間解析轉錄組數據的配體-受體相互作用網絡。 如前所述,這項任務涉及一些新的挑戰。 首先,需要在 ST 數據中整合空間信息和分子概況,以表征來自相鄰網格(點)的配體和受體之間的相互作用。 其次,由于捕獲或放大失敗,ST數據具有很高的丟失(丟失)率,這給下游網絡分析帶來了統計和計算方面的挑戰。 此外,不同 ST 點的 UMI 計數水平通常差異很大。 因此,需要正確地跨 ST 點執行歸一化以解釋不同的變化來源。
為了應對這些挑戰,DAGBagST 首先創建了 Neighbor Integrated Matrices 來整合 ST 數據中的空間信息和分子信息。 然后它使用一個二元變量和一個連續變量對每個基因進行編碼,這樣二元變量代表基因的活動/非活動狀態,而連續變量代表基因表達/豐度,假設基因是活動/表達的。 DAGBagST 還包含一個聚合框架,可以方便地將基于下采樣的歸一化與基于引導程序的網絡推理過程結合起來。 下圖說明了 DAGBagST pipiline。
Introduce Neighbor Integrated Matrices
在 DAGBagST pipeline中,從整合了空間和分子信息的給定基因表達數據構建了一個
(NIM)。具體來說,對于給定的腫瘤樣本,ST數據中的網格點首先分為兩類:富集或不富集的腫瘤細胞。然后確定位于腫瘤區域邊界上的富含腫瘤細胞的網格點。將這些點稱為索引點,并將它們最近的非富集點稱為相鄰點。最后,我們通過將索引點的原始基因表達矩陣與相鄰點的基因表達矩陣進行疊加,從 ST 數據中導出 NIM。由此產生的 NIM 具有擴展的特征空間,其中來自索引點及其相鄰點的基因的表達水平/活動狀態分別被視為兩個特征。 NIM 背后的基本原理是我們有興趣表征微環境中非腫瘤細胞(相鄰點)中的受體是否/如何受到來自相鄰腫瘤細胞(索引點)的配體的影響,反之亦然
Account for zero inflated distributions
為了解決 ST 點中的高缺失率,DAGBagST 使用兩個nodes,一個用于二元變量,另一個用于連續變量,來表示網絡中的每個基因。 僅當相應的二元變量取值為 1(表示活動)時才評估連續變量的似然性。 這使得二元變量成為相應連續變量的自然父代。 這種建模策略不僅處理數據中的零膨脹,而且在檢測主要通過基因的活動/非活動狀態發出信號的那些相互作用方面獲得了更好的能力。
在分析最近的一項工作中,實現了 DAGBagM,用于在節點空間包含連續變量和二進制變量時進行 DAG 學習。 DAGBagM 采用基于分數的方法,我們對連續節點和二進制節點使用單獨的分布,因此允許二進制節點成為連續節點的父節點或子節點。 在基于分數的方法中,DAG 空間往往隨著節點數量的增加而呈超指數增長,這使得對最優模型的詳盡搜索幾乎不可行。 為了應對這一挑戰,在 DAGBagM 中,實現了 hill climbing search algorithm的非常有效的實現,該算法使用來自先前步驟的信息來促進當前步驟中的分數計算和非循環狀態檢查,從而能夠學習具有大量節點的圖 . 在 DAGBagM 中,基于分數的方法還與引導程序聚合相結合,通過搜索穩定結構來幫助減少誤報。
Downsampling Based Normalization and Boostrap Based Model Aggregation
Result
將 DAGbagST 分別應用于每個 ST 載玻片以構建腫瘤特異性配體 - 受體網絡。首先,基于高分辨率 HE 圖像中的組織和細胞形態,手動注釋具有富集腫瘤細胞或基質細胞的 ST 網格(點)。然后,專注于富含腫瘤細胞(腫瘤和腫瘤/基質)的點(網格),并在 2 個網格細胞內確定它們富含基質細胞的相鄰點(網格),以構建 DAGBagST 中的相鄰整合矩陣。只考慮了配體-受體相互作用數據庫中記錄的基因,并進一步過濾掉了在一個樣本中不到 50% 的點(網格)中檢測到的基因。每個樣本中每個點網格的總 UMI 的中位數用于 DAGBagST 中的下采樣歸一化。下表給出了每個樣本中腫瘤和基質斑點(網格)的詳細編號,以及相鄰腫瘤基質斑點(網格)對的數量。該表還列出了具有足夠 UMI 數據點的配體/受體基因的數量,以在每個樣本中構建網絡。
使用 DAGBagST,構建了四個腫瘤特異性配體-受體網絡,四個 HGSC 樣本中的每一個都有一個。 如方法中所述,DAGBagST 為每個基因引入二元變量以指示配體/受體的開/關狀態,這有助于解釋 ST 數據中的零膨脹。 此外,DAGBagST 可以靈活地考慮邊緣的先驗信息,這使我們能夠將搜索空間限制在配體 - 受體相互作用數據庫中記錄的配體 - 受體相互作用邊緣,以有效降低維度。
樣品 4、5、10 和 12 的配體-受體網絡分別包含 55、54、134 和 102 個配體-受體調節邊緣。 在四個腫瘤樣本中觀察到共同和獨特的相互作用模式。 具體而言,LRP1 似乎是所有四個網絡中的中心節點,對于樣本 4、5、10 和 12,其度數分別為 5、7、4 和 8。 LRP1Tumor(腫瘤斑點網格中的 LRP1 水平)和 PSAPStroma(基質斑點網格中的 PSAP 水平)之間的相互作用是在所有四個腫瘤樣本中檢測到的唯一邊緣。 除了 PSAP,LRP1 腫瘤的多種其他相互作用也在腫瘤之間共享。 例如,在四個腫瘤中的三個腫瘤中,LRP1Tumor 被推斷為與相鄰的基質點網格中的 A2M、CALR 和 LRPAP1 相互作用。 另一方面,也存在腫瘤特異性相互作用,例如樣本 4 中的 LRP1Tumor -C1QBStroma 和樣本 12 中的 LRP1Tumor - APOEStroma。
Discussion
為了深入了解腫瘤微環境中細胞-細胞相互作用的分子基礎,在本文中,引入了一種新的統計方法——DAGBagST,以基于空間轉錄組數據推斷相鄰細胞之間的配體-受體相互作用網絡。 DAGBagST 基于有向無環圖貝葉斯圖形模型的最新發展,采用新穎的處理方法來正確處理 ST 數據的空間結構和高丟失率。 它還利用現有的配體-受體調節數據庫作為先驗信息,并使用引導聚合策略來實現穩健的網絡邊緣估計。
將 DAGBagST 應用于四個高級別漿液性卵巢癌樣本的 ST 數據集,并構建了患者特異性配體-受體網絡。 結果揭示了在不同患者中分別富含腫瘤和基質細胞的相鄰網格點網格之間的共同和不同的配體-受體調節。
LRP1 已被確定為所有四個配體 - 受體網絡中的樞紐節點。 LRP1(低密度脂蛋白受體相關蛋白 1)最初被確定為腫瘤抑制因子,因為它對腫瘤細胞的可塑性和遷移能力發揮了顯著控制,據信它參與控制乳腺癌腫瘤細胞的侵襲潛力。有趣的是,在所有四個樣本中都檢測到 LRP1Tumor 和 PSAPStroma 之間的相互作用。 pSAP (prosaposin) 是四種 saposins A-D 的常見前體,是鞘脂降解和膜消化的重要參與者。 PSAP 在細胞內靶向溶酶體,也可以被 LRP1 分泌和再內吞。人類蛋白質圖譜中 Cell Type Atlas 的單細胞 RNAseq 研究表明,PSAP 在巨噬細胞(包括 Hofbauer,一種胎盤巨噬細胞和 Kupffer,一種肝臟巨噬細胞)和單核細胞中的表達明顯高于其他細胞類型。 Saposins 及其前體 pSAP 已被建議在脂質抗原呈遞中發揮重要作用,這是一種激活脂質特異性 T 細胞的機制。例如,表達 CD1b 的人類 pSAP 缺陷成纖維細胞未能呈遞分枝桿菌酸、GMM 和 LAM,以激活抗原特異性 CD1b 限制性 T 細胞克隆。還假設 pSAP 依賴的凋亡小泡加工有助于 DC 中的抗原傳遞和隨后的 CD8+ T 細胞反應。我們的發現進一步表明 pSAP 以及 LRP1 在 HGSC 中可能具有重要的免疫功能。
推斷與 LRP1 相互作用的另一個有趣的配體是 C1QB。 然而,LRP1Tumor 和 C1QBStroma 之間的相互作用僅在來自化學敏感患者(PFS > 6 個月)的#4 腫瘤中檢測到。 C1QB 是先天免疫的模式識別分子,可由巨噬細胞和樹突細胞局部合成(引用)。 這里檢測到的 LRP1 和 C1QB 之間的聯系表明 LRP1-C1QB 串擾網絡在調節免疫反應中的潛在作用,這可能會導致 HGSC 患者的生存期提高。
In summary, spatial transcriptomic data provide an unprecedented opportunity to pull back the curtain of the molecular mechanism underlying the cell-cell interaction in the tumor microenvironment. The proposed
method is a useful tool to construct the global ligand-receptor interaction networks based on ST data. Results from this type of analyses help to reveal important players driving cell-cell interactions, and potentially can lead to identification of new predictive biomarkers or therapeutic targets
生活很好,有你更好