前沿Perspective | 空間轉(zhuǎn)錄組數(shù)據(jù)分析方法最新進(jìn)展

空間轉(zhuǎn)錄組學(xué)是一個(gè)迅速發(fā)展的領(lǐng)域,有望以單細(xì)胞或亞細(xì)胞分辨率全面表征組織結(jié)構(gòu)。計(jì)算方法的發(fā)展對(duì)從原始數(shù)據(jù)中提取生物信號(hào)起著重要作用;下游分析工具將空間組織和細(xì)胞間通信描述為可量化屬性,并提供算法來(lái)推導(dǎo)此類屬性;集成管道進(jìn)一步將多個(gè)工具組合在一個(gè)包中,使生物學(xué)家能夠方便地從頭到尾分析數(shù)據(jù)。

近日,來(lái)自美國(guó)的研究人員在《Genome Research》發(fā)表Perspective,總結(jié)了空間轉(zhuǎn)錄組數(shù)據(jù)分析方法和管道的最新進(jìn)展,并討論了它們?nèi)绾卧诓煌募夹g(shù)平臺(tái)上運(yùn)作。

注:不同于綜述文章,Perspective中的描述和觀點(diǎn)會(huì)相對(duì)主觀,如有不同意見(jiàn)建議與作者交流Corresponding authors: rdries@bu.edu, guo-cheng.yuan@mssm.edu。

無(wú)論目前空間轉(zhuǎn)錄組技術(shù)的差異如何,空間轉(zhuǎn)錄組分析的共同目標(biāo)是連接和整合來(lái)自基因表達(dá)和細(xì)胞或轉(zhuǎn)錄位置的信息。這對(duì)于提取有用的生物信息、與細(xì)胞形態(tài)聯(lián)系以及產(chǎn)生新的假設(shè)至關(guān)重要。

對(duì)原始空間轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行預(yù)處理?


空間轉(zhuǎn)錄組學(xué)分析方法概述?


從空間轉(zhuǎn)錄組數(shù)據(jù)中識(shí)別細(xì)胞類型

細(xì)胞類型識(shí)別和定位可能是空間轉(zhuǎn)錄組數(shù)據(jù)分析的最基本任務(wù)。

利用空間轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行細(xì)胞類型鑒定的策略


如果數(shù)據(jù)具有單細(xì)胞分辨率,例如在multiplexed FISH方法中,無(wú)監(jiān)督聚類與手動(dòng)或自動(dòng)注釋相結(jié)合是以無(wú)偏方式識(shí)別細(xì)胞類型的常用方法。由于細(xì)胞類型識(shí)別不需要空間信息,因此該任務(wù)與scRNA-seq分析非常相似,已經(jīng)為其開(kāi)發(fā)了許多方法,例如Louvain、Leiden clustering是細(xì)胞類型識(shí)別的常用選擇,其中聚類結(jié)果被用作初始指導(dǎo),隨后通常是繁瑣的手工注釋或自動(dòng)分析流程。

當(dāng)數(shù)據(jù)不足以以無(wú)偏的方式發(fā)現(xiàn)未知細(xì)胞類型時(shí),研究人員通常會(huì)利用額外的scRNA-seq分析對(duì)基因特征已知的細(xì)胞類型進(jìn)行注釋。雖然最簡(jiǎn)單的方法是確定基因特征具有最高相關(guān)性的細(xì)胞類型,但缺點(diǎn)是它不能將細(xì)胞類型標(biāo)記基因與轉(zhuǎn)錄組背景區(qū)分開(kāi)來(lái)。為了優(yōu)化精度,已經(jīng)開(kāi)發(fā)了許多計(jì)算方法,例如一種方法是基于scRNA-seq數(shù)據(jù)建立一個(gè)支持向量機(jī)分類器,但只使用來(lái)自seqFISH中也被分析的基因子集的信息。也可以使用似然比檢驗(yàn)。重要的是,需要跨平臺(tái)歸一化來(lái)校準(zhǔn)從不同技術(shù)檢測(cè)到的信號(hào)。更普遍的是,可以估計(jì)和減少平臺(tái)特有的技術(shù)變化。此外,已經(jīng)開(kāi)發(fā)了貝葉斯模型,以考慮細(xì)胞分割不確定性對(duì)細(xì)胞類型注釋的影響。

商用的基于陣列的空間轉(zhuǎn)錄組技術(shù)(如10x Genomics Visium和NanoString GeoMx)通常沒(méi)有單細(xì)胞分辨率。由于基因表達(dá)譜的變化可能與細(xì)胞類型組成的變化相關(guān),而不是與新的細(xì)胞類型相關(guān),因此不適合將聚類算法直接應(yīng)用于此類數(shù)據(jù)并將產(chǎn)生的聚類解釋為細(xì)胞類型。此外,只有在已知潛在基因表達(dá)特征的情況下,才有可能估計(jì)細(xì)胞類型組成。有兩種估計(jì)細(xì)胞類型組成的一般方法:第一種方法是評(píng)估細(xì)胞類型特異性標(biāo)志物在每個(gè)點(diǎn)的表達(dá)基因中的富集程度;第二種方法去卷積,旨在定量地估計(jì)每個(gè)位置不同細(xì)胞類型的比例。許多去卷積方法已經(jīng)被開(kāi)發(fā)出來(lái),并為RNA-seq數(shù)據(jù)分析提供了基準(zhǔn)。原則上,這些工具也可用于空間轉(zhuǎn)錄組分析,但考慮到空間轉(zhuǎn)錄組數(shù)據(jù)具有某些獨(dú)特的性質(zhì)。因此,使用為空間轉(zhuǎn)錄組分析量身定制的方法通常更準(zhǔn)確,例如RCTD、stereoscope、Cell2location、SpatialDWLS、SPOTlight等。

研究細(xì)胞類型定位的一種補(bǔ)充方法是使用scRNA-seq數(shù)據(jù)作為起點(diǎn),然后基于與空間表達(dá)譜的相似性重構(gòu)空間信息。隨著空間轉(zhuǎn)錄組技術(shù)在過(guò)去幾年中的快速發(fā)展,現(xiàn)在可以直接測(cè)量空間信息,并進(jìn)一步與scRNA-seq數(shù)據(jù)集成以進(jìn)行進(jìn)一步完善。因此,較新的方法以更平衡的方式集成scRNA-seq和空間轉(zhuǎn)錄組數(shù)據(jù),例如一個(gè)平臺(tái)無(wú)關(guān)的相互最近鄰算法(MNN)已被用于對(duì)齊這些數(shù)據(jù)類型,從而形成細(xì)胞位置映射;DEEPsc使用人工神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)空間位置;GLUER結(jié)合NMF、MNN算法和深度神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)齊數(shù)據(jù),Tangram對(duì)齊scRNA-seq和空間轉(zhuǎn)錄組數(shù)據(jù)集,同時(shí)優(yōu)化scRNA-seq數(shù)據(jù)和空間數(shù)據(jù)中每個(gè)基因的空間相關(guān)性(類似的方法還有NovaSparc和D-CE),Tangram對(duì)齊的確定性模式也可以作為一種去卷積方法。


表征轉(zhuǎn)錄組譜的空間模式

空間模式分析


空間轉(zhuǎn)錄組分析的關(guān)鍵貢獻(xiàn)不僅在于描述細(xì)胞類型,還在于描述它們的空間組織方式。這對(duì)于研究組織結(jié)構(gòu)和細(xì)胞-細(xì)胞相互作用的影響至關(guān)重要。可以使用成對(duì)富集分析(pair-wise enrichment analysis)來(lái)識(shí)別可能相鄰的細(xì)胞類型對(duì)。細(xì)胞領(lǐng)域模式分析可識(shí)別多細(xì)胞類型鄰域的重復(fù)模式。另一種識(shí)別富集模式的方法是使用topic models。此外,細(xì)胞狀態(tài)的連續(xù)性可以被納入隱馬爾科夫隨機(jī)場(chǎng)(HMRF)模型,以識(shí)別連貫的空間域。BayesSpace使用來(lái)自空間鄰域的信息來(lái)增強(qiáng)空間轉(zhuǎn)錄組數(shù)據(jù)的分辨率并進(jìn)行聚類分析。而SPICEMIX將HMRF與NMF相結(jié)合。staNMF將NMF與穩(wěn)定性準(zhǔn)則研究相結(jié)合,識(shí)別空間模式。

許多工具根據(jù)預(yù)先定義的過(guò)程對(duì)基因表達(dá)的空間模式進(jìn)行建模,例如spatialDE、SOMDE、Trendsceek、SPARK、binSpect等。其中,作為一個(gè)具體的例子,binSpect被用來(lái)識(shí)別MERFISH冠狀腦切片數(shù)據(jù)中具有空間一致性模式的基因,排名靠前的基因顯示上圖F。


亞細(xì)胞結(jié)構(gòu)分析

亞細(xì)胞分辨率的空間轉(zhuǎn)錄組學(xué)分析示意圖??


隨著新技術(shù)的進(jìn)步,現(xiàn)在可以實(shí)現(xiàn)亞細(xì)胞轉(zhuǎn)錄物的研究。除了基于FISH的方法(眾所周知這些方法具有單分子分辨率),ISS方法也提供非常高的分辨率。此外,高密度陣列或基于珠子的技術(shù)還實(shí)現(xiàn)了亞細(xì)胞分辨率。

已經(jīng)開(kāi)發(fā)了許多方法來(lái)使用亞細(xì)胞基因表達(dá)模式來(lái)規(guī)避細(xì)胞分割,例如SSAM、stLearn、Spage2vec等。基于已知細(xì)胞類型特異性特征的監(jiān)督細(xì)胞類型映射策略已經(jīng)開(kāi)發(fā)出來(lái),例如使用樸素貝葉斯模型為HDST數(shù)據(jù)分配細(xì)胞類型。亞細(xì)胞基因表達(dá)模式反過(guò)來(lái)可以用來(lái)改善細(xì)胞分割,例如Baysor、Sparcle、JTSA等。

對(duì)基因表達(dá)的亞細(xì)胞模式的分析也可以提供新的生物學(xué)見(jiàn)解。例如已經(jīng)開(kāi)發(fā)了一種原位RNA速度方法,以使用亞細(xì)胞RNA定位信息來(lái)推斷轉(zhuǎn)錄率。

此外,通過(guò)使用過(guò)氧化物酶APEX2(一種稱為APEX-seq的方法)對(duì)RNA進(jìn)行直接鄰近標(biāo)記,可以高分辨率地識(shí)別細(xì)胞質(zhì)中的共定位mRNA物種。此外,在核位置富集的mRNAs傾向于編碼在核斑點(diǎn)和核質(zhì)中富集的蛋白質(zhì)。或者,也可以通過(guò)ATLAS-seq檢測(cè)亞細(xì)胞RNA共定位。


了解細(xì)胞如何與組織環(huán)境溝通?

從配體-受體相互作用推斷的細(xì)胞通訊??


空間轉(zhuǎn)錄組分析的一個(gè)重要目標(biāo)是研究細(xì)胞如何與組織環(huán)境通信。Giotto引入了一種雙向比較方法,通過(guò)比較同一細(xì)胞類型內(nèi)但被不同相鄰細(xì)胞包圍的細(xì)胞亞群之間的基因表達(dá)模式來(lái)識(shí)別相互作用改變的基因。值得注意的是,與單獨(dú)使用基因表達(dá)信息相比,使用空間信息可以顯著減少假陽(yáng)性配體-受體活性預(yù)測(cè)的數(shù)量。CellPhoneDB v3.0中使用了類似的方法。為了克服空間轉(zhuǎn)錄組數(shù)據(jù)沒(méi)有單細(xì)胞分辨率這一挑戰(zhàn),研究人員應(yīng)用Cell2location來(lái)推斷不同細(xì)胞類型的位置,然后比較與不同細(xì)胞鄰域相關(guān)的基因表達(dá)模式。其他方法也被用來(lái)量化相鄰細(xì)胞類型的影響,包括convolutional neural networks、optimal transport和multioutput regression。另一種方法是將基因表達(dá)譜明確分解為空間和非空間成分,然后利用鄰域的細(xì)胞類型組成來(lái)估計(jì)空間成分。配體-受體相互作用的分析也被擴(kuò)展到包括多單位蛋白復(fù)合物中輔助因子的影響,以提高預(yù)測(cè)的準(zhǔn)確性。值得注意的是,還開(kāi)發(fā)了從細(xì)胞-細(xì)胞相互作用模式重建空間位置的算法。


用于空間數(shù)據(jù)分析和可視化的綜合探索性工具?

交互式探索性分析管道的概述??


生物學(xué)家將受益于集成和交互式管道,允許他們執(zhí)行各種分析步驟,從原始數(shù)據(jù)導(dǎo)入到圖像分析,然后生成最終分析結(jié)果和可視化圖像,這些操作最好是在個(gè)人計(jì)算機(jī)上完成。目前,有許多綜合工具包可用,例如Giotto、Seurat、Squidpy等。

這些軟件包或工具箱大多是由獨(dú)立的實(shí)驗(yàn)室開(kāi)發(fā)的,這就導(dǎo)致了多個(gè)不同的數(shù)據(jù)結(jié)構(gòu)不一定共享相同的數(shù)據(jù)格式。為了克服其中的一些挑戰(zhàn),R/Bioconductor社區(qū)正致力于精心設(shè)計(jì)普遍適用的數(shù)據(jù)結(jié)構(gòu),并在最近發(fā)布了spatialExperiment類的第一個(gè)版本。這是一個(gè)新的S4類,擴(kuò)展了流行的singleCellExperiment類,旨在與幾種類型的空間轉(zhuǎn)錄組數(shù)據(jù)集一起操作,包括多細(xì)胞和亞細(xì)胞分辨率。已經(jīng)有幾個(gè)空間R包使用這種數(shù)據(jù)結(jié)構(gòu),如SpatialLIBDSpaniel,它們都擅長(zhǎng)于創(chuàng)建交互式R/Shiny應(yīng)用程序來(lái)可視化空間轉(zhuǎn)錄組數(shù)據(jù)集。


近年來(lái)空間組學(xué)領(lǐng)域取得了很多進(jìn)展。新的方法已經(jīng)被開(kāi)發(fā)出來(lái)以應(yīng)對(duì)各種特定的空間轉(zhuǎn)錄組挑戰(zhàn)。綜合性的軟件包使生物學(xué)家能夠輕松地從頭到尾分析他們自己的數(shù)據(jù),并通過(guò)交互式可視化對(duì)數(shù)據(jù)進(jìn)行互動(dòng)探索。這些工具在使空間轉(zhuǎn)錄組技術(shù)廣泛適用方面發(fā)揮了重要作用。

近年來(lái),出現(xiàn)了一種范式的轉(zhuǎn)變,即根據(jù)轉(zhuǎn)錄組圖譜對(duì)細(xì)胞類型進(jìn)行分類,有時(shí)還輔以其他分子模式。由于ST技術(shù)的快速發(fā)展,現(xiàn)在可以對(duì)同一細(xì)胞同時(shí)進(jìn)行轉(zhuǎn)錄組分析和形態(tài)學(xué)分析,從而為系統(tǒng)研究這兩種根本不同的方法之間的關(guān)系提供了很好的機(jī)會(huì)。

一個(gè)令人興奮的新方向是空間多元組學(xué)。新技術(shù)的發(fā)展使得在保存蛋白質(zhì)和RNA、內(nèi)含子和成熟mRNA、DNA和RNA等信息的同時(shí),可以分析同一細(xì)胞中的多種形態(tài)信息。這些技術(shù)使分析不同分子模式之間的相關(guān)性成為可能,并提供了機(jī)理上的見(jiàn)解。分析這些數(shù)據(jù)需要開(kāi)發(fā)新的計(jì)算方法和工具包。

【來(lái)自小編的插播】歡迎訂閱或收藏???時(shí)空組/空間組學(xué)專題(點(diǎn)擊可直接訪問(wèn)),及時(shí)查收最新研究進(jìn)展。


首發(fā)公號(hào):國(guó)家基因庫(kù)大數(shù)據(jù)平臺(tái)

參考文獻(xiàn)

Dries R, Chen J, Del Rossi N, et al. Advances in spatial transcriptomic data analysis[J]. Genome Research, 2021, 31(10): 1706-1718.

圖片均來(lái)源于參考文獻(xiàn),如有侵權(quán)請(qǐng)聯(lián)系刪除。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,786評(píng)論 6 534
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,656評(píng)論 3 419
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 176,697評(píng)論 0 379
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 63,098評(píng)論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,855評(píng)論 6 410
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 55,254評(píng)論 1 324
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,322評(píng)論 3 442
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 42,473評(píng)論 0 289
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,014評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,833評(píng)論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,016評(píng)論 1 371
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,568評(píng)論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,273評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 34,680評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 35,946評(píng)論 1 288
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,730評(píng)論 3 393
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,006評(píng)論 2 374

推薦閱讀更多精彩內(nèi)容