空間轉(zhuǎn)錄組學(xué)是一個(gè)迅速發(fā)展的領(lǐng)域,有望以單細(xì)胞或亞細(xì)胞分辨率全面表征組織結(jié)構(gòu)。計(jì)算方法的發(fā)展對(duì)從原始數(shù)據(jù)中提取生物信號(hào)起著重要作用;下游分析工具將空間組織和細(xì)胞間通信描述為可量化屬性,并提供算法來(lái)推導(dǎo)此類屬性;集成管道進(jìn)一步將多個(gè)工具組合在一個(gè)包中,使生物學(xué)家能夠方便地從頭到尾分析數(shù)據(jù)。
近日,來(lái)自美國(guó)的研究人員在《Genome Research》發(fā)表Perspective,總結(jié)了空間轉(zhuǎn)錄組數(shù)據(jù)分析方法和管道的最新進(jìn)展,并討論了它們?nèi)绾卧诓煌募夹g(shù)平臺(tái)上運(yùn)作。
注:不同于綜述文章,Perspective中的描述和觀點(diǎn)會(huì)相對(duì)主觀,如有不同意見(jiàn)建議與作者交流Corresponding authors: rdries@bu.edu, guo-cheng.yuan@mssm.edu。
無(wú)論目前空間轉(zhuǎn)錄組技術(shù)的差異如何,空間轉(zhuǎn)錄組分析的共同目標(biāo)是連接和整合來(lái)自基因表達(dá)和細(xì)胞或轉(zhuǎn)錄位置的信息。這對(duì)于提取有用的生物信息、與細(xì)胞形態(tài)聯(lián)系以及產(chǎn)生新的假設(shè)至關(guān)重要。
從空間轉(zhuǎn)錄組數(shù)據(jù)中識(shí)別細(xì)胞類型
細(xì)胞類型識(shí)別和定位可能是空間轉(zhuǎn)錄組數(shù)據(jù)分析的最基本任務(wù)。
如果數(shù)據(jù)具有單細(xì)胞分辨率,例如在multiplexed FISH方法中,無(wú)監(jiān)督聚類與手動(dòng)或自動(dòng)注釋相結(jié)合是以無(wú)偏方式識(shí)別細(xì)胞類型的常用方法。由于細(xì)胞類型識(shí)別不需要空間信息,因此該任務(wù)與scRNA-seq分析非常相似,已經(jīng)為其開(kāi)發(fā)了許多方法,例如Louvain、Leiden clustering是細(xì)胞類型識(shí)別的常用選擇,其中聚類結(jié)果被用作初始指導(dǎo),隨后通常是繁瑣的手工注釋或自動(dòng)分析流程。
當(dāng)數(shù)據(jù)不足以以無(wú)偏的方式發(fā)現(xiàn)未知細(xì)胞類型時(shí),研究人員通常會(huì)利用額外的scRNA-seq分析對(duì)基因特征已知的細(xì)胞類型進(jìn)行注釋。雖然最簡(jiǎn)單的方法是確定基因特征具有最高相關(guān)性的細(xì)胞類型,但缺點(diǎn)是它不能將細(xì)胞類型標(biāo)記基因與轉(zhuǎn)錄組背景區(qū)分開(kāi)來(lái)。為了優(yōu)化精度,已經(jīng)開(kāi)發(fā)了許多計(jì)算方法,例如一種方法是基于scRNA-seq數(shù)據(jù)建立一個(gè)支持向量機(jī)分類器,但只使用來(lái)自seqFISH中也被分析的基因子集的信息。也可以使用似然比檢驗(yàn)。重要的是,需要跨平臺(tái)歸一化來(lái)校準(zhǔn)從不同技術(shù)檢測(cè)到的信號(hào)。更普遍的是,可以估計(jì)和減少平臺(tái)特有的技術(shù)變化。此外,已經(jīng)開(kāi)發(fā)了貝葉斯模型,以考慮細(xì)胞分割不確定性對(duì)細(xì)胞類型注釋的影響。
商用的基于陣列的空間轉(zhuǎn)錄組技術(shù)(如10x Genomics Visium和NanoString GeoMx)通常沒(méi)有單細(xì)胞分辨率。由于基因表達(dá)譜的變化可能與細(xì)胞類型組成的變化相關(guān),而不是與新的細(xì)胞類型相關(guān),因此不適合將聚類算法直接應(yīng)用于此類數(shù)據(jù)并將產(chǎn)生的聚類解釋為細(xì)胞類型。此外,只有在已知潛在基因表達(dá)特征的情況下,才有可能估計(jì)細(xì)胞類型組成。有兩種估計(jì)細(xì)胞類型組成的一般方法:第一種方法是評(píng)估細(xì)胞類型特異性標(biāo)志物在每個(gè)點(diǎn)的表達(dá)基因中的富集程度;第二種方法去卷積,旨在定量地估計(jì)每個(gè)位置不同細(xì)胞類型的比例。許多去卷積方法已經(jīng)被開(kāi)發(fā)出來(lái),并為RNA-seq數(shù)據(jù)分析提供了基準(zhǔn)。原則上,這些工具也可用于空間轉(zhuǎn)錄組分析,但考慮到空間轉(zhuǎn)錄組數(shù)據(jù)具有某些獨(dú)特的性質(zhì)。因此,使用為空間轉(zhuǎn)錄組分析量身定制的方法通常更準(zhǔn)確,例如RCTD、stereoscope、Cell2location、SpatialDWLS、SPOTlight等。
研究細(xì)胞類型定位的一種補(bǔ)充方法是使用scRNA-seq數(shù)據(jù)作為起點(diǎn),然后基于與空間表達(dá)譜的相似性重構(gòu)空間信息。隨著空間轉(zhuǎn)錄組技術(shù)在過(guò)去幾年中的快速發(fā)展,現(xiàn)在可以直接測(cè)量空間信息,并進(jìn)一步與scRNA-seq數(shù)據(jù)集成以進(jìn)行進(jìn)一步完善。因此,較新的方法以更平衡的方式集成scRNA-seq和空間轉(zhuǎn)錄組數(shù)據(jù),例如一個(gè)平臺(tái)無(wú)關(guān)的相互最近鄰算法(MNN)已被用于對(duì)齊這些數(shù)據(jù)類型,從而形成細(xì)胞位置映射;DEEPsc使用人工神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)空間位置;GLUER結(jié)合NMF、MNN算法和深度神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)齊數(shù)據(jù),Tangram對(duì)齊scRNA-seq和空間轉(zhuǎn)錄組數(shù)據(jù)集,同時(shí)優(yōu)化scRNA-seq數(shù)據(jù)和空間數(shù)據(jù)中每個(gè)基因的空間相關(guān)性(類似的方法還有NovaSparc和D-CE),Tangram對(duì)齊的確定性模式也可以作為一種去卷積方法。
表征轉(zhuǎn)錄組譜的空間模式
空間轉(zhuǎn)錄組分析的關(guān)鍵貢獻(xiàn)不僅在于描述細(xì)胞類型,還在于描述它們的空間組織方式。這對(duì)于研究組織結(jié)構(gòu)和細(xì)胞-細(xì)胞相互作用的影響至關(guān)重要。可以使用成對(duì)富集分析(pair-wise enrichment analysis)來(lái)識(shí)別可能相鄰的細(xì)胞類型對(duì)。細(xì)胞領(lǐng)域模式分析可識(shí)別多細(xì)胞類型鄰域的重復(fù)模式。另一種識(shí)別富集模式的方法是使用topic models。此外,細(xì)胞狀態(tài)的連續(xù)性可以被納入隱馬爾科夫隨機(jī)場(chǎng)(HMRF)模型,以識(shí)別連貫的空間域。BayesSpace使用來(lái)自空間鄰域的信息來(lái)增強(qiáng)空間轉(zhuǎn)錄組數(shù)據(jù)的分辨率并進(jìn)行聚類分析。而SPICEMIX將HMRF與NMF相結(jié)合。staNMF將NMF與穩(wěn)定性準(zhǔn)則研究相結(jié)合,識(shí)別空間模式。
許多工具根據(jù)預(yù)先定義的過(guò)程對(duì)基因表達(dá)的空間模式進(jìn)行建模,例如spatialDE、SOMDE、Trendsceek、SPARK、binSpect等。其中,作為一個(gè)具體的例子,binSpect被用來(lái)識(shí)別MERFISH冠狀腦切片數(shù)據(jù)中具有空間一致性模式的基因,排名靠前的基因顯示上圖F。
亞細(xì)胞結(jié)構(gòu)分析
隨著新技術(shù)的進(jìn)步,現(xiàn)在可以實(shí)現(xiàn)亞細(xì)胞轉(zhuǎn)錄物的研究。除了基于FISH的方法(眾所周知這些方法具有單分子分辨率),ISS方法也提供非常高的分辨率。此外,高密度陣列或基于珠子的技術(shù)還實(shí)現(xiàn)了亞細(xì)胞分辨率。
已經(jīng)開(kāi)發(fā)了許多方法來(lái)使用亞細(xì)胞基因表達(dá)模式來(lái)規(guī)避細(xì)胞分割,例如SSAM、stLearn、Spage2vec等。基于已知細(xì)胞類型特異性特征的監(jiān)督細(xì)胞類型映射策略已經(jīng)開(kāi)發(fā)出來(lái),例如使用樸素貝葉斯模型為HDST數(shù)據(jù)分配細(xì)胞類型。亞細(xì)胞基因表達(dá)模式反過(guò)來(lái)可以用來(lái)改善細(xì)胞分割,例如Baysor、Sparcle、JTSA等。
對(duì)基因表達(dá)的亞細(xì)胞模式的分析也可以提供新的生物學(xué)見(jiàn)解。例如已經(jīng)開(kāi)發(fā)了一種原位RNA速度方法,以使用亞細(xì)胞RNA定位信息來(lái)推斷轉(zhuǎn)錄率。
此外,通過(guò)使用過(guò)氧化物酶APEX2(一種稱為APEX-seq的方法)對(duì)RNA進(jìn)行直接鄰近標(biāo)記,可以高分辨率地識(shí)別細(xì)胞質(zhì)中的共定位mRNA物種。此外,在核位置富集的mRNAs傾向于編碼在核斑點(diǎn)和核質(zhì)中富集的蛋白質(zhì)。或者,也可以通過(guò)ATLAS-seq檢測(cè)亞細(xì)胞RNA共定位。
了解細(xì)胞如何與組織環(huán)境溝通?
空間轉(zhuǎn)錄組分析的一個(gè)重要目標(biāo)是研究細(xì)胞如何與組織環(huán)境通信。Giotto引入了一種雙向比較方法,通過(guò)比較同一細(xì)胞類型內(nèi)但被不同相鄰細(xì)胞包圍的細(xì)胞亞群之間的基因表達(dá)模式來(lái)識(shí)別相互作用改變的基因。值得注意的是,與單獨(dú)使用基因表達(dá)信息相比,使用空間信息可以顯著減少假陽(yáng)性配體-受體活性預(yù)測(cè)的數(shù)量。CellPhoneDB v3.0中使用了類似的方法。為了克服空間轉(zhuǎn)錄組數(shù)據(jù)沒(méi)有單細(xì)胞分辨率這一挑戰(zhàn),研究人員應(yīng)用Cell2location來(lái)推斷不同細(xì)胞類型的位置,然后比較與不同細(xì)胞鄰域相關(guān)的基因表達(dá)模式。其他方法也被用來(lái)量化相鄰細(xì)胞類型的影響,包括convolutional neural networks、optimal transport和multioutput regression。另一種方法是將基因表達(dá)譜明確分解為空間和非空間成分,然后利用鄰域的細(xì)胞類型組成來(lái)估計(jì)空間成分。配體-受體相互作用的分析也被擴(kuò)展到包括多單位蛋白復(fù)合物中輔助因子的影響,以提高預(yù)測(cè)的準(zhǔn)確性。值得注意的是,還開(kāi)發(fā)了從細(xì)胞-細(xì)胞相互作用模式重建空間位置的算法。
用于空間數(shù)據(jù)分析和可視化的綜合探索性工具?
生物學(xué)家將受益于集成和交互式管道,允許他們執(zhí)行各種分析步驟,從原始數(shù)據(jù)導(dǎo)入到圖像分析,然后生成最終分析結(jié)果和可視化圖像,這些操作最好是在個(gè)人計(jì)算機(jī)上完成。目前,有許多綜合工具包可用,例如Giotto、Seurat、Squidpy等。
這些軟件包或工具箱大多是由獨(dú)立的實(shí)驗(yàn)室開(kāi)發(fā)的,這就導(dǎo)致了多個(gè)不同的數(shù)據(jù)結(jié)構(gòu)不一定共享相同的數(shù)據(jù)格式。為了克服其中的一些挑戰(zhàn),R/Bioconductor社區(qū)正致力于精心設(shè)計(jì)普遍適用的數(shù)據(jù)結(jié)構(gòu),并在最近發(fā)布了spatialExperiment類的第一個(gè)版本。這是一個(gè)新的S4類,擴(kuò)展了流行的singleCellExperiment類,旨在與幾種類型的空間轉(zhuǎn)錄組數(shù)據(jù)集一起操作,包括多細(xì)胞和亞細(xì)胞分辨率。已經(jīng)有幾個(gè)空間R包使用這種數(shù)據(jù)結(jié)構(gòu),如SpatialLIBD和Spaniel,它們都擅長(zhǎng)于創(chuàng)建交互式R/Shiny應(yīng)用程序來(lái)可視化空間轉(zhuǎn)錄組數(shù)據(jù)集。
近年來(lái)空間組學(xué)領(lǐng)域取得了很多進(jìn)展。新的方法已經(jīng)被開(kāi)發(fā)出來(lái)以應(yīng)對(duì)各種特定的空間轉(zhuǎn)錄組挑戰(zhàn)。綜合性的軟件包使生物學(xué)家能夠輕松地從頭到尾分析他們自己的數(shù)據(jù),并通過(guò)交互式可視化對(duì)數(shù)據(jù)進(jìn)行互動(dòng)探索。這些工具在使空間轉(zhuǎn)錄組技術(shù)廣泛適用方面發(fā)揮了重要作用。
近年來(lái),出現(xiàn)了一種范式的轉(zhuǎn)變,即根據(jù)轉(zhuǎn)錄組圖譜對(duì)細(xì)胞類型進(jìn)行分類,有時(shí)還輔以其他分子模式。由于ST技術(shù)的快速發(fā)展,現(xiàn)在可以對(duì)同一細(xì)胞同時(shí)進(jìn)行轉(zhuǎn)錄組分析和形態(tài)學(xué)分析,從而為系統(tǒng)研究這兩種根本不同的方法之間的關(guān)系提供了很好的機(jī)會(huì)。
一個(gè)令人興奮的新方向是空間多元組學(xué)。新技術(shù)的發(fā)展使得在保存蛋白質(zhì)和RNA、內(nèi)含子和成熟mRNA、DNA和RNA等信息的同時(shí),可以分析同一細(xì)胞中的多種形態(tài)信息。這些技術(shù)使分析不同分子模式之間的相關(guān)性成為可能,并提供了機(jī)理上的見(jiàn)解。分析這些數(shù)據(jù)需要開(kāi)發(fā)新的計(jì)算方法和工具包。
【來(lái)自小編的插播】歡迎訂閱或收藏???時(shí)空組/空間組學(xué)專題(點(diǎn)擊可直接訪問(wèn)),及時(shí)查收最新研究進(jìn)展。
首發(fā)公號(hào):國(guó)家基因庫(kù)大數(shù)據(jù)平臺(tái)
參考文獻(xiàn)
Dries R, Chen J, Del Rossi N, et al. Advances in spatial transcriptomic data analysis[J]. Genome Research, 2021, 31(10): 1706-1718.
圖片均來(lái)源于參考文獻(xiàn),如有侵權(quán)請(qǐng)聯(lián)系刪除。