作者,追風少年i
周五了,一周的收官之戰,馬上國慶了,希望大家有個好的假期,一切都會好起來,周星馳有一句臺詞,雖然我們都是路人甲乙丙丁,但是一樣是有生命,有靈魂的。
書接上文,空間多組學分析破譯膠質母細胞瘤中的雙向腫瘤-宿主相互依賴性(空間微環境),我們來進行方法拾遺并復現。
這里我們主要關注空間轉錄組的分析,關于空間代謝和空間蛋白,仍然需要不斷的學習。
第一點,空間CNV分析。
-
CNA estimation
圖片.png
通過將基因與其染色體位置對齊并對相對表達值應用移動平均值來估計拷貝數變異 (CNV),每個染色體內有 100 個基因的滑動窗口(跟inferCNV的原理一致),首先,使用 InferCNV 包根據它們各自的基因組定位排列基因。 作為非惡性細胞的參考集,使用了來自非惡性皮層樣本的空間轉錄組數據集(注意這里ref的選擇)。 為了提高速度和計算能力,subsample是可選的。 為了避免任何特定基因對移動平均線的相當大的影響,將相對表達值限制在 [-2.6,2.6] 的范圍內,將所有高于/低于 exp(i) = |2.6| 的值替換為 exp(i) = |2.6|。然后重新導入導出的 .RDS 輸出文件,并按估計的 CNA 的染色體平均值進行分組,并使用 SPATA 對象的 fdata slot與它們的空間位置對齊。使用 SPATA::joinWithFeatures() 函數,然后提取了集群比較。空間數據的 CNA 分析是通過 SPATA2::runCnvAnalysis() 命令在 SPATA2 中實現的。在下一步中,估計的 CNA 值重新排列到定義的染色體bin中。這些 bin 由 SPATAwrappers 函數 Create.ref.bins() 創建,使用 SPATA 對象和給定 bin 的大小作為輸入。在本研究中,使用了 1Mbp 的 bin 大小,產生 3847 個染色體 bin,每個 bin 平均覆蓋 5.5 個基因。使用 10kbp 滑動窗口進行重新縮放和插值。對于標準化,使用了一個 loess 回歸模型,用于確定來自 InferCNV 輸出的拷貝數值。使用 SPATAwrappers::run-CNV.Normalization() 函數進行Interpolation和歸一化。
SPATA分析CNV的代碼如下
library(SPATA2)
spata_obj <- loadSpataObject("data/spata-obj-gbm275.RDS")###加載infercnv分析得到的rds
spata_obj <-
runCnvAnalysis(
object = spata_obj
directory_cnv_folder = "data-gmb275/cnv-results" # example directory
cnv_prefix = "Chr"
)
# change input
spata_obj <-
runCnvAnalysis(
object = spata_obj
directory_cnv_folder = "data-gmb275/cnv-results" # example directory to
clear_noise_via_ref_mean_sd = list(sd_amplifier = 2)
# example on how to use the functions arguments if you want to specify the reference (ref_*)
runCnvAnalysis(
object = spata_obj,
directory_cnv_folder = "data-gmb275/cnv-results", # example directory to
ref_annotation = cnv_ref$annotation,
ref_mtr = cnv_ref$mtr,
ref_regions = cnv_ref$regions
)
##CNV-Results
cnv_results <- getCnvResults(spata_obj)
names(cnv_results)
##Visualization
plotCnvResults(object = spata_obj)
plotSurface(object = spata_obj, color_by = "seurat_clusters")
plotCnvResults(object = spata_obj, across = "seurat_clusters")
###CNV-Heatmap
getCnvFeatureNames(object = spata_obj)
# are part of all feature names
getFeatureNames(object = spata_obj)
## numeric integer numeric numeric
## "nCount_Spatial" "nFeature_Spatial" "percent.mt" "percent.RB"
## factor character factor factor
## "seurat_clusters" "segmentation" "Leiden_UMAP" "cluster"
## logical numeric numeric numeric
## "keep" "Chr0" "Chr1" "Chr10"
## numeric numeric numeric numeric
## "Chr11" "Chr12" "Chr13" "Chr14"
## numeric numeric numeric numeric
## "Chr15" "Chr16" "Chr17" "Chr18"
## numeric numeric numeric numeric
## "Chr19" "Chr2" "Chr20" "Chr21"
## numeric numeric numeric numeric
## "Chr22" "Chr23" "Chr3" "Chr4"
## numeric numeric numeric numeric
## "Chr5" "Chr6" "Chr7" "Chr8"
## numeric
## "Chr9"
plotSurface(object = spata_obj, color_by = "Chr7", pt_clrsp = "Reds 3", c1 = 1)
plotSurface(object = spata_obj, color_by = "Chr10", pt_clrsp = "Blues 3", rev = FALSE, c1 = 1)
CNA subclone analysis
為了根據 CNA 數據確定亞克隆,進行了 PCA 分析,然后對前 30 個組分進行 KMeans 聚類(CNV得到的矩陣進行分析)。為了確定最優的tree cut,我們估計了 Calinski-Harabasz 指數并使用了 k~CH 指數曲線的第一個峰值(CH 指數 vs Number of clusters)。 下一個目標是量化空間上不同的轉錄程序與亞克隆結構的空間相關性和重疊。 首先,我們通過擬合值 (f(ck)) 估計給定 CNA 亞克隆的每個點 (S1, S2;.; Sk) 到 KMeans 質心 (c) 的距離 (Sdist),如下所示:
從進一步分析中去除了距離較近的點(Sdist < quantileSdist ;0.9)。 然后,估計了所有給定點的主要空間不同轉錄程序,并量化了給定亞克隆中每個轉錄程序的表達百分比。
第二部分
-
Prediction of tumor cell content
為單細胞測序研究建立的分析和算法不一定適用于空間分辨轉錄組數據的分析。 這主要是由于每個點內的細胞組成不明確,分析這些數據的一個優勢是近似每個點的真實組成。單細胞數據和空間轉錄組學的整合已經可以預測某些細胞類型的空間豐度,但在腫瘤中,由于樣本內部和樣本之間存在巨大的異質性,這種預測很困難。 與高度可變的基因表達相比,染色體改變是評估每個點的腫瘤細胞含量的相當穩健和合適的參數。 為了訓練和驗證預測模型,對同一供體進行了單細胞測序和相應的空間分辨轉錄組學。
推斷了 scRNA-seq 數據集的拷貝數變化,并提取了腫瘤和非惡性細胞的特征,這些特征顯示出很大的相似性。
接下來,驗證了從 RNA-seq 數據調用的推斷 CNA 反映 DNA 測序中檢測到的 CNA 的程度。 因此,使用了最近發表的 slide-RNA-seq 和 slide-DNA-seq 數據集,并比較了兩種空間測序方法檢測到的 CNA。 兩種驗證方法都表明,從空間轉錄組學中獲得的推斷 CNA 反映了使用 10X Visium 平臺獲得的空間分辨轉錄組學中的實際染色體增益和損失。
第三點,Spatial autocorrelation Moran’s I,關于這個內容,用過monocle3的童鞋應該很熟悉。
空間自相關使用 Moran 的 I 統計值根據特征位置和屬性值確定點與其鄰居的空間依賴性。 這允許評估定義的基因表達或特征是分組的、分布的還是隨機的。 如果 Z 值或 p 值表示統計顯著性,則 Moran's I 指數值為正表示有聚集趨勢,而 Moran's I 指數值為負表示有分散趨勢。 自相關定義為:
where N defines the number of spatial spots with the index x and y and the matrix of spatial weights as wxy. The feature is indicated by exp and
最后來一張空間軌跡
生活很好,有你更好,主要還是針對CNV的分析為主