空轉分析方法拾遺

作者,追風少年i

周五了,一周的收官之戰,馬上國慶了,希望大家有個好的假期,一切都會好起來,周星馳有一句臺詞,雖然我們都是路人甲乙丙丁,但是一樣是有生命,有靈魂的。

書接上文,空間多組學分析破譯膠質母細胞瘤中的雙向腫瘤-宿主相互依賴性(空間微環境),我們來進行方法拾遺并復現。

這里我們主要關注空間轉錄組的分析,關于空間代謝和空間蛋白,仍然需要不斷的學習。

第一點,空間CNV分析。

  • CNA estimation
    圖片.png

通過將基因與其染色體位置對齊并對相對表達值應用移動平均值來估計拷貝數變異 (CNV),每個染色體內有 100 個基因的滑動窗口(跟inferCNV的原理一致),首先,使用 InferCNV 包根據它們各自的基因組定位排列基因。 作為非惡性細胞的參考集,使用了來自非惡性皮層樣本的空間轉錄組數據集(注意這里ref的選擇)。 為了提高速度和計算能力,subsample是可選的。 為了避免任何特定基因對移動平均線的相當大的影響,將相對表達值限制在 [-2.6,2.6] 的范圍內,將所有高于/低于 exp(i) = |2.6| 的值替換為 exp(i) = |2.6|。然后重新導入導出的 .RDS 輸出文件,并按估計的 CNA 的染色體平均值進行分組,并使用 SPATA 對象的 fdata slot與它們的空間位置對齊。使用 SPATA::joinWithFeatures() 函數,然后提取了集群比較。空間數據的 CNA 分析是通過 SPATA2::runCnvAnalysis() 命令在 SPATA2 中實現的。在下一步中,估計的 CNA 值重新排列到定義的染色體bin中。這些 bin 由 SPATAwrappers 函數 Create.ref.bins() 創建,使用 SPATA 對象和給定 bin 的大小作為輸入。在本研究中,使用了 1Mbp 的 bin 大小,產生 3847 個染色體 bin,每個 bin 平均覆蓋 5.5 個基因。使用 10kbp 滑動窗口進行重新縮放和插值。對于標準化,使用了一個 loess 回歸模型,用于確定來自 InferCNV 輸出的拷貝數值。使用 SPATAwrappers::run-CNV.Normalization() 函數進行Interpolation和歸一化。

SPATA分析CNV的代碼如下

library(SPATA2)
spata_obj <- loadSpataObject("data/spata-obj-gbm275.RDS")###加載infercnv分析得到的rds

spata_obj <-
  runCnvAnalysis(
    object = spata_obj
    directory_cnv_folder = "data-gmb275/cnv-results" # example directory
    cnv_prefix = "Chr"
    )

# change input
spata_obj <- 
  runCnvAnalysis(
    object = spata_obj
    directory_cnv_folder = "data-gmb275/cnv-results" # example directory to 
    clear_noise_via_ref_mean_sd = list(sd_amplifier = 2)

# example on how to use the functions arguments if you want to specify the reference (ref_*)
runCnvAnalysis(
  object = spata_obj,
  directory_cnv_folder = "data-gmb275/cnv-results", # example directory to 
  ref_annotation = cnv_ref$annotation, 
  ref_mtr = cnv_ref$mtr, 
  ref_regions = cnv_ref$regions
)

##CNV-Results
cnv_results <- getCnvResults(spata_obj)

names(cnv_results)
##Visualization
plotCnvResults(object = spata_obj)
圖片.png
plotSurface(object = spata_obj, color_by = "seurat_clusters")

plotCnvResults(object = spata_obj, across = "seurat_clusters")
圖片.png
圖片.png
###CNV-Heatmap
getCnvFeatureNames(object = spata_obj)

# are part of all feature names
getFeatureNames(object = spata_obj)
##            numeric            integer            numeric            numeric 
##   "nCount_Spatial" "nFeature_Spatial"       "percent.mt"       "percent.RB" 
##             factor          character             factor             factor 
##  "seurat_clusters"     "segmentation"      "Leiden_UMAP"          "cluster" 
##            logical            numeric            numeric            numeric 
##             "keep"             "Chr0"             "Chr1"            "Chr10" 
##            numeric            numeric            numeric            numeric 
##            "Chr11"            "Chr12"            "Chr13"            "Chr14" 
##            numeric            numeric            numeric            numeric 
##            "Chr15"            "Chr16"            "Chr17"            "Chr18" 
##            numeric            numeric            numeric            numeric 
##            "Chr19"             "Chr2"            "Chr20"            "Chr21" 
##            numeric            numeric            numeric            numeric 
##            "Chr22"            "Chr23"             "Chr3"             "Chr4" 
##            numeric            numeric            numeric            numeric 
##             "Chr5"             "Chr6"             "Chr7"             "Chr8" 
##            numeric 
##             "Chr9"
plotSurface(object = spata_obj, color_by = "Chr7", pt_clrsp = "Reds 3", c1 = 1)

plotSurface(object = spata_obj, color_by = "Chr10", pt_clrsp = "Blues 3", rev = FALSE, c1 = 1)
圖片.png

CNA subclone analysis
為了根據 CNA 數據確定亞克隆,進行了 PCA 分析,然后對前 30 個組分進行 KMeans 聚類(CNV得到的矩陣進行分析)。為了確定最優的tree cut,我們估計了 Calinski-Harabasz 指數并使用了 k~CH 指數曲線的第一個峰值(CH 指數 vs Number of clusters)。 下一個目標是量化空間上不同的轉錄程序與亞克隆結構的空間相關性和重疊。 首先,我們通過擬合值 (f(ck)) 估計給定 CNA 亞克隆的每個點 (S1, S2;.; Sk) 到 KMeans 質心 (c) 的距離 (Sdist),如下所示:

圖片.png

從進一步分析中去除了距離較近的點(Sdist < quantileSdist ;0.9)。 然后,估計了所有給定點的主要空間不同轉錄程序,并量化了給定亞克隆中每個轉錄程序的表達百分比。

第二部分

  • Prediction of tumor cell content
    為單細胞測序研究建立的分析和算法不一定適用于空間分辨轉錄組數據的分析。 這主要是由于每個點內的細胞組成不明確,分析這些數據的一個優勢是近似每個點的真實組成。單細胞數據和空間轉錄組學的整合已經可以預測某些細胞類型的空間豐度,但在腫瘤中,由于樣本內部和樣本之間存在巨大的異質性,這種預測很困難。 與高度可變的基因表達相比,染色體改變是評估每個點的腫瘤細胞含量的相當穩健和合適的參數。 為了訓練和驗證預測模型,對同一供體進行了單細胞測序和相應的空間分辨轉錄組學。

推斷了 scRNA-seq 數據集的拷貝數變化,并提取了腫瘤和非惡性細胞的特征,這些特征顯示出很大的相似性。

Validation of CNA Analysis

接下來,驗證了從 RNA-seq 數據調用的推斷 CNA 反映 DNA 測序中檢測到的 CNA 的程度。 因此,使用了最近發表的 slide-RNA-seq 和 slide-DNA-seq 數據集,并比較了兩種空間測序方法檢測到的 CNA。 兩種驗證方法都表明,從空間轉錄組學中獲得的推斷 CNA 反映了使用 10X Visium 平臺獲得的空間分辨轉錄組學中的實際染色體增益和損失。

第三點,Spatial autocorrelation Moran’s I,關于這個內容,用過monocle3的童鞋應該很熟悉。

空間自相關使用 Moran 的 I 統計值根據特征位置和屬性值確定點與其鄰居的空間依賴性。 這允許評估定義的基因表達或特征是分組的、分布的還是隨機的。 如果 Z 值或 p 值表示統計顯著性,則 Moran's I 指數值為正表示有聚集趨勢,而 Moran's I 指數值為負表示有分散趨勢。 自相關定義為:

圖片.png

where N defines the number of spatial spots with the index x and y and the matrix of spatial weights as wxy. The feature is indicated by exp and \overline{\text{exp}} the mean value of neighboring features. The spatial weights were defined as a distance matrix of the cartesian space.W is defined as the sum of all wxy.

最后來一張空間軌跡

空間軌跡

生活很好,有你更好,主要還是針對CNV的分析為主

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
禁止轉載,如需轉載請通過簡信或評論聯系作者。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,646評論 6 533
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,595評論 3 418
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,560評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,035評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,814評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,224評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,301評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,444評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,988評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,804評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,998評論 1 370
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,544評論 5 360
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,237評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,665評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,927評論 1 287
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,706評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,993評論 2 374

推薦閱讀更多精彩內容