注意,這里使用的seurat對象要求已經run過runUMAMP()
findCluster等函數,否則也沒有必要把seurat的結果弄到monocle3的cds對象里
1. 從seurat對象手動創建cds對象
library(Seurat)
library(monocle3)
library(tidyverse)
library(patchwork)
rm(list=ls())
dir.create("Monocle3")
setwd("Monocle3")##創建CDS對象并預處理數據
pbmc <-readRDS("pbmc.rds")
data<-GetAssayData(pbmc,assay ='RNA',slot ='counts')
cell_metadata <-pbmc@meta.data
gene_annotation <-data.frame(gene_short_name =rownames(data))
rownames(gene_annotation)<-rownames(data)
cds <-new_cell_data_set(data,cell_metadata =cell_metadata,gene_metadata =gene_annotation)
來源:(http://www.lxweimin.com/p/c402b6588e17)
上面的是中文的教程,還包含手動把seurat中的umap的數據傳入cds的操作,適合不想官方文檔的時候看,挺適合新手上手的。
2. 使用seuratwrapper自動導入seurat中的數據;
教程來源:
Building trajectories with Monocle 3
來自 <https://satijalab.org/signac/articles/monocle.html>
library(SeuratWrappers)
注意seuratWrappers包提供了seuart對象到其他包的多種接口,可以把seurat對象轉換為其他對象;
這里是把seurat對象轉換為了cds對象;
erythroid.cds<-as.cell_data_set(erythroid)
erythroid.cds<-cluster_cells(cds =erythroid.cds, reduction_method ="UMAP")
erythroid.cds<-learn_graph(erythroid.cds, use_partition =TRUE)
#這個教程是已經手動提供了root的細胞,如果沒有這個文件,order_cells()會開一個窗口,然后讓人選root。
#hsc是教程中給的root的文件,實際操作的時候,可以不用給這個參數,直接選擇彈出的窗口中的細胞即可;
# order cells
erythroid.cds <- order_cells(erythroid.cds, reduction_method = "UMAP", root_cells = hsc)
lymphoid.cds <- order_cells(lymphoid.cds, reduction_method = "UMAP", root_cells = hsc)
# plot trajectories colored by pseudotime
plot_cells(
cds = erythroid.cds,
color_cells_by = "pseudotime",
show_trajectory_graph = TRUE
)
plot_cells(
cds = lymphoid.cds,
color_cells_by = "pseudotime",
show_trajectory_graph = TRUE
)
#提取pseudotime的結果,并加到metadata上面;
bone <- AddMetaData(
object = bone,
metadata = erythroid.cds@principal_graph_aux@listData$UMAP$pseudotime,
col.name = "Erythroid"
)
bone <- AddMetaData(
object = bone,
metadata = lymphoid.cds@principal_graph_aux@listData$UMAP$pseudotime,
col.name = "Lymphoid"
)
#可視化結果;
FeaturePlot(bone, c("Erythroid", "Lymphoid"), pt.size = 0.1) & scale_color_viridis_c()
上述的教程只是比較方便的把seurat對象轉變成了cds對象,同時把UMAP PCA等數據也給maping過去了,但是沒有把seurat_cluster弄過去,沒有把gene_short_name弄過去
自己的搜集到的解決的方法:
3.使用自己看到的方法
cds2 <- as.cell_data_set(x = TregCell)
#mapping cluster
#cds對象的cds2@clusters$UMAP$clusters是一個named vector。
cds2@clusters$UMAP$clusters <- Idents(TregCell)[rownames(colData(cds2))]
#parition的數目根據自己的實際情況處理,如果后面的 learn_graph(cds2, use_partition = F)的use_partition為F,則不用partition來做不同pseudotime推測,沒有沒有必要設置partition;
cds2@clusters$UMAP$partitions <- factor(x = rep(1, length(rownames(colData(cds2)))), levels = 1)
names(cds2@clusters$UMAP$partitions) <- rownames(colData(cds2))
#從seurat obj transfer過去的cds對象沒有做estimate size factor參數
## Calculate size factors using built-in function in monocle3
cds2 <- estimate_size_factors(cds2)
#創建cds對象的時候,cds要求gene_meta這gedf必須要有一列為gene_short_name
## Add gene names into CDS
cds2@rowRanges@elementMetadata@listData$gene_short_name <- rownames(cds2)
#如果出現了order_cells(cds)報錯"object 'V1' not found",否則不執行
#來源:https://github.com/cole-trapnell-lab/monocle3/issues/130](https://github.com/cole-trapnell-lab/monocle3/issues/130
###############################################################
rownames(cds2@principal_graph_aux[["UMAP"]]$dp_mst) <- NULL
# colnames(cds@reducedDims$UMAP) <- NULL
colnames(cds2@int_colData@listData$reducedDims@listData$UMAP) <- NULL
###############################################################
cds2 <- learn_graph(cds2, use_partition = F)
cds2 <- order_cells(cds2)
plot_cells(cds2, color_cells_by = "pseudotime", label_cell_groups=F, label_leaves=FALSE, label_branch_points=FALSE, graph_label_size=1.5)
plot_cells(cds2)
以上代碼得到了使用seurat對象里的UMAP以及seurat_cluster得到pseudotime。