單細胞轉(zhuǎn)錄組之monocle標準流程及不同包間對象轉(zhuǎn)換

1.利用已有的Seurat對象轉(zhuǎn)換為CellDataSet對象

加載之前seutat標準流程跑完的數(shù)據(jù),如果沒有可以走一遍流程,教程點我

#加載需要的包
library(Seurat)
# devtools::install_github('satijalab/seurat-data')
library(SeuratData)
library(monocle)
library(ggplot2)
library(patchwork)
library(dplyr)
#加載之前seutat標準流程跑完的數(shù)據(jù),如果沒有可以走一遍流程
load(file = '../section-01-cluster/basic.sce.pbmc.Rdata')

pbmc
table(Idents(pbmc))
DimPlot(pbmc, reduction = 'umap', label = TRUE, pt.size = 0.5) + NoLegend()

sce=pbmc 
table( Idents(sce ))
table(sce@meta.data$seurat_clusters) 
table(sce@meta.data$orig.ident) 

將之前的數(shù)據(jù)調(diào)出來后,我們看一下monocle包的newCellDataSet函數(shù)。

?newCellDataSet

#Creates a new CellDateSet object.
#cellData   expression data matrix for an experiment

#phenoData  data frame containing attributes of individual cells

#featureData    data frame containing attributes of features (e.g. genes)

可以看到這三個數(shù)據(jù)在sce中都可以調(diào)出來

head(sce@meta.data )
sample_ann <-  sce@meta.data  
sample_ann$celltype=Idents(sce)
head(sample_ann)
# rownames(sample_ann)=sample_ann[,1]

gene_ann <- data.frame(gene_short_name = rownames(sce@assays$RNA) , row.names =  rownames(sce@assays$RNA) 
)
head(gene_ann)

#newCellDataSet要求featureData和phenoData格式為AnnotatedDataFrame
pd <- new("AnnotatedDataFrame",data=sample_ann)
fd <- new("AnnotatedDataFrame",data=gene_ann)
ct=as.data.frame(sce@assays$RNA@counts)
ct[1:4,1:4]

創(chuàng)建CellDataSet對象

sc_cds <- newCellDataSet(as.matrix(ct), phenoData = pd,featureData =fd,expressionFamily = negbinomial.size(),lowerDetectionLimit=1)
sc_cds

不同包間對象轉(zhuǎn)換

convert the Seurat object to a SingleCellExperiment object

pbmc_sce <- as.SingleCellExperiment(pbmc)

convert singlecellexperment to Seurat

as.Seurat(對象名)

Seurat::as.CellDataSet()函數(shù)可以直接將Seurat對象轉(zhuǎn)化為monocle2的對象,進行monocle2的擬時分析

sc_cds<-Seurat::as.CellDataSet(sce)

2.monocle的標準流程

2.1 數(shù)據(jù)過濾

library(monocle)
sc_cds
colnames(fData(sc_cds))
colnames(pData(sc_cds))

sc_cds <- detectGenes(sc_cds, min_expr = 1) 
colnames(fData(sc_cds))
colnames(pData(sc_cds))

#detectGenes設(shè)置一個閾值,在在此閾值之上的 CellDataSet對象中,計算在每個細胞中基因表達的數(shù)量pdata(cds)$num_genes_expressed,計算每個基因在多少細胞中表達fdata(cds)$num_cells_expressed。


sc_cds <- sc_cds[fDat(sc_cds$num_cells_expressed > 10, ]
# 數(shù)值可以自行摸索  featureData返回一個包含變量值和變量元數(shù)據(jù)信息的對象。 fvarLabels 返回測量變量名稱的字符向量。 fData 返回一個數(shù)據(jù)框,其中基因為行,變量為列。 fvarMetadata 返回一個數(shù)據(jù)框,其中變量名稱作為行,描述標簽(例如,測量單位)作為列。
sc_cds
cds <- sc_cds

2.2 標準化和歸一化

cds <- estimateSizeFactors(cds)
cds <- estimateDispersions(cds) 

2.3 挑選表達量不太低的基因用于后續(xù)分析

# dispersionTable差異基因,并不是所有的基因都有作用,所以先進行挑選,合適的基因用來進行聚類。
disp_table <- dispersionTable(cds)
## 挑表達量不太低的基因,在各細胞中平均表達量大于0.1
unsup_clustering_genes <- subset(disp_table,mean_expression >= 0.1)
unsup_clustering_genes
## 準備聚類基因名單
cds <- setOrderingFilter(cds, unsup_clustering_genes$gene_id)

#按均值與離散度繪制基因,突出顯示選擇排序的基因,每個灰點都是一個基因。黑點是包含在最后一次調(diào)用 setOrderingFilter中的那些。紅色曲線顯示通過estimateDispersions() 學習的均方差模型。

plot_ordering_genes(cds) 

#從歸一化后的數(shù)據(jù)中繪制基于 PCA 的每個主成分的方差百分比
plot_pc_variance_explained(cds, 
  

2.4 降維聚類分群

# 降維,其中 num_dim 參數(shù)選擇基于上面的PCA圖

cds <- reduceDimension(cds, max_components = 2, num_dim = 6,reduction_method = 'tSNE', verbose = T)
#聚類
cds <- clusterCells(cds, num_clusters = 6) 
plot_cell_clusters(cds, 1, 2 )

2.5 查看monocle和seurat聚類分群的差別

#phenoData 返回一個包含變量值和變量元數(shù)據(jù)信息的對象。 varLabels 返回測量變量的字符向量。 pData 返回一個數(shù)據(jù)框,其中樣本為行,變量為列。 varMetadata 返回一個數(shù)據(jù)框,其中變量名稱為行,描述標簽(例如,測量單位)為列。
head(rownames(pData(cds)))
colnames(pData(cds))
table(pData(cds)$Cluster) 
table(pData(cds)$seurat_clusters)
table(pData(cds)$Cluster,pData(cds)$seurat_clusters)
table(pData(cds)$Cluster,pData(cds)$celltype)

可以看到 monocle 給細胞重新定義了亞群,亞群數(shù)量可以自己選擇,整體來說,monocle和seurat 各自獨立流程定義的亞群的一致性還不錯。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,606評論 6 533
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,582評論 3 418
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,540評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,028評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,801評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,223評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,294評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,442評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,976評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 40,800評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,996評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,543評論 5 360
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,233評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,662評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,926評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,702評論 3 392
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,991評論 2 374

推薦閱讀更多精彩內(nèi)容