scRNA-seq數(shù)據(jù)分析 || Monocle3

同系列文章:

關(guān)于擬時(shí)分析的一些基本知識(shí)請(qǐng)參看以下兩篇及其參考文章:

更多詳細(xì)內(nèi)容請(qǐng)參考monocle3官網(wǎng),本文僅為個(gè)人學(xué)習(xí)筆記。

在發(fā)育過(guò)程中,細(xì)胞對(duì)刺激作出反應(yīng),并在整個(gè)生命過(guò)程中,從一種功能“狀態(tài)”過(guò)渡到另一種功能“狀態(tài)”。不同狀態(tài)的細(xì)胞表達(dá)不同的基因,產(chǎn)生蛋白質(zhì)和代謝物的動(dòng)態(tài)重復(fù)序列,從而完成它們的工作。當(dāng)細(xì)胞在狀態(tài)之間移動(dòng)時(shí),它們經(jīng)歷一個(gè)轉(zhuǎn)錄重組的過(guò)程,一些基因被沉默,另一些基因被激活。這些瞬時(shí)狀態(tài)通常很難描述,因?yàn)樵诟€(wěn)定的端點(diǎn)狀態(tài)之間純化細(xì)胞可能是困難的或不可能的。單細(xì)胞RNA-Seq可以使您在不需要純化的情況下看到這些狀態(tài)。然而,要做到這一點(diǎn),我們必須確定每個(gè)cell在可能的狀態(tài)范圍內(nèi)的位置。

Monocle介紹了利用RNA-Seq進(jìn)行單細(xì)胞軌跡分析的策略。Monocle不是通過(guò)實(shí)驗(yàn)將細(xì)胞純化成離散狀態(tài),而是使用一種算法來(lái)學(xué)習(xí)每個(gè)細(xì)胞必須經(jīng)歷的基因表達(dá)變化序列,作為動(dòng)態(tài)生物學(xué)過(guò)程的一部分。一旦它了解了基因表達(dá)變化的整體“軌跡”,Monocle就可以將每個(gè)細(xì)胞置于軌跡中的適當(dāng)位置。然后,您可以使用Monocle的微分分析工具包來(lái)查找在軌跡過(guò)程中受到調(diào)控的基因,如查找作為偽時(shí)間函數(shù)變化的基因一節(jié)所述。如果這個(gè)過(guò)程有多個(gè)結(jié)果,Monocle將重建一個(gè)“分支”軌跡。這些分支與細(xì)胞的“決策”相對(duì)應(yīng),Monocle提供了強(qiáng)大的工具來(lái)識(shí)別受它們影響的基因,并參與這些基因的形成。在分析單細(xì)胞軌跡中的分支的小節(jié)中,您可以看到如何分析分支。

monocle 能做的不只是擬時(shí)分析,或者說(shuō)為了做擬時(shí)分析他也做了sc-rna-seq的基本分析流程:數(shù)據(jù)讀入,均一化,降維(PCA,umap,tsne,),聚類(lèi),marker基因篩選以及可視化函數(shù)。在新的學(xué)習(xí)中我們發(fā)現(xiàn)monocle能做的遠(yuǎn)不只這些,例如用shiny開(kāi)發(fā)了web程序,更加用戶(hù)友好;借助garnett包可以做細(xì)胞定義-----monocle已經(jīng)是一個(gè)sc-rna-seq數(shù)據(jù)分析的工具箱。

monocle3

library(monocle3)
packageVersion("monocle3")
[1] ‘0.1.1’

monocle3是新的開(kāi)始大部分的函數(shù)名稱(chēng)都改變了,連版本號(hào)都從零開(kāi)始。

多種格式的數(shù)據(jù)讀入,這里我們依然是從seurat3對(duì)象中讀入:

#Generate a cell_data_set

#expression_matrix <- readRDS(url("http://staff.washington.edu/hpliner/data/cao_l2_expression.rds"))
#cell_metadata <- readRDS(url("http://staff.washington.edu/hpliner/data/cao_l2_colData.rds"))
#gene_annotation <- readRDS(url("http://staff.washington.edu/hpliner/data/cao_l2_rowData.rds"))

#cds <- new_cell_data_set(expression_matrix,
#                         cell_metadata = cell_metadata,
#                        gene_metadata = gene_annotation)

讀10X數(shù)據(jù),cellranger V2 V3 均可:

#Generate a cell_data_set from 10X output
# Provide the path to the Cell Ranger output.

#cds <- load_cellranger_data("D:\\Users\\Administrator\\Desktop\\RStudio\\single_cell\\V2")

setwd("D:\\Users\\Administrator\\Desktop\\Novo周運(yùn)來(lái)\\SingleCell\\scrna_tools")

#library(monocle)
#<-importCDS(pbmc,import_all = TRUE)
#Load Seurat object
pbmc <- readRDS('D:\\Users\\Administrator\\Desktop\\RStudio\\single_cell\\filtered_gene_bc_matrices\\hg19pbmc_tutorial.rds')

#Extract data, phenotype data, and feature data from the SeuratObject
data <- as(as.matrix(pbmc@assays$RNA@counts), 'sparseMatrix')
pd <-  pbmc@meta.data
fData <- data.frame(gene_short_name = row.names(data), row.names = row.names(data))
colnames(pd)

[1] "orig.ident"      "nCount_RNA"      "nFeature_RNA"    "percent.mt"      "RNA_snn_res.0.5" "seurat_clusters"

創(chuàng)建cds對(duì)象,注意這里每一項(xiàng)是什么。

#Construct monocle cds
cds <- new_cell_data_set(data,
                         cell_metadata  = pd,
                         gene_metadata  = fData)
> cds
class: cell_data_set 
dim: 13714 2638 
metadata(1): cds_version
assays(1): counts
rownames(13714): AL627309.1 AP006222.2 ... PNRC2.1 SRSF10.1
rowData names(1): gene_short_name
colnames(2638): AAACATACAACCAC AAACATTGAGCTAC ... TTTGCATGAGAGGC TTTGCATGCCTCAC
colData names(10): orig.ident nCount_RNA ... cell_type cluster_ext_type
reducedDimNames(2): PCA UMAP
spikeNames(0):
降維
  • 標(biāo)準(zhǔn)化
    Monocle3中的大多數(shù)分析(包括軌跡推斷和聚類(lèi))都需要各種規(guī)范化和預(yù)處理步驟。preprocess_cds執(zhí)行并存儲(chǔ)這些預(yù)處理步驟。

具體地說(shuō),根據(jù)選擇的參數(shù),preprocess_cds首先根據(jù)日志和因子大小對(duì)數(shù)據(jù)進(jìn)行規(guī)范化(normalizes),以處理深度差異,或者只根據(jù)大小因子進(jìn)行規(guī)范化。有三種方法: PCA or LSI. For LS,默認(rèn)是PCA。接下來(lái),preprocess_cds計(jì)算一個(gè)較低的維度空間,該空間將用作進(jìn)一步降維的輸入,如tSNE和UMAP。

#Pre-process the data

cds = preprocess_cds(cds, num_dim = 100)
?preprocess_cds
plot_pc_variance_explained(cds)
可視化降維
  • UMAP
#Reduce dimensionality and visualize the cells

cds = reduce_dimension(cds) #Monocle uses UMAP by default 
plot_cells(cds)
#No trajectory to plot. Has learn_graph() been called yet?
head(rownames(cds))
"AL627309.1"    "AP006222.2"    "RP11-206L10.2" "RP11-206L10.9" "LINC00115"     "NOC2L"  
plot_cells(cds, genes=c("S100A9", "RPS27", "FCER1A", "GNLY"))
  • tSNE
cds = reduce_dimension(cds, reduction_method="tSNE")
plot_cells(cds, reduction_method="tSNE", color_cells_by="seurat_clusters")

可以自己設(shè)置分組看看是否有批次效應(yīng)。

#Check for and remove batch effects
plot_cells(cds, color_cells_by="seurat_clusters", label_cell_groups=FALSE)
聚類(lèi)

無(wú)監(jiān)督聚類(lèi)是許多單細(xì)胞表達(dá)工作中的一個(gè)常見(jiàn)步驟。在包含多種細(xì)胞類(lèi)型的實(shí)驗(yàn)中,每個(gè)cluxter可能對(duì)應(yīng)不同的細(xì)胞類(lèi)型。該函數(shù)接受cell_data_set作為輸入,使用Louvain community detection對(duì)細(xì)胞進(jìn)行聚類(lèi),并返回一個(gè)cell_data_set,其中包含內(nèi)部存儲(chǔ)的聚類(lèi)結(jié)果。

#Group cells into clusters
#library(reticulate)
#use_python("E:\\conda\\python.exe")
#reticulate::py_install("louvain")

cds = cluster_cells(cds, python_home = "E:\\conda\\python",verbose = T,resolution=c(10^seq(-6,-1)))

Running louvain clustering algorithm ...
Run kNN based graph clustering starts:
  -Input data of 2638 rows and 2 columns
  -k is set to 20
  Finding nearest neighbors...DONE ~ 0.129999999997381 s
  Compute jaccard coefficient between nearest-neighbor sets ...DONE ~ 0.129999999997381 s
  Build undirected graph from the weighted links ...DONE ~ 0.14 s
  Run louvain clustering on the graph ...
Running louvain iteration  1 ...
Current iteration is 1; current resolution is 1e-06; Modularity is 0.547843095426104; Number of clusters are 3
Current iteration is 1; current resolution is 1e-05; Modularity is 0.547843095426104; Number of clusters are 3
Current iteration is 1; current resolution is 1e-04; Modularity is 0.547843095426104; Number of clusters are 3
Current iteration is 1; current resolution is 0.001; Modularity is 0.723545062987134; Number of clusters are 5
Current iteration is 1; current resolution is 0.01; Modularity is 0.865973276843872; Number of clusters are 13
Current iteration is 1; current resolution is 0.1; Modularity is 0.822758898433183; Number of clusters are 49
Maximal modularity is 0.865973276843872; corresponding resolution is 0.01

Run kNN based graph clustering DONE, totally takes 2.71215486526489 s.
  -Number of clusters: 13 
plot_cells(cds,graph_label_size=15,cell_size=1.5)

尋找marker 基因
#Find marker genes expressed by each cluster
marker_test_res = top_markers(cds, group_cells_by="seurat_clusters", reference_cells=1000, cores=8)


library(dplyr)
top_specific_markers = marker_test_res %>%
  filter(fraction_expressing >= 0.10) %>%
  group_by(cell_group) %>%
  top_n(1, pseudo_R2)

top_specific_marker_ids = unique(top_specific_markers %>% pull(gene_id))



plot_genes_by_group(cds,
                    top_specific_marker_ids,
                    group_cells_by="seurat_clusters",
                    ordering_type="maximal_on_diag",
                    max.size=3)

top_specific_markers = marker_test_res %>%
  filter(fraction_expressing >= 0.10) %>%
  group_by(cell_group) %>%
  top_n(3, pseudo_R2)

top_specific_marker_ids = unique(top_specific_markers %>% pull(gene_id))

plot_genes_by_group(cds,
                    top_specific_marker_ids,
                    group_cells_by="seurat_clusters",
                    ordering_type="cluster_row_col",
                    max.size=3)
已知細(xì)胞類(lèi)型
#Annotate your cells according to type


colData(cds)$assigned_cell_type=as.character(clusters(cds))
colData(cds)$assigned_cell_type = dplyr::recode(colData(cds)$assigned_cell_type,
                                                "1"="Body wall muscle",
                                                "2"="Germline","3"="Unclassified neurons","4"="Seam cells",
                                                "5"="Coelomocytes",
                                                "6"="Pharyngeal epithelia",
                                                "7"="Vulval precursors",
                                                "8"="Non-seam hypodermis",
                                                "9"="Intestinal/rectal muscle",
                                                "10"="Touch receptor neurons",
                                                "11"="Unclassified neurons",
                                                "12"="flp-1(+) interneurons",
                                                "13"="Canal associated neurons")
plot_cells(cds, group_cells_by="cluster", color_cells_by="assigned_cell_type",group_label_size=4,cell_size=1.5)
手動(dòng)選擇細(xì)胞
cds_subset = choose_cells(cds)
#Warning: package ‘shiny’ was built under R version 3.5.3
軌跡推斷

Monocle3的目的是在實(shí)驗(yàn)中了解細(xì)胞是如何通過(guò)一個(gè)基因表達(dá)變化的生物程序進(jìn)行轉(zhuǎn)化的。每個(gè)細(xì)胞都可以看作是高維空間中的一個(gè)點(diǎn),每個(gè)維描述了不同基因的表達(dá)。識(shí)別基因表達(dá)變化的程序相當(dāng)于學(xué)習(xí)細(xì)胞在這個(gè)空間中遵循的軌跡。然而,分析中維度越多,學(xué)習(xí)軌跡就越困難。

幸運(yùn)的是,許多基因通常彼此共存,因此可以使用各種不同的算法來(lái)降低數(shù)據(jù)的維數(shù)。Monocle3通過(guò)reduce_dimension提供了兩種不同的降維算法(UMAP和tSNE)。兩者都使用cell_data_set對(duì)象和一些允許用于縮小空間的維度。您還可以提供一個(gè)模型公式,指示從數(shù)據(jù)中“減去”的一些變量(例如批ID或其他技術(shù)因素),這樣它就不會(huì)對(duì)軌跡產(chǎn)生影響。

函數(shù)learn_graph是繼preprocess_cds、reduce_dimensions和cluster_cells之后的軌跡構(gòu)建過(guò)程的第四個(gè)步驟。在learn_graph之后,通常調(diào)用order_cells。

> cds <- learn_graph(cds)
  |===============================================================================================================================================| 100%
  |===============================================================================================================================================| 100%
  |===============================================================================================================================================| 100%
> heand(colData(cds))

> head(colData(cds))
DataFrame with 6 rows and 11 columns
               orig.ident nCount_RNA nFeature_RNA        percent.mt RNA_snn_res.0.5 seurat_clusters      Size_Factor garnett_cluster   cell_type cluster_ext_type       assigned_cell_type
                 <factor>  <numeric>    <integer>         <numeric>        <factor>        <factor>        <numeric>       <logical> <character>      <character>              <character>
AAACATACAACCAC     pbmc3k       2419          779  3.01777594047127               1               1 1.10763503821696              NA     T cells      CD4 T cells             Coelomocytes
AAACATTGAGCTAC     pbmc3k       4903         1352  3.79359575769937               3               3 2.24503290300858              NA     Unknown          B cells     Unclassified neurons
AAACATTGATCAGC     pbmc3k       3147         1129 0.889736256752463               1               1 1.44097869585315              NA CD4 T cells      CD4 T cells               Seam cells
AAACCGTGCTTCCG     pbmc3k       2639          960  1.74308450170519               2               2 1.20837075893119              NA   Monocytes        Monocytes    flp-1(+) interneurons
AAACCGTGTATGCG     pbmc3k        980          521  1.22448979591837               6               6 0.44873184681795              NA    NK cells         NK cells Intestinal/rectal muscle
AAACGCACTGGTAC     pbmc3k       2163          781  1.66435506241331               1               1 0.99041529047676              NA     T cells      CD4 T cells               Seam cells

plot_cells(cds,
           color_cells_by = "assigned_cell_type",
           label_groups_by_cluster=FALSE,
           label_leaves=FALSE,
           label_branch_points=FALSE,
           group_label_size=4,cell_size=1.5)
選擇root
#Order the cells in pseudotime
cds = order_cells(cds)
plot_cells(cds,
           color_cells_by = "pseudotime",
           label_cell_groups=FALSE,
           label_leaves=TRUE,
           label_branch_points=TRUE,
           graph_label_size=1.5,
           group_label_size=4,cell_size=1.5)
# a helper function to identify the root principal points:
get_earliest_principal_node  <- function(cds, time_bin="Body wall muscle"){
  cell_ids <- which(colData(cds)[, "assigned_cell_type"] == time_bin)
  
  closest_vertex <-cds@principal_graph_aux[["UMAP"]]$pr_graph_cell_proj_closest_vertex
  closest_vertex <- as.matrix(closest_vertex[colnames(cds), ])
  root_pr_nodes <-
    igraph::V(principal_graph(cds)[["UMAP"]])$name[as.numeric(names(which.max(table(closest_vertex[cell_ids,]))))]
  
  root_pr_nodes
}
cds = order_cells(cds, root_pr_nodes=get_earliest_principal_node(cds))


plot_cells(cds,
           color_cells_by = "pseudotime",
           label_cell_groups=FALSE,
           label_leaves=FALSE,
           label_branch_points=FALSE,
           graph_label_size=1.5,
           group_label_size=4,cell_size=1.5)
3D 圖
#Working with 3D trajectories

cds_3d = reduce_dimension(cds, max_components = 3)
cds_3d = cluster_cells(cds_3d)
cds_3d = learn_graph(cds_3d)
cds_3d = order_cells(cds_3d, root_pr_nodes=get_earliest_principal_node(cds))

cds_3d_plot_obj = plot_cells_3d(cds_3d, color_cells_by="assigned_cell_type")
cds_3d_plot_obj

單個(gè)基因的擬時(shí)軌跡
AFD_genes = c("S100A9", "RPS27", "FCER1A")
AFD_lineage_cds = cds[AFD_genes,
                      clusters(cds) %in% c(11, 12, 5)]

plot_genes_in_pseudotime(AFD_lineage_cds,
                         color_cells_by="pseudotime",
                         min_expr=0.5)

細(xì)胞定義
setwd("D:\\Users\\Administrator\\Desktop\\Novo周運(yùn)來(lái)\\SingleCell\\scrna_tools")
library(garnett)
load("hsPBMC")#  下載好的訓(xùn)練模型
library(org.Hs.eg.db)
cds <- classify_cells(cds, hsPBMC,
                           db = org.Hs.eg.db,
                           cluster_extend = TRUE,
                           cds_gene_id_type = "SYMBOL")

> head(pData(cds))
DataFrame with 6 rows and 11 columns
               orig.ident nCount_RNA nFeature_RNA        percent.mt RNA_snn_res.0.5 seurat_clusters      Size_Factor garnett_cluster   cell_type cluster_ext_type       assigned_cell_type
                 <factor>  <numeric>    <integer>         <numeric>        <factor>        <factor>        <numeric>       <logical> <character>      <character>              <character>
AAACATACAACCAC     pbmc3k       2419          779  3.01777594047127               1               1 1.10763503821696              NA     T cells      CD4 T cells             Coelomocytes
AAACATTGAGCTAC     pbmc3k       4903         1352  3.79359575769937               3               3 2.24503290300858              NA     Unknown          B cells     Unclassified neurons
AAACATTGATCAGC     pbmc3k       3147         1129 0.889736256752463               1               1 1.44097869585315              NA CD4 T cells      CD4 T cells               Seam cells
AAACCGTGCTTCCG     pbmc3k       2639          960  1.74308450170519               2               2 1.20837075893119              NA   Monocytes        Monocytes    flp-1(+) interneurons
AAACCGTGTATGCG     pbmc3k        980          521  1.22448979591837               6               6 0.44873184681795              NA    NK cells         NK cells Intestinal/rectal muscle
AAACGCACTGGTAC     pbmc3k       2163          781  1.66435506241331               1               1 0.99041529047676              NA     T cells      CD4 T cells               Seam cells
> table(pData(cds)$cell_type)

        B cells           CD34+     CD4 T cells     CD8 T cells Dendritic cells       Monocytes        NK cells         T cells         Unknown 
            297               3             563             147              27             421             252             345             583 
plot_cells(cds,
           group_cells_by="partition",
           color_cells_by="cell_type",
           cell_size=1.5,
           group_label_size=5)

回歸分析

在本節(jié)中,我們將探索如何使用Monocle來(lái)發(fā)現(xiàn)根據(jù)幾種不同標(biāo)準(zhǔn)表達(dá)不同的基因。根據(jù)分析的復(fù)雜程度,對(duì)cell_data_set對(duì)象中的所有基因執(zhí)行差異表達(dá)分析可能需要幾分鐘到幾個(gè)小時(shí)。為了讓這個(gè)小插曲簡(jiǎn)單而快速,我們將使用一組小的基因。不過(guò),請(qǐng)放心,Monocle即使在大型實(shí)驗(yàn)中也可以分析數(shù)千個(gè)基因,這對(duì)于在您正在研究的生物學(xué)過(guò)程中發(fā)現(xiàn)動(dòng)態(tài)調(diào)控基因非常有用。

Monocle中的差異分析工具非常靈活。Monocle的工作原理是為每個(gè)基因擬合一個(gè)回歸模型。您可以指定此模型來(lái)考慮實(shí)驗(yàn)中的各種因素(時(shí)間、治療等)。例如,在胚胎數(shù)據(jù)中,細(xì)胞是在不同的時(shí)間點(diǎn)收集的。我們可以通過(guò)先對(duì)每個(gè)基因擬合一個(gè)廣義線性模型來(lái)測(cè)試上述基因的表達(dá)是否會(huì)隨著時(shí)間發(fā)生變化:

ciliated_genes = top_specific_marker_ids[0:4]
cds_subset = cds[rowData(cds)$gene_short_name %in% ciliated_genes,]
gene_fits = fit_models(cds_subset, model_formula_str = "~seurat_clusters")

# A tibble: 4 x 4
  gene_short_name model      model_summary status
  <fct>           <list>     <list>        <chr> 
1 S100A9          <speedglm> <smmry.sp>    OK    
2 S100A8          <speedglm> <smmry.sp>    OK    
3 RPS27           <speedglm> <smmry.sp>    OK    
4 FCER1A          <speedglm> <smmry.sp>    OK    

gene_fits是一個(gè)包含每個(gè)基因一行的tibble。模型列包含廣義線性模型對(duì)象,每個(gè)模型對(duì)象都旨在使用上面的方程解釋基因在細(xì)胞間的表達(dá)。參數(shù)model_formula a_str應(yīng)該是指定模型公式的字符串。您在測(cè)試中使用的模型公式可以包含colData表中作為列存在的任何術(shù)語(yǔ),包括Monocle在其他分析步驟中添加的那些列。例如,如果使用cluster_cells,可以使用cluster或partition(分別)作為模型公式來(lái)測(cè)試集群和分區(qū)之間不同的基因。您還可以包含多個(gè)變量,例如~胚。時(shí)間+批處理,這對(duì)于減去不需要的效果非常有用。

> fit_coefs = coefficient_table(gene_fits)
> fit_coefs
# A tibble: 36 x 10
   gene_short_name status term             estimate std_err test_val   p_value normalized_effect model_component   q_value
   <fct>           <chr>  <chr>               <dbl>   <dbl>    <dbl>     <dbl>             <dbl> <chr>               <dbl>
 1 S100A9          OK     (Intercept)      -1.78      0.196  -9.08   2.07e- 19           0       count           2.07e- 19
 2 S100A9          OK     seurat_clusters1  0.129     0.295   0.437  6.62e-  1           0.176   count           1.00e+  0
 3 S100A9          OK     seurat_clusters2  5.16      0.196  26.3    2.36e-135           7.36    count           7.08e-135
 4 S100A9          OK     seurat_clusters3  0.0943    0.330   0.286  7.75e-  1           0.129   count           1.00e+  0
 5 S100A9          OK     seurat_clusters4  0.00262   0.369   0.0071 9.94e-  1           0.00357 count           9.94e-  1
 6 S100A9          OK     seurat_clusters5  2.80      0.220  12.7    3.82e- 36           3.96    count           1.15e- 35
 7 S100A9          OK     seurat_clusters6 -0.223     0.503  -0.443  6.58e-  1          -0.301   count           1.00e+  0
 8 S100A9          OK     seurat_clusters7  2.68      0.309   8.68   7.04e- 18           3.79    count           1.41e- 17
 9 S100A9          OK     seurat_clusters8  1.70      0.621   2.74   6.16e-  3           2.39    count           1.85e-  2
10 S100A8          OK     (Intercept)      -2.33      0.230 -10.1    1.29e- 23           0       count           2.58e- 23
# ... with 26 more rows
> emb_time_terms = fit_coefs %>% filter(term == "seurat_clusters1")
> emb_time_terms
# A tibble: 4 x 10
  gene_short_name status term             estimate std_err test_val  p_value normalized_effect model_component  q_value
  <fct>           <chr>  <chr>               <dbl>   <dbl>    <dbl>    <dbl>             <dbl> <chr>              <dbl>
1 S100A9          OK     seurat_clusters1    0.129  0.295     0.437 6.62e- 1             0.176 count           1.00e+ 0
2 S100A8          OK     seurat_clusters1    0.190  0.341     0.558 5.77e- 1             0.251 count           1.00e+ 0
3 RPS27           OK     seurat_clusters1   -0.192  0.0174  -11.1   8.74e-28            -0.277 count           3.50e-27
4 FCER1A          OK     seurat_clusters1   -2.47   1.30     -1.90  5.70e- 2            -1.51  count           1.71e- 1
> 

現(xiàn)在,讓我們找出那些具有重要時(shí)間成分的基因。ent_table()計(jì)算每個(gè)系數(shù)在Wald檢驗(yàn)下是否顯著不同于零。默認(rèn)情況下,ent_table()使用Benjamini和Hochberg方法對(duì)這些p值進(jìn)行調(diào)整,用于多重假設(shè)檢驗(yàn)。這些調(diào)整值可以在q_value列中找到。我們可以對(duì)結(jié)果進(jìn)行過(guò)濾,控制假發(fā)現(xiàn)率如下:

emb_time_terms = fit_coefs %>% filter(term == "seurat_clusters1")

emb_time_terms %>% filter (q_value < 0.05) %>%
  select(gene_short_name, term, q_value, estimate)
plot_genes_violin(cds_subset[,], group_cells_by="cell_type", ncol=2) +
  theme(axis.text.x=element_text(angle=45, hjust=1))

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,527評(píng)論 6 544
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,687評(píng)論 3 429
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 178,640評(píng)論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 63,957評(píng)論 1 318
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 72,682評(píng)論 6 413
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 56,011評(píng)論 1 329
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,009評(píng)論 3 449
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 43,183評(píng)論 0 290
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,714評(píng)論 1 336
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 41,435評(píng)論 3 359
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,665評(píng)論 1 374
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,148評(píng)論 5 365
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,838評(píng)論 3 350
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 35,251評(píng)論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 36,588評(píng)論 1 295
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 52,379評(píng)論 3 400
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,627評(píng)論 2 380

推薦閱讀更多精彩內(nèi)容