前言
還記得Immugent最開(kāi)始做數(shù)據(jù)挖掘時(shí),最常做的分析之一就是用ESTIMATE包來(lái)評(píng)估腫瘤組織的免疫浸潤(rùn)情況,雖然得到的結(jié)果只有stromal score,immune score,estimate score和pirity score四個(gè)值,但是其準(zhǔn)確性是相當(dāng)高的!當(dāng)然后面出現(xiàn)了很多新型的反卷積軟件,細(xì)胞類型頁(yè)越來(lái)越細(xì)化,但是ESTIMATE包依然頻繁出現(xiàn)在最新發(fā)表的各類文章中。
ESTIMATE包是從表達(dá)數(shù)據(jù)推斷腫瘤純度的基礎(chǔ),但缺乏相關(guān)介紹文檔,而且有時(shí)它的功能在做得不夠的情況下越界。tidyestimate包是ESTIMATE的更新,目的是在維護(hù)這個(gè)包的優(yōu)秀功能時(shí),增加它的文檔和功能范圍。
下面Immugent就來(lái)介紹一下tidyestimate包。。。
代碼流程
首先回顧一下優(yōu)秀的ESTIMATE包,它最初的文章在2013年發(fā)表在NC上,起點(diǎn)還是挺高的。
這么優(yōu)秀的包,當(dāng)然引用率是非常客觀的,截止到目前已經(jīng)被4000+的文章引用過(guò)了。
install.packages("tidyestimate")
#or
devtools::install_github("KaiAragaki/tidy_estimate")
這次更新的特點(diǎn)主要包括以下內(nèi)容:
那么下面就開(kāi)始探索一下這個(gè)新包吧!
library(tidyestimate)
dim(ov)
#> [1] 17256 10
head(ov)[,1:5]
#> s516 s518 s519 s520 s521
#> C9orf152 4.8815 4.5757 3.7395 3.6960 4.1597
#> ELMO2 7.2981 7.5554 7.5332 7.3824 7.3079
#> CREB3L1 5.5692 5.7004 5.9597 5.7700 5.2190
#> RPS11 13.3899 13.8488 13.6429 13.6546 13.5698
#> PNMA1 9.3480 10.0092 10.4310 9.5399 9.6423
#> MMP2 7.6182 8.0369 8.9551 10.3875 7.4141```
這個(gè)新包繼續(xù)延續(xù)之前之前簡(jiǎn)便的特點(diǎn),運(yùn)行起來(lái)也很簡(jiǎn)便,一行代碼搞定。
scores <- ov |>
filter_common_genes(id = "hgnc_symbol", tell_missing = FALSE, find_alias = TRUE) |>
estimate_score(is_affymetrix = TRUE)
> 461 of 488 missing genes found matches using aliases.
>
> Found 10364 of 10391 genes (99.74%) in your dataset.
> Number of stromal_signature genes in data: 141 (out of 141)
> Number of immune_signature genes in data: 141 (out of 141)
scores
> sample stromal immune estimate purity
> 1 s516 -285.49841 165.75062 -119.7478 0.8323791
> 2 s518 -429.16931 99.71302 -329.4563 0.8490421
> 3 s519 -60.98619 -368.70314 -429.6893 0.8567232
> 4 s520 1927.51431 2326.15984 4253.6742 0.3348246
> 5 s521 -673.84954 141.72775 -532.1218 0.8643812
> 6 s522 1447.95517 1166.51854 2614.4737 0.5497248
> 7 s523 -271.15756 -928.44921 -1199.6068 0.9094242
> 8 s525 965.61804 1310.27775 2275.8958 0.5905450
> 9 s526 545.99467 2149.10473 2695.0994 0.5398002
> 10 s527 -710.44370 1303.08009 592.6364 0.7699846
They can also be plotted in context of the Affymetrix profiled tumors used to generate the ESTIMATE model:
scores |>
plot_purity(is_affymetrix = TRUE)
A more detailed version of this example can be found in the vignette of this package.
* * *
## 說(shuō)在最后
Immugent已經(jīng)對(duì)tidyestimate包做過(guò)一些簡(jiǎn)單的測(cè)試,在沒(méi)有降低準(zhǔn)確性的同時(shí),確實(shí)提速了不少。但是有一說(shuō)一,tidyestimate包其實(shí)還可以做一些別的方面的升級(jí),比如增加數(shù)據(jù)的適用性,或者聯(lián)合其它分析流程,畢竟現(xiàn)在主打的就是一個(gè)集合與多功能。
好啦,本次介紹到這里就結(jié)束啦,我們下次再會(huì)~~