tidyestimate:給免疫浸潤(rùn)程度的評(píng)估提提速

前言

還記得Immugent最開(kāi)始做數(shù)據(jù)挖掘時(shí),最常做的分析之一就是用ESTIMATE包來(lái)評(píng)估腫瘤組織的免疫浸潤(rùn)情況,雖然得到的結(jié)果只有stromal score,immune score,estimate score和pirity score四個(gè)值,但是其準(zhǔn)確性是相當(dāng)高的!當(dāng)然后面出現(xiàn)了很多新型的反卷積軟件,細(xì)胞類型頁(yè)越來(lái)越細(xì)化,但是ESTIMATE包依然頻繁出現(xiàn)在最新發(fā)表的各類文章中。

ESTIMATE包是從表達(dá)數(shù)據(jù)推斷腫瘤純度的基礎(chǔ),但缺乏相關(guān)介紹文檔,而且有時(shí)它的功能在做得不夠的情況下越界。tidyestimate包是ESTIMATE的更新,目的是在維護(hù)這個(gè)包的優(yōu)秀功能時(shí),增加它的文檔和功能范圍。

下面Immugent就來(lái)介紹一下tidyestimate包。。。


代碼流程

首先回顧一下優(yōu)秀的ESTIMATE包,它最初的文章在2013年發(fā)表在NC上,起點(diǎn)還是挺高的。

image.png

這么優(yōu)秀的包,當(dāng)然引用率是非常客觀的,截止到目前已經(jīng)被4000+的文章引用過(guò)了。


image.png
install.packages("tidyestimate")
#or
devtools::install_github("KaiAragaki/tidy_estimate")

這次更新的特點(diǎn)主要包括以下內(nèi)容:

image.png

那么下面就開(kāi)始探索一下這個(gè)新包吧!

library(tidyestimate)
dim(ov)
#> [1] 17256    10
head(ov)[,1:5]
#>             s516    s518    s519    s520    s521
#> C9orf152  4.8815  4.5757  3.7395  3.6960  4.1597
#> ELMO2     7.2981  7.5554  7.5332  7.3824  7.3079
#> CREB3L1   5.5692  5.7004  5.9597  5.7700  5.2190
#> RPS11    13.3899 13.8488 13.6429 13.6546 13.5698
#> PNMA1     9.3480 10.0092 10.4310  9.5399  9.6423
#> MMP2      7.6182  8.0369  8.9551 10.3875  7.4141```

這個(gè)新包繼續(xù)延續(xù)之前之前簡(jiǎn)便的特點(diǎn),運(yùn)行起來(lái)也很簡(jiǎn)便,一行代碼搞定。

scores <- ov |>
filter_common_genes(id = "hgnc_symbol", tell_missing = FALSE, find_alias = TRUE) |>
estimate_score(is_affymetrix = TRUE)

> 461 of 488 missing genes found matches using aliases.

>

> Found 10364 of 10391 genes (99.74%) in your dataset.

> Number of stromal_signature genes in data: 141 (out of 141)

> Number of immune_signature genes in data: 141 (out of 141)

scores

> sample stromal immune estimate purity

> 1 s516 -285.49841 165.75062 -119.7478 0.8323791

> 2 s518 -429.16931 99.71302 -329.4563 0.8490421

> 3 s519 -60.98619 -368.70314 -429.6893 0.8567232

> 4 s520 1927.51431 2326.15984 4253.6742 0.3348246

> 5 s521 -673.84954 141.72775 -532.1218 0.8643812

> 6 s522 1447.95517 1166.51854 2614.4737 0.5497248

> 7 s523 -271.15756 -928.44921 -1199.6068 0.9094242

> 8 s525 965.61804 1310.27775 2275.8958 0.5905450

> 9 s526 545.99467 2149.10473 2695.0994 0.5398002

> 10 s527 -710.44370 1303.08009 592.6364 0.7699846


They can also be plotted in context of the Affymetrix profiled tumors used to generate the ESTIMATE model:

scores |>
plot_purity(is_affymetrix = TRUE)


A more detailed version of this example can be found in the vignette of this package.

* * *

## 說(shuō)在最后

Immugent已經(jīng)對(duì)tidyestimate包做過(guò)一些簡(jiǎn)單的測(cè)試,在沒(méi)有降低準(zhǔn)確性的同時(shí),確實(shí)提速了不少。但是有一說(shuō)一,tidyestimate包其實(shí)還可以做一些別的方面的升級(jí),比如增加數(shù)據(jù)的適用性,或者聯(lián)合其它分析流程,畢竟現(xiàn)在主打的就是一個(gè)集合與多功能。

好啦,本次介紹到這里就結(jié)束啦,我們下次再會(huì)~~
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容