最近在用R學習單細胞轉錄組分析,讓我比較頭大的是seruat包,這個包的2.0+版本與3.0+版本差異真的很大。
參考視頻是bilibili上‘生信技能樹’的教學視頻,用的是seruat2.3.4(下文中簡稱2+),但是我在安裝的時候是seruat3.1.4(下文中簡稱3+),這就導致R包自帶的很多功能出現了誤差,下面就介紹幾個我今天接觸到的,自己理解的一些區別,請大神批評指正。
首先是構建seruat對象,需要的參數還是counts和meta矩陣,
2.0+是這樣的:S=CreateSeuratObject(raw.data = counts,
? ? ? ? ? ? ? ? ? ? ? ? ? ? project = "NA",
? ? ? ? ? ? ? ? ? ? ? ? ? ? meta.data =meta,
? ? ? ? ? ? ? ? ? ? ? ? ? ? min.cells = 4,
? ? ? ? ? ? ? ? ? ? ? ? ? ? min.genes = 200)
3.0+是這樣的:S=CreateSeuratObject(counts,
? ? ? ? ? ? ? ? ? ? ? ? ? project = "NA",
? ? ? ? ? ? ? ? ? ? ? ? ? assay = "RNA",
? ? ? ? ? ? ? ? ? ? ? ? ? min.cells = 4,? ##cells 過濾
? ? ? ? ? ? ? ? ? ? ? ? ? min.features = 2000,? ? ? ? ? ? ? ##genes 過濾
? ? ? ? ? ? ? ? ? ? ? ? ? names.delim = "_",
? ? ? ? ? ? ? ? ? ? ? ? ? meta.data = meta)
區別是3.0+沒有row.data,直接添加counts,min.genes變成min.features,得到的seruat對象中沒有了row.counts矩陣,只剩meta.data矩陣,原本的row.counts數據直接用seruat對象代替了。如原來的rownames(S@row.counts)變成rownames(S)。這個在計算percent.ercc等時會有用到。
第二個就是很多函數都發生了改變,所以每次看到函數都要先?一下
2.0+? ? ? ? ? ? ? ? ? ? ? ? ? ? 3.0+
GenePlot? ? ? ? ? ? ? ? ? ? FeatureScatter
CellPlot? ? ? ? ? ? ? ? ? ? ? CellScatter
FindVariableGenes? ? FindVariableFeatures
...還有一些還在繼續探索中
tips:今天下載R軟件的時候發現一個能使下載速度飛起來的方法,那就是利用鏡像
比如:install_github("immunogenomics/harmony")
#http://cran.r-project.org/bin/windows/Rtools/.下載的時候只有幾k每秒,屢次懷疑家里wifi是不是被限流了,淚奔
#https://mirrors.tuna.tsinghua.edu.cn/CRAN/bin/windows/Rtools/利用鏡像下載軟件速度飛快