前言
這是代謝組學(xué)數(shù)據(jù)分析的一個(gè)R包,包括用于代謝組學(xué)數(shù)據(jù)分析、可視化和功能注釋等眾多功能。最近有同事在集群中搭建蛋白和代謝流程,安裝這個(gè)包出現(xiàn)了問題,于是我折騰了一上午。
這個(gè)包的介紹在:https://github.com/xia-lab/MetaboAnalystR,安裝確實(shí)還比較復(fù)雜,依賴的東西太多太多。廢話不多說,記錄下安裝歷程。
安裝過程
首先最好是已經(jīng)安裝了自己的R版本(非root),比如我的是R-3.5.2。然后進(jìn)入R中,依照文檔給的順序依次安裝:
第一步:安裝依賴包
install.packages("pacman")
library(pacman)
pacman::p_load(Rserve, ellipse, scatterplot3d, Cairo, randomForest, caTools, e1071, som, impute, pcaMethods, RJSONIO, ROCR, globaltest, GlobalAncova, Rgraphviz, preprocessCore, genefilter, pheatmap, SSPA, sva, Rcpp, pROC, data.table, limma, car, fitdistrplus, lars, Hmisc, magrittr, methods, xtable, pls, caret, lattice, igraph, gplots, KEGGgraph, reshape, RColorBrewer, tibble, siggenes, plotly, xcms, CAMERA, fgsea, MSnbase, BiocParallel, metap, reshape2, scales)
這里很耗時(shí),慢慢等吧。也不會(huì)盯著它看哪一步有么有報(bào)錯(cuò)。
第二步:安裝困難
# Step 1: Install devtools
install.packages("devtools")
library(devtools)
### For users with devtools > v2.0.0 ###
# Step 2: Install MetaboAnalystR without documentation
devtools::install_github("xia-lab/MetaboAnalystR", build = TRUE, build_opts = c("--no-resave-data", "--no-manual", "--no-build-vignettes"))
繼續(xù)慢慢等吧,等著報(bào)錯(cuò)吧。。。果不其然,出現(xiàn)以下錯(cuò)誤:
說沒有安裝
xcms, CAMERA, MSnbase
等R包,那就一個(gè)個(gè)裝唄。又出現(xiàn)一堆錯(cuò)誤,總而言之,缺少的那些包都依賴于這個(gè)ncdf4
這個(gè)R包,那就繼續(xù)裝吧。
直接裝報(bào)錯(cuò),按它提示,用
R CMD INSTALL --configure-args="--with-nc-config=/home/joe/bin/nc-config" ncdf4
也不行,原因是沒有安裝nc-config
,Linux環(huán)境中which nc-config
,是找不到的,說明我的環(huán)境中確實(shí)沒有安裝這玩意。
于是我去查了下這究竟是個(gè)什么玩意。NetCDF
全稱為network Common Data Format
,中文譯法為“網(wǎng)絡(luò)通用數(shù)據(jù)格式”,這是一種文件格式的標(biāo)準(zhǔn)。netcdf文件開始的目的是用于存儲(chǔ)氣象科學(xué)中的數(shù)據(jù),現(xiàn)在已經(jīng)成為許多數(shù)據(jù)采集軟件的生成文件的格式。
這其實(shí)是一個(gè)庫,包括C,C++,Java等等,下載網(wǎng)址:https://www.unidata.ucar.edu/downloads/netcdf/index.jsp
文件很小,好像還不太好下下來,我搭了個(gè)梯子到美國才下下來,下的是這一個(gè):
經(jīng)驗(yàn)告訴我們,非root直接在Linux中源碼安裝沒那么順利:
cd netcdf-c-4.7.0
./configure --prefix=/your/path/
make check
make install
用不到三板斧,安裝就已經(jīng)報(bào)錯(cuò)了,具體什么的我找不到了,大概就是缺少什么什么庫。
網(wǎng)上查了些資料,說是netcdf
依賴zlib
和hdf5
,前者我已經(jīng)安裝了,指定路徑就行,后者也是一個(gè)用于存儲(chǔ)和分發(fā)科學(xué)數(shù)據(jù)的一種自我描述、多對(duì)象文件格式的軟件。ok,那就先安裝hdf5吧(https://support.hdfgroup.org/HDF5/),我裝的是最新的這個(gè):
三板斧繼續(xù):
cd hdf5-1.10.5
./configure --with-zlib=/zlib/path --prefix=/hdf5/path -enable-fortran -enable-cxx
make check
make install
#PS. hdf5也是依賴zlib庫的,所以必須要指定--with-zlib=/zlib/path,否則會(huì)報(bào)錯(cuò)相關(guān)庫文件找不到。
成功安裝后,接下來安裝netcdf:
CPPFLAGS=-I/hdf5/path/include LDFLAGS=-L/hdf5/path/lib ./configure --prefix=/netcdf/path --enable-netcdf-4 --enable-largefile --disable-dap
make check
make install
#PS. 必須指定CPPFLAGS=-I/hdf5/path//include LDFLAGS=-L/hdf5/path/lib,否則報(bào)錯(cuò)提示相關(guān)文件找不到
這兩個(gè)軟件都要裝很久很久,尤其是check那一步,需要耐心,最后終于搞定!
安裝成功后,安裝路徑下會(huì)有4個(gè)文件夾,如下圖,忙活這么多,就只為了這個(gè)nc-config
文件。我們只是臨時(shí)用一下這個(gè)破玩意,就不添加到環(huán)境變量了。
第三步:正式安裝
直接`install.packages("ncdf4")是不行的(我也不知道為什么,因?yàn)橹付ú涣薾c-config吧),于是下載源碼安裝:
R CMD INSTALL ncdf4_1.13.tar.gz --configure-args="--with-nc-config=/netcdf/path/bin/nc-config"
至此,xcms、CAMERA、MSnbase
等依賴的ncdf4
包安裝成功,下面就暢通無阻,將缺少的依賴包全部裝上。最后
devtools::install_github("xia-lab/MetaboAnalystR", build = TRUE, build_opts = c("--no-resave-data", "--no-manual", "--no-build-vignettes"))
安裝成功!
Ref:https://blog.csdn.net/laomai/article/details/1740747
https://blog.csdn.net/Mrhiuser/article/details/69603826
http://www.lxweimin.com/p/90ecc0580bd1