前一段介紹過利用Windows系統的Ubuntu子系統搭建數據科學平臺,此番來介紹下除了jupyter之外的另外一個數據科學神器:RStudio Server。同時基于Ubuntu和RStudio Server搭建一個R語言的云平臺,用于數據分析。
1 RStudio Server簡介
RStudio Server 是 RStudio 公司打造的一款基于 Web 的開源編輯器。在實際的工程中,我們的服務器大多是基于Linux的,比如常見的 ubuntu、centos 等。這些操作系統有時并不提供圖形化界面,這時候RStudio的服務器版本就派上用場了。啟動RStudio Server后,進入在瀏覽器中進入某一個頁面后就可以像桌面版一樣使用RStudio編輯器。當R的代碼在服務器上出現bug了,線上的hotfix是在所難免的,這時候就需要用到 RStudio Server。--百度百科。
事實上就是一個Web版的RStudio。
2 R語言云平臺搭建
閑話少說,就來搭建平臺吧。首先,這次我是在我自己的辦公室的工作站上搭建,因此受到局域網限制,我主要是方便于使用辦公室的工作站,某種意義上是個偽云平臺。如果真的想搭建一個網絡訪問式的,必須購買服務器。阿里云等都是可以的。其次除了搭建平臺外,由于平常主要在做一些空間分析類的處理,因此搭建完成后還會有一個小的樣例代碼就當是hello world。
事實上平時使用工作站時,通常就是利用筆記本和XShell連接,然后就開始像六指琴魔一樣瘋狂敲擊鍵盤,尤其是vim之類的編輯器。
當然有些時候我們需要所見即所得的分析。因此搭建一個平臺的需求就出來了?,F在Xshell搭建平臺。第一步是事實上是安裝基礎的R語言。這一步我們之前的博客已經介紹過了,不了解的同學可以看一下這篇博客。
接著就安裝gdebi-core。在Xshell里輸入如下代碼。
sudo apt-get install gdebi-core
接著下載RStudio Server的deb文件。
wget https://download2.rstudio.org/rstudio-server-1.1.447-amd64.deb
下載完畢后,用gdebi安裝并運行即可。
sudo gdebi rstudio-server-1.1.447-amd64.deb
可以輸入命令查看后臺RStudio Server運行情況。
ps -fel | grep rstudio-server
這里不建議用root賬戶來使用RStudio,類似之前搭建WSL里的數據科學環境,這里添加一個普通用戶來使用。
sudo adduser rstudio
接著就需要輸入密碼,根據自己需求輸入密碼,這就是等等頁面里需要輸入的用戶和密碼。這一步結束之后,可以直接打開對應的IP地址加上8787,RStudio默認在8787端口運行。
http://<server-ip>:8787
登陸即可。
3 Hello World
當然需求展示一下一個柵格數據?;趓aster包,R語言里的神包。因此需要先安裝raster,而此包又依賴于rgdal,而rgdal則要求必須安裝GDAL。GDAL版本也有要求,因此這一塊配置也是個需要花費一些功夫的地方。當然GDAL本身就是一個很棒的開源GIS庫。這里就列一下資源。關于GDAL安裝配置等以后找個時間專門講。
library(raster)
filerall <- raster("/home/Workspace/python/Xiamenair/data/pm25halfyear.tif")
spplot(filerall)
參考資料:
Configure Rstudio Server on Ubuntu 16.04
Urban Data Science — Ex 1: Tools
python GDAL 2.1 installation on Ubuntu 16.04
python GDAL 2.1 installation on Ubuntu 16.04