各位菜鳥團的小伙伴咱們又見面了,我是青鹽,一只努力學習,并致力于在新疆推廣生信的菜鳥。
上周在Jimmy老師的指導下練習了一篇“如何使用R語言找出某一個通路的所有基因名字”,推文發出后,發現有很多初學的伙伴對R語言不是很熟希。
我從13年開始學習R語言,到現在應用R軟件大概有5年多了,但主要偏重于生物統計和數據分析方面的應用,并沒有涉及到生信方面的內容。
最近放假把Jimmy老師在B站分享的“生信人應該這樣學R語言系列”視頻看完了,很漲知識,也很感謝Jimmy老師的無私分享。
之前也跟大家說過,我會每周至少更一篇學習筆記,說到就要做到,接下來的一段時間我會結合在B站的學習內容,分享一些R語言的基礎知識。
今天主要簡單的介紹一下R軟件的安裝,Rstudio的介紹以及包的介紹,與初學R語言的伙伴們一起學習,共同進步。
一、R語言起源
R語言的前身是S語言,S語言誕生于John M.Chambers領導的貝爾實驗室統計研究部。1995年由新西蘭Auckland大學統計系的Robert Gentleman和Ross Ihaka基于S語言合作開發了一門新的語言,根據二人的名字首字母,將其命名為R。
R是開源軟件,代碼全部公開,對所有人免費。它可以在多種操作系統下運行,例如:Windows、linux、Mac和Unix等。R需要輸入命令,可以編寫函數和腳本進行批處理運算,語法簡單靈活。
二、R軟件下載和安裝
R軟件可以在官網 https://www.r-project.org/ 上免費下載。Linux、Mac OS X和Windows都有相應編譯好的二進制版本。點擊 download R 系統匹配版本。目前最新版本為R-3.5.2。
下載好了R軟件之后,安裝都是傻瓜式的,一路選擇下一步執行就可以。安裝成功后,桌面上會出現 R 圖標,點擊打開 R,出現 R 的 GUI 界面,包括菜單欄、工具欄和 R 的控制臺。在控制臺可以輸入R代碼,執行相關操作。
三、Rstudio 介紹
由于R軟件自身攜帶的編輯器不太好用,這里推薦Rstudio,它是專門用于R語言環境的IDE。Rstudio可以從其官網 http://www.rstudio.com/ 上免費下載安裝。
從上圖可以看出,最上面是Rstudio的工具欄,工具欄下面總共有四個工作區域,左上角是代碼編寫區,左下角也可以編寫代碼,同時也能輸出運算結果。右上角是workspace和歷史記錄。右下角有四個主要功能模塊,Files是查看當前workspace下的文件,Plots顯示繪圖結果,Packages顯示已經安裝的包,點擊選中左側的方框載入包,Help是用來查看幫助文檔。
四、R程序包介紹
之所以安裝R程序包,是因為特定的分析功能,要用相應的程序包來實現。R程序包是多個函數的集合,具有詳細說明和示例。Window下R程序包是已經編譯好的zip包,Mac下為編譯好的dmg包。每個程序包包含R函數、數據、幫助文件、描述文件等。
目前在R官網上有13670個程序包,涵蓋了基礎統計學,社會學、經濟學、生態學、地理學、醫學統計學以及生物信息學等諸多方面。
電腦上存儲包的目錄稱為庫(library),運行函數library() 可以顯示庫中有哪些程序包,使用函數.libPaths()顯示庫的位置。R語言自帶了一系列基礎包,例如base、datasets、utils、grDevices、graphics、stats以及methods等,它們提供了種類繁多的默認函數和數據集。
如果已經連接到互聯網,可以使用函數install.packages()進行安裝,在括號中輸入要安裝的程序包名稱,選擇鏡像后,程序將自動下載并安裝程序包。也可以在工具欄點擊Tools菜單下的 Install.Packages進行安裝。
包安裝好了以后,需要運行library()函數載入包,才能使用里面的函數和數據集。使用函數search()可以查看載入內存的R程序包,使用函數update.packages()可以對已經安裝的程序包進行更新。
參考文獻:
[1]https://search.bilibili.com/all?keyword=生信技能樹&from_source=banner_suggest&spm_id_from=333.334.b_62616e6e65725f6c696e6b.2