關于R的介紹
開源語言R,目的是專注于提供更好和更人性化的方式做數據分析、統計和圖形模型的語言。起初R主要是在學術和研究使用,但近來企業界發現R也很不錯。這使得中的R成為企業中使用的全球發展最快的統計語言之一。
R的主要優勢是它有一個龐大的社區,通過郵件列表,用戶貢獻的文檔和一個非常活躍的堆棧溢出組提供支持。還有CRAN鏡像,一個用戶可以很簡單地創造的一個包含R包的知識庫。這些包有R里面的函數和數據,各地的鏡像都是R網站的備份文件,完全一樣,用戶可以可以選擇離你最近的鏡像訪問最新的技術和功能,而無需從頭開發。
如果你是一個有經驗的程序員,你可以不會覺得使用R可以提高效率,但是,你可能會發現學習R經常會遇到瓶頸。幸運的是現在的資源很多。
關于Python的介紹
Python是由Guido van Rossem創建于1991年,并強調效率和代碼的可讀性。希望深入的數據分析或應用統計技術的程序員是Python的主要用戶。
當你越需要在工程環境中工作,你會越喜歡Python。它是一種靈活的語言,在處理一些新東西上表現很好,并且注重可讀性和簡單性,它的學習曲線是比較低的。
和R類似,Python也有包,pypi是一個Python包的倉庫,里面有很多別人寫好的Python庫。
Python也是一個大社區,但它是一個有點比較分散,因為它是一個通用的語言。然而,Python自稱他們在數據科學中更占優勢地位:預期的增長,更新穎的科學數據應用的起源在這里。
R和Python:數字的比較
在網上可以經常看到比較R和Python人氣的數字,雖然這些數字往往就這兩種語言是如何在計算機科學的整體生態系統不斷發展,但是很難并列進行比較。主要的原因是,R僅在數據科學的環境中使用,而Python作為一種通用語言,被廣泛應用于許多領域,如網絡的發展。這往往導致排名結果偏向于Python,而且從業者工資會較低。
如果你看一下最近的民意調查,在數據分析的編程語言方面,R是明顯的贏家。
有越來越多的人從研發轉向Python。此外,有越來越多的公司使用這兩種語言來進行組合。
如果你打算從事數據行業,你用好學會這兩種語言。招聘趨勢顯示這兩個技能的需求日益增加,而工資遠高于平均水平。
R:優點和缺點
優點
可視化能力強
可視化通常讓我們更有效地理解數字本身。R和可視化是絕配。一些必看的可視化軟件包是ggplot2,ggvis,googleVis和rCharts。
完善的生態系統
R具有活躍的社區和一個豐富的生態系統。R包在CRAN,Bioconductor的和Github上。您可以通過Rdocumentation搜索所有的R包。
用于數據科學
R由統計學家開發,他們可以通過R代碼和包交流想法和概念,你不一定需要有計算機背景。此外企業界也越來越接受R。
缺點
R比較緩慢
R使統計人員的更輕松,但你電腦的運行速度可能很慢。雖然R的體驗是緩慢的,但是有多個包來提高的r性能:pqR,renjin,FastR, Riposte 等等。
R不容易深入學習
R學習起來并不容易,特別是如果你要從GUI來進行統計分析。如果你不熟悉它,即使發現包可能會非常耗時。
Python:優點和缺點
優點
IPython Notebook
IPython Notebook使我們更容易使用Python進行數據工作,你可以輕松地與同事共享Notebook,而無需他們安裝任何東西。這大大減少了組織代碼,輸出和注釋文件的開銷。可以花更多的時間做實際的工作。
通用語言
Python是一種通用的語言,容易和直觀。在學習上會比較容易,它可以加快你寫一個程序的速度。此外,Python測試框架是一個內置的,這樣可以保證你的代碼是可重復使用和可靠的。
一個多用途的語言
Python把不同背景的人集合在一起。作為一種常見的、容易理解,大部分程序員都懂的,可以很容易地和統計學家溝通,你可以使用一個簡單的工具就把你每一個工作伙伴都整合起來。
缺點
可視化
可視化是選擇數據分析軟件的一個重要的標準。雖然Python有一些不錯的可視化庫,如Seaborn,Bokeh和Pygal。但相比于R,呈現的結果并不總是那么順眼。
是不是大家猶豫了,不知道自己該學習什么呢:
大家作為一個數據工作者,你需要在工作中選擇最適合需要的語言。在學習之前問清楚自己:
你想解決什么問題就可以了。
學好python你需要一個良好的環境,一個優質的開發交流群,群里都是那種相互幫助的人才是可以的,我有建立一個python學習交流群,在群里我們相互幫助,相互關心,相互分享內容,這樣出問題幫助你的人就比較多,群號是301,還有056,最后是051,這樣就可以找到大神聚合的群,如果你只愿意別人幫助你,不愿意分享或者幫助別人,那就請不要加了,你把你會的告訴別人這是一種分享。
學習是對自己最好的投資,而機會屬于有準備的人,這是一個看臉的時代,但最終拼的是實力。人和人之間的差距不在于智商,而在于如何利用業余時間,所以沒有等出來的輝煌,只有干出來的精彩。其實只要你想學習,什么時候開始都不晚,不要擔心這擔心那,你只需努力,剩下的交給時間,而你之所以還沒有變強,只因你還不夠努力,要記得付出不亞于任何人的努力。