對于機器學習,到底該選擇哪種編程語言?

姓名:郭金? 學號:17101223407

參考鏈接:Indeed.com

【嵌牛導讀】:本文根據一些數據進行分析帶大家了解機器學習的學習應該適合的語言的一些建議。

【嵌牛鼻子】:機器學習、編程語言

【嵌牛提問】:? 開發者到底應該學習哪種編程語言才能獲得機器學習或數據科學這類工作呢?

【嵌牛正文】:

? ? 這是一個非常重要的問題。我們在許多論壇上都討論過這個問題。今天,我將給出我自己的答案并解釋其中原因,但我們首先看一些數據。畢竟,這是機器學習者和數據科學家應該做的事情:看數據,而不是看觀點。

? ? ? 讓我們看一些數據。我將在Indeed.com上使用趨勢搜索,它可以根據時間搜尋實際工作機會中特定的條款。這表明了雇主們正在尋找擁有該技能的人才。然而,請注意,這并不是一項有效使用技能的民意調查,這種指標更能體現技能的受歡迎程度。

? ? ? 話不多說,上數據。我搜索關鍵詞“機器學習”和“數據科學”一,搜索選項包括編程語言Java、C、C+++、JavaScript,還包括了Python和R,因為我知道它在機器學習和數據科學方面很受歡迎,當然還有Scala,考慮到它與Spark的關系,再加上Julia,一些開發者認為這是編程界的“the next big thing”。運行這個查詢,我們得到的數據如下:

圖片發自簡書App

? ? ? 然后,我用關鍵詞“機器學習”重新搜索時,又得到了類似的數據,如下:

圖片發自簡書App

? ? ? 那么,我們能從這些數據中得到什么啟示呢?

? ? ? 首先,我們看到并不是“一招通吃”。在這種情況下,各種機器學習編程語言都很受歡迎。

? ? ? 其次,所有這些編程語言都在急劇增長,反映在過去幾年里,企業對機器學習和數據科學的關注和需求正在急速增加。

? ? 第三,Python明顯領先其它編程語言,其次是Java,然后是R,再然后是C++。Python對Java的領先優勢正在增加,而Java在R上的領先地位正在下降。必須承認,我很驚訝地看到Java名列第二;我本來是以為是R語言。

? ? ? 第四,Scala的增長令人印象深刻。它在三年前幾乎是不存在的,現在和這些成熟的編程語言幾乎在同一個層面。當我們切換到Indeed.com上的數據的相對視圖時,這更容易發現。

圖片發自簡書App

? ? ? 第五,Julia的受歡迎程度雖然不明顯,但肯定有上升的趨勢。Julia將成為一種流行機器學習和數據科學編程語言嗎?未來會告訴你。

? ? ? 如果我們忽略Scala和Julia,以便能夠聚焦其他編程語言的增長,那么我們毫無疑問可以確認:Python和R的增長速度要快于通用語言。

圖片發自簡書App


? ? ? 考慮到增長率的差異,R的受歡迎程度可能很快就會超過Java。

當我們專注于深度學習這個問題時,數據是完全不同的:

圖片發自簡書App


? ? 這時,Python仍然是領導者,但C++現在是第二,然后是Java,而C在第四,R只在第5。這里顯然強調了高性能計算語言。Java正在快速發展。它可以很快達到第二名,就像一般的機器學習一樣。R不會很快接近頂部。令我驚訝的是Lua的缺席,盡管它在一個主要的深度學習框架(orch)中使用,而Julia不存在。

? ? ? 到這時,到底哪種語言才是最受歡迎的編程語言呢?答案應該很清楚了。當涉及到機器學習和數據科學工作時,Python、Java和R是最流行的技能。如果你想專注于深度學習,而不是一般的機器學習,那么,在某種程度上來說C++、C也是值得考慮的。然而,請記住,這只是看待問題的一種方式。如果你想找一份工作,或者你只是想在業余時間學習機器學習和數據科學,你可能會得到不同的答案。

? ? 我的個人答案呢?除了有許多頂級機器學習框架的支持之外,Python對我來說很適合,因為我有計算機科學的背景。對于開發新的算法,我也會感到很舒服,因為我的大部分職業生涯都是用這種語言編程的。但這就是我,有不同背景的人可能會覺得用另一種語言更好。一個擁有有限編程技能的統計學家肯定會更喜歡R。一個強大的Java開發人員可以使用他最喜歡的語言,因為有大量的Java API的開放源代碼。對于這些圖表上的任何一種語言,都可以有類似的例子。

? ? ? 因此,我的建議是,在花大量時間學習一門語言之前,根據自己的情況來決定選擇哪種編程語言,切記千萬不可跟風。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容