前言
我不知道大家要花多長時間學習機器學習?前文我們已經介紹的Python爬蟲和數據分析的知識,如果只是做入門,平均每門一個月,問題也是不大的;但大部分覺得機器學習很難學,需要很好的數學基礎,現在畢業那么久,看到數學公式就暈,機器學習可能從入門直接到放棄,花很長時間都學不會。
大家可能會去百度或者Google搜索,如何學習機器學習。大部分的推薦都是這些:
- 視頻:吳恩達大佬,臺大李宏毅的視頻
- 書:西瓜書和統計學習方法
這些都是大佬們的精髓,內容質量都是很高的。但是這些真的適合所有新手么?不見得,這些書中大量的推導公式,其實對于意志不堅定者,是很難啃下去的。
個人學習路徑
基于此,分享下個人的學習Python機器學習的經驗給大家。大家應該都知道二八法則,二八法則起初的研究是在經濟學當中的。現在也用于教育行業,說的就是,學習一個行業最重要的20%知識點,可以解決80%的行業問題。
對于我這個學林學的掃地僧而已,Python機器學習最主要的是用于寫論文。我就會問自己,是不是要把整個機器學習算法都推導一遍?其實不需要,我只需要了解算法,并會應用到我的林業數據上即可。
那對于以后想從事機器學習方面的人來說,其實這種方法也是實用的。如果一開始就來啃西瓜書,很有可能打擊自己的積極性,沒有學習動力。那我們先簡單的入門后,在回來系統學習這些知識點,看這些大佬的書,就會有事半功倍的效果。
那怎么簡單入門機器學習了?前面我已經大概提到了,就是簡單了解算法+應用算法。那具體該怎么做了,這是我之前的學習方法和路徑,僅僅供大家參考。
- 《機器學習實戰》,這本書是純Python(但是是python2)代碼實現機器學習的書籍,對于算法的介紹,很簡單明了,公式不多。如果自己的代碼能力有限的話,可以先大概了解其算法原理和編程步驟,自己能寫偽代碼即可。
- 博客,雖然《機器學習實戰》在介紹算法原理的時候,簡單明了,但有時候太過簡單,不是特別的清楚。這時,可以百度看一些博客,有些博客還是寫的很不錯的。
- sklearn實踐,了解算法原理后,就可以用我們Python的第三方庫sklearn來實踐啦。推薦的書為《Python機器學習基礎教程》,其實隨便找本sklearn實踐的書都可以,英語好的直接看sklearn官方文檔。
最后,這是我2018年文章合集(https://mp.weixin.qq.com/s/frJa361AW9-NqvyDdtGPDg),大部分是機器學習方法的文章,也是按這個流程走的,供大家學習和參考。
今日互動
留言打卡:說說你們平時是怎么學習的吧。公眾號后臺回復【打卡】,加入打卡學習群,2019年一起搞事情。