作者:周琦
鏈接:https://www.zhihu.com/question/35055219/answer/61201204
來源:知乎
著作權歸作者所有,轉載請聯系作者獲得授權。
1 工具的學習(排列有序)
python(我用的python tutorial,細節可以查書learning python,然后查詢一些文檔比如,numpy,matplotlib官方文檔)
java (我先看的 head first java, 然后thinking in java看了一部分)
linux shell (越熟越好,我只是刷了鳥哥那本入門書的前半部分)
hadoop (需要會折騰,在win電腦上不好配置,如果實驗室有環境或者有人幫忙帶帶入門最好。
2 機器學習入門(排列有序)
集體編程智慧(把例子刷一遍,一方面是理解入門數據挖掘,一方面更熟悉下python)
數據挖掘導論,機器學習(tom mitchell),Andrew Ng的機器學習課程,機器學習實戰(主要參考下書中的代碼,書中代碼并不是非常完美,主要用來入門)。。
這幾個材料建議選其中一、二個為核心連貫學習,其他可以參考。比如你先用數據挖掘導論了解一些基本的概念,用Andrew Ng的機器學習課程進行比較細致的學習,其中要實習一些算法的時候可以參考機器學習實戰,某些算法看不懂時候可以參考其他書籍
Kaggle找幾個最簡單的題進行入門實戰。(比如泰坦尼克號那題)
可以適當了解一些機器學習的具體應用,如:推薦系統、圖像處理、語音或搜索。(結合自己的興趣專業選擇某一個深入學習)
Pattern Recognition And Machine Learning,The Elements of Statistical Learning 兩本理論非常詳細的巨著,如果有精力一定要看看。建議從第一本看起(因為我也只能勉強看懂第一本,第二本如果其他人都說很經典,可以看懂的話肯定是要看的)。
3 數據結構基礎
算法導論+leetcode在線題目
總結:
看書要多動手,多總結,比如看了個樸素貝葉斯算法,最好把這個方法總結一下,然后編寫代碼實現簡單的例子。參考更多的書籍,參考baidu