機器學習基礎
https://zh.coursera.org/course/ntumlone
機器學習技法
https://zh.coursera.org/course/ntumltwo
這兩門都是很好的入門課程,唯一遺憾的是,林軒田老師去工業界了,不會親自再開這兩門課,但是 Course Materials 仍然可以訪問。hw可能有點難,我上學期上技法的時候,每次都要花一兩天才能拿到勉強 325+/400。但是他的用意是把課上不會講的東西放在hw里,所以大可不必太過擔心,實在有不會的,可以去看看《Learning from data》這本書(我沒有看,但他聲稱這本書覆蓋了他的內容), 或者把講義再看一遍。這門課的 note 基本每周都有(非官方),這個要自己搜一下。我這有保存著技法 note 的一個網址:
Stanford 的 cs229
https://zh.coursera.org/learn/machine-learning
有史以來最有代表性的公開課,Andrew Ng (這個人物很有名,coursera的co-founder,百度dl院的首席科學家)親自授課,超簡單,只有技術細節,少有理論解釋,與臺大的課形成鮮明對比。但同時是有一些 insight 的。使用 matlab ,其實很容易,我現學的。
這兩門課上完,應該機器學習的基礎是有了(我也就只有這兩門課的水平,但是如果不搞學術,大家都差不多)。當然,要是搞研究還早。只不過 PRML, MLAPP 這些書我也看不下去,所以也沒法給推薦。不過幾個月前入了周志華老師(南大LAMDA實驗室的頭,學術大牛)的一本《機器學習》,新書,感覺很不錯,主要是讀著有意思,推薦給你。周志華老師的微博:
http://weibo.com/zhouzh2012?from=myfollow_all
《統計學習基礎》這本書也有很多人推,我買來看了很少(就一兩個算法),是主要介紹算法的,如果想對某些算法做不深不淺的了解,非常合適。作者是李航博士,wb:
http://weibo.com/u/2060750830?from=myfollow_all
至于語言方面,我差不多就是你這個時候學了 python,坦白講 python 用的最多,但以后做統計的時候,很有可能導師非要用 R 或者 Matlab, 但是它們能做的, python 也能做, 反過來就不是了。這是python的一個基礎教程,不太建議上 MOOC ,我當時上了一個 Rice 的課,教的很慢,學不到什么。建議看教程,直接上py3:
http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000
python 基本語法,和幾個糖學會了,就能寫程序了,「寫」python 本來就很容易。
但是平時還要用到別的幾個庫:比如scipy numpy matplotlib sklearn sympy 我一般就是要用的時候就翻 API 。還要使用IPython。
對了,別上JH的課,他家是圈錢的。
一門沒上過的,不負責推薦:
https://zh.coursera.org/course/scicomp
339390736,一個討論較多的群。