如何用MOOC組合掌握機器學習?

今天學習不努力,明天努力找工作

學習

2017年1月,人類在智力領域數萬年積攢下來的囂張氣焰遭到了若干次無情的打壓。

不提CES 2017上激動人心的自動駕駛產品(估計短短幾年之后,你的駕駛證就可以扔掉了),也不細講《最強大腦》節目里人類精英在圖像識別環節被碾壓(這曾經是人類可以嘲笑人工智能的典型領域),就說說圍棋界的海嘯吧。

數十位人類圍棋界頂尖高手,用人類圍棋對弈的千年智慧結晶,歷經艱苦卓絕的奮斗,依然被Master用快棋打了個一塌糊涂——60:0。

別人輸棋以后都很茫然,唯獨古力九段戰后的話最為耐人尋味——“人類與人工智能共同探索圍棋世界的大幕即將拉開”。

這話我聽著,覺得韻腳極為熟悉。突然想起來王朔的《頑主》中描述過類似情節。

馬青興沖沖地走到了前面,對行人晃著拳頭叫喚著:“誰他媽敢惹我?誰他媽敢惹我?”一個五大三粗,穿著工作服的漢子走近他,低聲說:“我敢惹你。”馬青愣了一下,打量了一下這個鐵塔般的小伙子,四顧地說:“那他媽誰敢惹咱倆?”

玩笑歸玩笑,不過人類精英終于學會謙遜,并對人工智能表達了合作的誠意,這也是好事兒。人工智能的崛起讓很多人自以為認識到了一個現實:

你今天有工作的時候不學習人工智能,明天人工智能會取代你的工作。

你同意嗎?

其實這話錯了,它不是現實。

人和機器不會發生競爭。人掙錢吃飯,機器有電就行。

現實是:

你今天有工作的時候不學習人工智能,明天就有人利用人工智能取代你的工作。

人和人永遠免不了競爭。這場軍備競賽里面,人工智能已經成為了個體可以掌握的核武器。別人懂了,你不懂,結果會很美妙。

當然,我說的是別人的結果。

人工智能領域中,目前最火的技術是機器學習(machine learning),尤其是近年來伴隨大數據產生而崛起的深度學習(deep learning)。不論是AlphaGo還是百度大腦,其實都是使用了(深度)機器學習,才變得如此厲害。

想不想學習一下“機器學習”呢?

途徑

要了解和掌握機器學習,路徑有很多。你可以選課、報班,甚至自己看書。但是我更推薦的,是MOOC。

對于大多數人來說,MOOC資源更容易獲得。只要你有一臺能上網的電腦,就可以開始學。

因為這幾年機器學習很火,因此相關MOOC很多。有好事者就開始進行梳理總結,把數十門課程分成初級、中級、高級,每一部分都有十余門課程。然后羅列出來,供讀者按部就班來學習。

我的評價是,他們用非常認真負責的態度干了一件糟糕透頂的事兒。

為什么?

因為你一股腦羅列數十門課程,不會絲毫降低學習的門檻,反而迅速減少了“從入門到放棄”的時長。

沒錯,看完了你的清單,讀者就放棄了。他的結論是“機器學習這事兒看來跟我這輩子沒關系”。

本文嘗試做一件與眾不同的事兒——精選少數課程,組合一個易于入門和快速應用的路徑。

要達到這個目標,就需要從許許多多的MOOC里選擇“最好的”課程。所謂“最好的”課程,需要滿足以下條件:

  1. 授課教師自身是牛人;
  2. 講授用心;
  3. 課程設計符合學習規律。

有了這個標準,許多課程立即被排除掉了。我們精選了數門課程,分別帶領初學者完成入門、進階、應用和補課等過程。組合起來,就是一個完整的機器學習了解和掌握路徑。

眾口難調,我們不可能找出所有人都一致認同的“最好”課程。如果你覺得我列出的課程或者組合方式還不夠好,不要立即抱怨。因為這不是一場PK。歡迎你推薦心目中更好的課程給我們大家。

入門

入門課程推薦吳恩達(Andrew Ng)教授Coursera平臺上的《機器學習》。

吳恩達教授,就是《最強大腦》里面帶著人工智能來砸場子的這位仁兄。

他是斯坦福大學教授,Coursera的聯合創始人之一。前任百度首席科學家,曾全面負責百度研究院。

如果你在MOOC論壇上發問,網友們給你推薦的第一門機器學習課程八成也是這門。

原因是門檻低,天花板很高。

所謂門檻低,是指不要求你多么熟練掌握某種語言編程技術,也不需要你的數學知識達到做完若干冊《吉米多維奇數學分析習題集》的水平。

所謂天花板很高,是指該課程全面介紹了機器學習中的核心知識,并且擴展到若干不同應用領域。這種課程設計方式,非常值得我國大學來學習。在保證覆蓋面的同時,只在幾個關鍵知識點著力反復練習,使得學生學起來輕松,卻真的掌握到了精髓。

我覺得這才是真正的大師水平。

之前為這門課程專門寫過一篇文章《機器學習,你也行》。這里就不再贅述了。歡迎感興趣的同學查閱該文。

學完這門課,你就可以自豪地宣稱自己了解機器學習了。

進階

獲得了吳恩達教授課程證書之后,千萬要趁熱打鐵,掌握現今最為熱門的深度學習。

所謂深度學習,就是利用深度神經網絡進行機器學習。如下圖就是利用深度社交網絡辨別一張圖片究竟是車、人,或是動物。

此處推薦的課程是Geoffrey Hinton教授的《神經網絡與機器學習》。

為什么推薦這門課?

首先,你會發現這門課使用的軟件工具與上一門課程一樣,都是易于安裝、便于掌握的Octave。你不需要去了解編程環境的各種配置,拿過來直接用就行。框架代碼都已經提供,你只需要在重點環節進行修改和補充。

其次,課程默認你學過吳恩達教授的課程作為前導。因此二者沒有什么重疊,避免重復勞動。直接高屋建瓴,繼續向縱深推進。

第三,Hinton教授是深度學習領域公認的權威。

這位大叔最大的本領就是對事業有自己的思考和見解,不人云亦云。當年人工智能領域遭遇寒冬,資助都沒了,實驗室都維持不下去了。許多有才華的人都跳到其他領域去了,唯獨他老人家總是覺得不斷改進與發展中應該有機會,就留了下來。

事實證明這種堅持帶來的收獲是顯著的。他比別人提早深耕了數十年,如今的學者在深度學習領域無論寫什么新論文幾乎都繞不開引他的文獻。

聽這樣泰山北斗級別的人物給你授課,真的是一種幸福。對別人來說一種非常高深莫測的算法,讀起來要么如同天書,要么擊節贊嘆,可在他嘴里無非是“哦,那一年我試了一下這個,不成;后來突然開竅了,在這里改變了一點點,然后就……”

有些人在討論區留言說他的笑話講得太有趣了。這是真的。不過你學起來的時候對這個事兒期望不要太高——作為外國人,你的生活環境和文化底蘊不同,笑話就別指望全部能聽懂了。

學完這門課,別人要是再想拿深度學習的概念來忽悠你,就很困難了。

這話你,真的聽懂了嗎?

學完這門課,如果你拿深度學習的概念去忽悠別人……

是不應該的。

實踐

通過前面兩門課,你理解了什么是機器學習和深度學習。但是你可能不愿意只停留在概念理解上,卻很想做出些東西來實踐。實踐應用一方面可以檢驗你學習的效果,另一方面可以幫助你積累經驗,同時還可以帶來成就感。

不好意思,在應用實踐環節這里,路徑上有個分支。

第一種選擇是Udacity上面的課程"Intro to Machine Learning"(ud120)。授課人是Sebastian Thrun,前幾年他一直是Google自動駕駛技術的負責人。

這門課采用的函數庫是Scikit-learn,構建于Python之上。課程設計得很吸引人,利用一些數據集,讓你熟悉如何用別人構造好的功能(函數調用),加上你自己的理解(參數調整)來完成一些小型項目。

我對這門課程總體上很滿意,但對免費學習用戶,練習缺乏?必要輔助,最后的大項目難度陡然提高。一般人難以適應,很容易中途放棄。如果你是付費用戶,會有專人帶領你一步步前行,并且提供必要的幫助,感覺就好多了。

第二種是選擇Coursera平臺上華盛頓大學的機器學習課程專項系列(specialization),課程名稱為“構建智能應用”(Build Intelligent Applications)。

這門課程,充分體現出資本市場對于學術活動的干擾。

課程系列包含了6門課。但是只陸續推出了前4門。第5門一直在不停跳票。從2016年的9月份被反復推遲,后來干脆取消了。

為什么?因為主講人兩口子的公司Turi被蘋果收購了。于是他們只好暫緩手頭的課程制作,處理收購的各項事宜。

不過從已經推出的4門課來看,水平非常高,而且設計巧妙。

課程采用案例教學,就是每一個模塊都依照具體問題給定數據集進行處理。第一門課是總覽,讓用戶體會每一部分的重要內容,并且動手運行嘗試,增加趣味和信心。

從第二門課開始,每門課分別介紹一個機器學習類型。每一周的課程由淺入深,逐漸加碼。利用Jupyter Notebook保存練習的結果,將來可以直接用到實踐中。

兩位教授還非常大方地開放自己公司的產品免費給學生使用。他們的產品對于學術界也是相當于免費(每年需要手動免費更新一次證書),很慷慨。不過被收購以后,這個教育優惠政策的事兒就不好說了。

有的章節題目很有一些難度。作為學習者,你得做好遠離舒適區,不停在學習區遨游的準備。

上述這兩門課程選擇一門聽完,你應該可以具備自己動手處理一些小型數據集的能力了。對于學習、工作和科研應該會有很大的助益。

你很不滿意,想要處理大規模數據?這個事兒需要兩個條件支撐:

  1. 你需要能得到大規模數據;
  2. 你得有相應的硬件條件。

實話實說,目前絕大部分人不具備相應的條件。所以這個問題有空咱們再深入聊。

補課

你可能對自己的知識基礎沒有什么信心——我不是數學或者計算機相關專業的,也能學會機器學習嗎?

從剛才的課程介紹,你應該不難看出。現在機器學習的門檻已經很低了。但是為了達成目標,你還是需要掌握一些非常基礎的知識,主要包括:

  1. 數學(初級微積分、概率論與統計、線性代數);
  2. 編程語言(例如Python)

如果你缺乏相應的知識,沒關系,補就是了。缺哪里補哪里,反復補充,這樣學習勁頭和效率都有保障。

Python語言的補課方式我建議采用密歇根大學的Coursera課程系列《人人都能學編程》。

這是目前我見到過的最適合數據科學初學者的Python語言入門方法。學了這門課程,你不僅掌握了一門語言,還可以掌握數據挖掘的基礎知識。包括數據庫操作、API和爬蟲等。跟前面的實踐類課程直接可以對接,嚴絲合縫。

至于數學知識的補充,我推薦的是Bill Gates一直贊不絕口的可汗學院。

可汗學院起家的本領就是幫助學生輔導數學功課。因此在MOOC領域,該平臺的數學課程是積累最為豐富的,對學生來說也是最無痛的。

看到可汗學院這么多數學課程類別了嗎?別猶豫,抓緊學吧。你不會重溫大學一年級(或者高中三年級)初次涉獵微積分時的噩夢,因為Khan學院的講授方式真的很生動、很有趣。

討論

你還上過哪些講解機器學習的好MOOC?它的獨特之處在什么地方?能否替換本文列出的部分課程,形成更好的組合?歡迎留言分享,我們一起討論。

如果你對我的文章感興趣,歡迎點贊,并且關注我的簡書文集“玉樹芝蘭”。

如果本文可能對你身邊的親友有幫助,也歡迎你把本文通過微博或朋友圈分享給他們。讓他們一起參與到我們的討論中來。

延伸閱讀

數據科學相關文章合集(玉樹芝蘭)

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,321評論 6 543
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,559評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,442評論 0 383
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,835評論 1 317
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,581評論 6 412
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,922評論 1 328
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,931評論 3 447
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,096評論 0 290
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,639評論 1 336
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,374評論 3 358
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,591評論 1 374
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,104評論 5 364
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,789評論 3 349
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,196評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,524評論 1 295
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,322評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,554評論 2 379

推薦閱讀更多精彩內容