AI的熱潮一波接著一波,不得不抓緊充實自己。雖然已經有了部分機器學習經驗(碩士論文都是機器學習相關),但依舊深感知識的欠缺。于是這本《白話大數據與機器學習》映入了眼簾,作為一本2016年的新書,又有白話、大數據、機器學習三大熱門詞匯加持,我慎(sui)重(yi)的選擇了這本書。
帶著對知識的向(jiao)往(lv),我這只剛畢業兩個月的小白開始了早到一小時讀書的旅程。先說本書終極評價:
- 與大數據實戰沒啥關系
- 內容要么很小白,要么難度很高沒有可操作性(給小白貼一大段sklearn算法?)
- 仍舊推薦閱讀,主要讀第一部分(入門知識)和最后一部分(應用與拓展)——就是不講機器學習的那部分
個人收獲最大的是作者對數據、大數據產業、數據價值解讀等的分析。其對大數據的概念解讀讓人如夢初醒,作者認為大數據本質上是數據,而不在于大,其對大數據和大石油有一段很有意思的對比。
假如現在給石油產業冠以“大石油”產業的名字,那么會影響石油行業本身對其他行業的服務樣態嗎?應該不會。
在“大石油”產業里,同樣有人從事這樣的工作內容:石油勘探、石油開采、石油運輸、石油提煉、石油產品銷售等多個細分領域和環節。
類比一下“大數據”產業,數據收集、數據傳輸、數據存儲、數據建模、數據分析、數據交易貫穿了大數據產業的完整產業鏈。
作者能把三個字簡化為兩個字,我覺得還是很清楚了。據此,作者認為大數據的核心價值在于:使人們通過數據獲得了洞悉世界的能力,得到了因果關系。這種因果的聯系,會讓人們在各個方面能夠推測未來趨勢,減少試錯,減少成本,降低風險,解放勞動力。
我入職后有一部分工作是智能運維,最需要的就是大數據和人工智能兩種能力??戳俗髡叩慕忉?,深深的覺得自己在為人類做貢獻,解放勞動力,解放人類,解放全世界 (刪除最后一句)。能把自己的工作和對人類有貢獻的事業聯系起來,想想都很激動。其實并沒有開玩笑,現在行業熱門的大數據、人工智能、云計算,正是因為大家看好他們可以解放勞動力,創造更大的價值。那么如果我的職業不能創造更大的價值,我就可以考慮轉行了。幸好我目前的工作做好了也能為人(gong)類(si)做出一點點貢獻。作為職場新人,一點小的觀點,不知道是阿Q精神還是我看穿了工作與人類幸福的本質。O(∩_∩)O哈哈~
書中大部分內容是講機器學習算法的。不過我之前都有了解一些,覺得都是比較平淡的內容,除了一段講解隱馬爾可夫模型的,并沒有特別好于其他機器學習的書。所以建議這些略看就好,想學機器學習基礎的看西瓜書、實戰的話看Sebastian Raschka的《Python機器學習》
上最后的干貨,思維導圖一份。有的東西根據自身知識,做了刪減,尤其是數據挖掘部分。歡迎留言討論。
最后用最近很欣賞的一句話共勉:
過一個平凡無趣的人生實在太容易了,你可以不讀書,不冒險,不運動,不寫作,不外出,不折騰……但是,人生最后悔的事情就是:我本可以。 ——陳素封