數據分析、數據挖掘有哪些好書值得推薦?由于經常接到私信要求在這個書單之內再推薦兩三本,每個人的行業背景也不一樣,所以就把下面的書單歸類整理一下。
入門讀物:
1.深入淺出數據分析這書挺簡單的,基本的內容都涉及了,說得也比較清楚,最后談到了R是大加分。難易程度:非常易。
2.啤酒與尿布通過案例來說事情,而且是最經典的例子。難易程度:非常易。
3.數據之美一本介紹性的書籍,每章都解決一個具體的問題,甚至還有代碼,對理解數據分析的應用領域和做法非常有幫助。難易程度:易。
4.數學之美這本書非常棒啦,入門讀起來很不錯!
數據分析:
1.SciPy and NumPy這本書可以歸類為數據分析書吧,因為numpy和scipy真的是非常強大啊。
2.Python for Data Analysis作者是Pandas這個包的作者,看過他在Scipy會議上的演講,實例非常強!
3.Bad Data Handbook很好玩的書,作者的角度很不同。
適合入門的教程:
1.集體智慧編程學習數據分析、數據挖掘、機器學習人員應該仔細閱讀的第一本書。作者通過實際例子介紹了機器學習和數據挖掘中的算法,淺顯易懂,還有可執行的Python代碼。難易程度:中。
2.Machine Learning in Action用人話把復雜難懂的機器學習算法解釋清楚了,其中有零星的數學公式,但是是以解釋清楚為目的的。而且有Python代碼,大贊!目前中科院的王斌老師(微博: 王斌_ICTIR)已經翻譯這本書了機器學習實戰。這本書本身質量就很高,王老師的翻譯質量也很高。難易程度:中。我帶的研究生入門必看數目之一!
3.Building Machine Learning Systems with Python雖然是英文的,但是由于寫得很簡單,比較理解,又有Python代碼跟著,輔助理解。
4.數據挖掘導論最近幾年數據挖掘教材中比較好的一本書,被美國諸多大學的數據挖掘課作為教材,沒有推薦Jiawei Han老師的那本書,因為個人覺得那本書對于初學者來說不太容易讀懂。難易程度:中上。
5.Machine Learning for Hackers也是通過實例講解機器學習算法,用R實現的,可以一邊學習機器學習一邊學習R。
稍微專業些的:
1.Introduction to Semi-Supervised Learning半監督學習必讀必看的書。
2.Learning to Rank for Information Retrieval微軟亞院劉鐵巖老師關于LTR的著作,啥都不說了,推薦!
3.Learning to Rank for Information Retrieval and Natural Language Processing李航老師關于LTR的書,也是當時他在微軟亞院時候的書,可見微軟亞院對LTR的研究之深,貢獻之大。
4.推薦系統實踐這本書不用說了,研究推薦系統必須要讀的書,而且是第一本要讀的書。
5.Graphical Models, Exponential Families, and Variational Inference這個是Jordan老爺子和他的得意門徒Martin J Wainwright在Foundation of Machine Learning Research上的創刊號,可以免費下載,比較難懂,但是一旦讀通了,graphical model的相關內容就可以踏平了。
6.Natural Language Processing with Python?NLP經典,其實主要是講NLTK這個包,但是啊,NLTK這個包幾乎涵蓋了NLP的很多內容了啊!
機器學習教材:
1.The Elements of Statistical Learning這本書有對應的中文版:統計學習基礎。書中配有R包,非常贊!可以參照著代碼學習算法。
2.統計學習方法李航老師的扛鼎之作,強烈推薦。難易程度:難。
3.Machine Learning去年出版的新書,作者Kevin Murrphy教授是機器學習領域中年少有為的代表。這書是他的集大成之作,寫完之后,就去Google了,產學研結合,沒有比這個更好的了。
4.Machine Learning這書和上面的書不是一本!這書叫:Machine Learning: An Algorithmic Perspective之前做過我帶的研究生教材,由于配有代碼,所以理解起來比較容易。
5.Pattern Recognition And Machine Learning經典中的經典。
6.Bayesian Reasoning and Machine Learning看名字就知道了,徹徹底底的Bayesian學派的書,里面的內容非常多,有一張圖將機器學習中設計算法的關系總結了一下,很棒。
7.Probabilistic Graphical Models鴻篇巨制,這書誰要是讀完了告訴我一聲。
8.Convex Optimization凸優化中最好的教材,沒有之一了。課程也非常棒,Stephen老師拿著紙一步一步推到,圖一點一點畫,太棒了。