文章來源國外的analystics vidhya
原網址推薦書目,需要亞馬遜購買。我已經補全,望各位共同學習進步!
前沿
谷歌數據科學家的篩選過程對統計學和數學背景強的候選人給予了更高的優先考慮。不僅Google,世界上其他頂尖公司(亞馬遜,Airbnb,Uber等)也傾向于擁有強大的基礎知識,而不僅僅是數據科學的專業知識。
如果您也希望日后為這些頂級公司工作,那么您必須開發數據科學的數學理解。數據科學只是統計和數學的演進版本,結合編程和業務邏輯。我遇到過許多數據科學家,他們很難在統計學上解釋預測模型。
不僅僅是獲得準確性,理解和解釋每個度量,這個準確度后面的計算是重要的。記住,每一個“變量”都有一個故事要講述。所以,如果沒有別的,盡量成為一個偉大的故事探險家!
在這篇文章中,我編輯了一本必讀的統計和數學書籍。我明白數學沒有極限。因此,我只挑選那些可以幫助您更好地與數據科學聯系的書籍。
統計
統計學習簡介
這是一個非常推薦的書,用于實踐數據科學家。這本書的重點在于連接統計概念和機器學習。因此,您將了解所有流行的監督和無監督機器學習算法。R用戶將獲得一定好處,因為算法方面已經使用R進行了演示。除了理論,本書還著重于在現實生活中使用ML算法。
鏈接:http://www-bcf.usc.edu/~gareth/ISL/?
統計學習要素
這本書是先前書籍的先進水平。這是由斯坦福大學教授Trevor Hastie和Rob Tibshirani撰寫的。他們的第一本書“統計學習導論”揭示了統計學和機器學習的基礎知識。本書將向您介紹諸如神經網絡,Bagging&Boosting,Kernel方法等更高級別的算法。該算法已在R程序中實現。
鏈接:http://statweb.stanford.edu/~tibs/ElemStatLearn/
認識統計
這本書的作者是Alien B Downey。它基于Python中的實際統計分析。因此,在購買此書之前,請確保您已經掌握了Python的一些基本知識。它完全側重于通過流行案例研究了解統計的現實生活影響。既然,統計數學和數學關系密切,它也有專門的章節,如貝葉斯估計。
鏈接:https://pan.baidu.com/s/1pKNDIOj
From Algorithms to Z Scores
你知道統計在編程中的關鍵作用嗎?這本書的作者是加州大學教授Norm Matloff。本書解釋了在R中使用概率概念和統計測量。再次,R用戶的良好做法來源。它教授處理概率模型的藝術,并選擇最佳的模型進行最終評估。這是一本非常推薦的書(特別是R用戶)。
鏈接:http://heather.cs.ucdavis.edu/probstatbook (進去以后有書的手稿)。
使用R發現統計
這本書是由安迪·田野,杰里米·邁爾斯和佐伊菲爾德寫的。我會強烈推薦這本書給數據科學的新手。從統計數據開始,本書有一個很好的內容,詳細介紹了其主題。與此同時,統計概念與R一起進行了說明,這使得它更有用。它提供了一個一步一步的理解,同時支持有趣的練習示例。
鏈接:https://pan.baidu.com/s/1ge2puxl
數學
線性代數簡介
這是推薦的線性代數書之一。這本書的作者是麻省理工學院教授Gilbert Strang。吉爾伯特提供知識的獨特方式將讓您在每一章之后向前推進直覺和興奮。本書將幫助您為機器學習建立強大的數學基礎。它廣泛地征集了所有必要的章節,如矢量,線性方程,決定因素,特征值,矩陣分解等.
鏈接:http://pan.baidu.com/share/link?shareid=2193713855&uk=1247605138
矩陣計算
矩陣和數據框架是機器學習的重要組成部分。這本書的作者是Gene H Golub和Charles F Van Loan。本書為學生提供了矩陣計算概念的良好開端。作者介紹了高斯消除,矩陣因式分解,lancoz方法,誤差分析等重要課題。每一章都由直觀的實踐問題支持。偽代碼在Matlab中可用。
鏈接 http://math.ecnu.edu.cn/~jypan/Teaching/books/2013%20Matrix%20Computations%204th.pdf
模式識別的概率理論
這是一個學習數學應用的完整資源。這是機器學習中級和高級從業人員必讀的書。這本書由Luc Devroye,Laszlo Gyorfi和Gabor Lugosi編寫。它涉及范圍廣泛的主題,從貝葉斯誤差,線性辨別到ε熵和神經網絡。它提供了一個令人信服的解釋與復雜的定理與分段練習問題。
鏈接:http://www.szit.bme.hu/~gyorfi/pbook.pdf
神經網絡數學介紹
如果你對學習神經網絡有天生的興趣,這應該是你開始的地方。這本書的作者是Jeff Heaton。作者精心簡化了神經網絡的難點。本書向您介紹神經網絡中基礎數學的基礎知識。它假定讀者具有代數,微積分和編程的先前知識。它演示了可應用于神經網絡的各種數學工具。
鏈接:https://pan.baidu.com/s/1eS3n6lO
高級工程數學
這可能是機器學習用戶數學中最全面的書籍。這本書的作者是Erwin Kreyszig。事實上,這本書強烈推薦給大學生。如果你現在還沒有擅長數學,那么請務必遵循這本書,你一定會看到你的數學理解有重大改進。除了推導和實踐的例子,本書還有專門的演算,代數,概率等等。絕對必須閱讀數據科學各級執業者的書。
鏈接:http://www-elec.inaoep.mx/~jmram/Kreyzig-ECS-DIF1.pdf
概率與統計學手冊
這本食譜必須在你的數字書架上。這不完全是你會發現的教科書,而是數學方程式的快速數字指南。這本書的作者是Matthias Vallentin。完成數學必修之后,本書將幫助您快速連接各種定理和算法及其公式。很難立即推導出方程,本書將幫助您快速導航到您想要的問題并解決。
鏈接:http://pages.cs.wisc.edu/~tdw/files/cookbook-en.pdf
視頻分享:
MIT線性代數課程:https://ocw.mit.edu/courses/mathematics/18-06-linear-algebra-spring-2010/video-lectures/
MIT多變量微積分課程:https://ocw.mit.edu/courses/mathematics/18-02-multivariable-calculus-fall-2007/video-lectures/lecture-1-dot-product/
斯坦福統計課程:https://lagunita.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about
可汗大學數學課程:https://www.khanacademy.org/math
統計的海報:http://static1.squarespace.com/static/54bf3241e4b0f0d81bf7ff36/t/55e9494fe4b011aed10e48e5/1441352015658/probability_cheatsheet.pdf
大家有什么好的這方面的國外材料可以相互補充,相互學習,共同進步,為了你們的數學科學家的夢想而努力。
資料來源:analystics vidhya