http://www.360doc.com/content/15/0412/10/17132703_462592209.shtml
1、pandas
Pandas包含高級數據結構,以及和讓數據分析變得快速、簡單的工具。它建立在NumPy之上,使以NumPy為中心的應用變得簡單。
Pandas是進行數據清洗/整理(data munging)的最好工具。
http://pandas.pydata.org/pandas-docs/stable/10min.html
2、numpy
對于科學計算,它是Python創建的所有更高層工具的基礎,NumPy不提供高級數據分析功能,但有了對NumPy數組和面向數組的計算的理解,能幫助你更有效地使用像Pandas之類的工具。
參考視頻教程 ?https://vimeo.com/77263537
3、scipy
Scipy庫依賴于NumPy,它提供便捷和快速的N維向量數組操作。SciPy庫的建立就是和NumPy數組一起工作,并提供許多對用戶友好的和有效的數值例程,如:數值積分和優化。SciPy提供模塊用于優化、線性代數、積分以及其它數據科學中的通用任務。
參考教程 https://docs.scipy.org/doc/scipy/reference/tutorial/
4、matplotlib
Matlplotlib是Python的一個可視化模塊。它讓你方便地制作線條圖、餅圖、柱狀圖以及其它專業圖形。使用Matplotlib,你可以定制所做圖表的任一方面。在IPython中使用時,Matplotlib有一些互動功能,如:縮放和平移。它支持所有的操作系統下不同的GUI后端(back ends),并且可以將圖形輸出為常見地矢量圖和圖形格式,如:PDF、SVG、JPG、PNG、BMP和GIF等。
5、Scikit-learn
Scikit-learn是一個用于機器學習的Python模塊。它建立在Scipy之上,提供了一套常用機器學習算法,讓使用者通過一個統一的接口來使用。Scikit-learn有助于你迅速地在你的數據集上實現流行的算法。
內置各算法教程 ? http://scikit-learn.org/stable/user_guide.html
這些教程都非常適合初學者。不過,在學習這些教程前,先要熟悉Python語言的基本編程知識。