原文地址:36大數據 ? Python數據分析學習路徑圖(120天Get新技能)
Python是一種面向對象、直譯式計算機程序設計語言,由Guido van Rossum于1989年底發明。由于簡單、易學、免費開源、可移植性、可擴展性等特點,Python又被稱之為膠水語言。下圖為主要程序語言近年來的流行趨勢,Python受歡迎程度扶搖直上。
由于Python擁有非常豐富的庫,使其在數據分析領域也有廣泛的應用。由于Python本身有十分廣泛的應用,本期Python數據分析路線圖主要從數據分析從業人員的角度講述Python數據分析路線圖。整個路線圖計劃分成16周,120天左右。主要學習內容包括四大部分:
- Python工作環境及基礎語法知識了解(包括正則表達式相關知識學習);
- 數據采集相關知識(python爬蟲相關知識);
- 數據分析學習;
- 數據可視化學習。
Python工作環境及基礎語法知識了解
對于Python基礎語法學習部分,學習周期大概為4周,需要的相關資源在網絡上都能找到免費的資源,而且質量都不錯。相關中文資源如下:
1.python工作集成環境包
Python(x,y) - Downloads:http://python-xy.github.io/downloads.html
2.python數據分析相關庫(Pandas/ Numpy/ Scipy/ Matplotlib)
如果安裝了上面集成工作包,則下面的包不需要重新安裝了。關于包的安裝方法在學習資源圖書中都有介紹。通常安裝庫,采用pip方法,也可以用pip list
查詢系統安裝了哪些庫。
3.學習資源
圖書:
- Python基礎教程(第2版)
- 深入淺出Head First python(中文版)
在線教程:
視頻教程:
數據采集學習
對于數據采集部分的學習,主要是通過python爬蟲的學習了解基本的外部數據采集情況。當然,也可以借助別人寫好的規則庫,直接完成某些數據的采集。這部分內容的學習周期大概也為四周,需要的相關資源在網絡上都能找到免費的資源,而且質量都不錯。
相關中文資源如下:
爬蟲學習在線教程:
- Python爬蟲入門一之綜述
- Python爬蟲入門二之爬蟲基礎了解
- Python爬蟲入門三之Urllib庫的基本使用
- Python爬蟲入門四之Urllib庫的高級用法
- Python爬蟲入門五之URLError異常處理
- Python爬蟲入門六之Cookie的使用
- Python爬蟲入門七之正則表達式
- Python爬蟲實戰一之爬取糗事百科段子
- Python爬蟲實戰二之爬取百度貼吧帖子
- Python爬蟲實戰三之計算大學本學期績點
- Python爬蟲實戰四之抓取淘寶MM照片
- Python爬蟲進階一之爬蟲框架Scrapy安裝配置
視頻教程:
數據分析
Python數據分析的學習主要是對相關庫的使用,比如數據整理需要用到numpy
和pandas
庫,數據描述與分析分析則主要用到pandas
庫,從某種程度上講,利用python進行數據分析的學習過程就是對庫的學習過程。由于有了前面2部分內容的學習基礎,本部分內容的建議學習練習時間也為4周,相關免費學習資源如下:
圖書:
視頻:
- 用python玩轉數據 (視頻為cousera認證課程,全程中文)
數據可視化
Python數據可視化學習的過程,就是學習matplotlib
庫的過程,matplotlib
庫包含有豐富的數據可視化資源——地圖、3D等等都有涉及。如果有前面3部分的學習經驗的話,這部分內容在4周內也能解決。相關中文學習資源如下:
圖書:
至此,Python數據分析相關學習內容介紹完了,上面介紹的多種資源,每個階段只需選擇其中的一種進行深入即可,更多更深的內容則需要自己去實踐摸索。