#0001#我是如何與數據作朋友的

??劇情前奏:

本人與2008年畢業于一個理工科大學的專科學歷,學習的電子技術相關的專業。偶然的機緣進入了一家世界500強外資企業的電子工廠,從此過上了上班打卡下班睡覺的操作工人。但是不信命的我一直在不停的折騰,一會兒學 C/C++,JAVA,HTML,SQL,Excel,PPT,甚至PS...

結果一事無成。

? 初識數據

2011年的時候通過內部轉崗到了產品工程部,做質量控制的技術員(俗稱QA)。于是開始接觸數據相關工作,做的最多的還是Excel.第一次接觸vlookup是因為兩個批次的產品mixing,于是從上一個操作站點提取數據與當前站點的對比。然后接觸到了一些函數,再接觸數據透視表!

與此同時,因為要提取測試數據,所以接觸到了SQL。剛開始的時候都是別人已經寫好了得腳本在PL/SQL里面運行就能拿到結果了!再導入到Excel進行分析處理,比如計算出良率,共性分析…… 首先從select * from xxx_table 開始,然后加入where, 然后再來選擇列等等!

接下來直接去到測試記錄的文檔里面探索,純文本的記錄。雖然記錄還是有規律的,但是數據量太大了,動不動就是百兆開始的。想要快速的找到自己需要的數據,所以必須要有自己的方法!所以對于notepad++,Textpad8,Beyond compare...開始了深入的研究。

接下來開始學習了Python,想學習怎么爬去網絡數據。直接從公司的一個網站入手,結果卡殼半年都沒下登錄的了網站。后來使用Requests登錄網站后,發先了另外一個坑,這是個動態網站。于是轉戰selenium,終于實現數據提取。然后pandas,matplotlib...

? 接下來的路

更深入的進入到數據分析這個領域,利用學習到的知識來提升自己業務方面的統籌分析,進而得到職業升遷!

??數據在哪里?

1. 公司內部有非常龐大的數據庫,以及文本數據,對業務方面有改進或者提高的分析都會促進個人職業發展

2. 網絡數據,使用爬蟲抓取數據,免費分享的數據,競賽數據。

https://www.theguardian.com/sport/datablog/2012/jun/25/olympic-medal-winner-list-data#data

Olympic medal winners: every one since 1896 as open data,保存于google document 里面。可以前往下載!

本數據來源于奧林匹克1986-2008的比賽獲獎數據。包含了10個字段,城市,那一屆,運動類型,比賽項目,運動員名字,國家,性別,運動項目,男/女/混,獎牌。


??How to do?

1. 2018-11-29正式開始

2. 學習課程每兩周>10小時

3. 繼續學習http://Lynda.com上的數據分析課程

4. 將學習內容記錄到文章里面,從#0001#開始

使用一個Excel table 記錄學習時間,每月底復盤分析!

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容