2018-04-18Priscilla優達學城Udacity
導語:十年資深數據分析師告訴你正確入門數據分析,成為一名年薪50萬以上的數據分析師。
文/ Priscilla
自大學零基礎從市場營銷專業,轉行到數據分析行業,至今已有近十年的工作經驗,我的經歷可以寫成一本書了。最初是完全零基礎小白,當決心轉行到數據分析后,每天凌晨四點半起床惡補高數線代,統計學概率論。基礎打牢后,又開始瘋狂敲代碼,擼項目,整日沉迷于編程不能自拔。
[圖片上傳失敗...(image-8afb6-1542838940758)]
到后來,成為數據分析的職場新人,不斷跳槽,積累經驗,升職加薪,最終得到一份夢寐以求的工作,也實現了年薪50萬的小目標。
為什么選擇數據分析
答主當初之所以選擇數據分析,是因為隨著數據逐漸變得廉價,分析仍然稀缺,高校畢業生數量遠遠無法滿足行業需求。毫無疑問,數據分析師是當今最具發展潛力的職業。入門月薪就已達到8K以上,5年工作經驗一般不會低于22K/月,當你做到team leader,規劃主導一個項目的時候,基本上就是年薪50萬+了。
技能要求
想成為年薪50萬的數據分析師,必須具備以下技能:
算法:統計學,高數線代,模型理論等基礎知識將是解決任何數據問題的地基。無論多復雜的數據實驗以及算法模型,離開他們都無從談起。
編程:數據獲取,清洗,處理,挖掘,存儲必不可少的工具。同時,熟練的碼出code將會為你省出大量的時間和精力。
可視化:將編程挖掘到的信息,靈活直觀的展現出來,呈現給非數據分析行業人員,為下一步決策提供理論根據。
[圖片上傳失敗...(image-900898-1542838940758)]
避開彎路
直至2016年,教育部才批準三所高校開設數據分析相關專業,這意味著如今市場上沒有科班出身的數據分析師。不要慌,大家都是依靠自學轉行的,可見培養強大的自學能力,對轉行來說多么重要。
然而,網上有太多的免費資源,動輒幾十個G的網盤分享,然而我們犯的最大的錯誤是把收集當學習,把信息當知識,于是最后只剩下存得滿滿的空虛感。
珍貴的永遠是付費的,最大的學習成本永遠是時間。免費資料通常內容陳舊,邏輯混亂,學起來無從下手,一籌莫展。所以,當遇到「掃碼送史上最全資源」時,一定要注意甄別,畢竟在高速發展的互聯網時代,不能用原始方法去學習了。
正確的學習路徑
給大家分享我學習的思路,按照:理論-編程-實踐的順序來進行,會讓你的學習循序漸進,事半功倍。
Part 1 :理論
理論學起來往往比較枯燥,但若想打下扎實的數理基礎,也必須吃得苦中苦。
推薦幾本好書:
《深入淺出統計學》、《商務與經濟統計》、《數據挖掘概念與技術》
[圖片上傳失敗...(image-1daa86-1542838940750)]
[圖片上傳失敗...(image-241203-1542838940750)]
[圖片上傳失敗...(image-8d06db-1542838940750)]
這幾本書寫的都很有趣,安下心來讀完后,會形成比較宏觀的統計學框架和數理思維,從更高的角度看問題。
此外,BBC紀錄片,如數學的故事,統計的樂趣等,都可以在業余時間刷一下,學習娛樂兩不誤。
學習網站:
可汗學院公開課:概率論 麻省理工畢業生創立,講課節奏明快,思路清晰,邏輯性強。
Coursera:計算導論 知名的學習網站,內容很多很足。
Udacity:統計學基礎 應該是統計學網課中最全的了,包含了抽樣分布,假設檢驗等,講課風格很有趣,包辦了我的統計學入門。
基礎理論是未來工作的根基,這句話每行都適用。所以理論萬萬不可忽視。
Part 2 :編程
盡管有很多編程語言,但是在數據分析行業,主流還是SQL,R,python。SQL主要是存儲數據,R和python各有所長,配合使用。
SQL:
《Database Management Systems 3rd Edition》
《數據庫原理》
Udemy:數據分析技能速成 Microsoft SQL
python&R:
《利用PYTHON進行數據分析》與pandas是同一個作者,這本書可以幫你入門numpy,pandas,matplotlib,但是要注意,代碼不要看一遍就覺得都會了,動手敲一敲會有不一樣的體驗。
《統計建模與R軟件》 薛毅老師的經典作品,融合了統計與編程。
廖雪峰python 業界大咖,以生動有趣著稱,但缺點就是缺少互動性,有問題找不到老師答疑。
[圖片上傳失敗...(image-9cd1d8-1542838940756)]
Udacity:數據分析 硅谷旗下的產品,在專業性方面毋庸置疑,從基礎函數講解,到如何利用python和R進行數據清洗挖掘,以及兩種語言如何配合使用。配有助教24小時指導,用戶體驗不錯。
[圖片上傳失敗...(image-5ea4bb-1542838940756)]
Part 3 :實踐
此時的你已經兼顧了統計思維,數理知識,和數據清洗挖掘,可視化的能力。但是想成為一流的數據分析師,這還是遠遠不夠的。你還需要在大量的項目中積累經驗,打磨實際操作能力。
Kaggle
可以觀摩大神是怎么擼比賽的地方,會產生為什么世界這么大,而我這么渣的想法。
Udacity
Udacity的亮點之一就是會配上大量的項目進行訓練,并有老師逐行審核代碼,把你的作品打造成專業水平。
無論看別人做過多少遍,不如自己上手挖掘一遍。實踐過后,才能實際體會到什么是數據分析。
學習心得
最初深受網上那些「轉發贈50G資料」所害,在圖書館刷劣質資源,又枯燥又混亂,差點上演一幕從入門放棄。后來終于意識到,人與人之間的差別在于平臺和認知,對于一個志在轉行拿高薪的人來說,最寶貴的是時間,付費學習實際上是花錢買時間,花錢買行業最頂尖的知識和技能,看到的世界也就會更遠更寬廣。
[圖片上傳失敗...(image-36fa75-1542838940755)]
橫向對比了好幾個在線教育平臺,慕課網雖然完全免費,但是課程形式上略有陳舊;網易云課堂和Coursera不愧是知名充電網站,內容豐富,講課節奏明快,但是作為與名校合作開發的課程,更偏向于學術鉆研,而且后續服務欠佳。
Udacity頂著硅谷的光環入華,誠意滿滿,在國內上線第一天,就宣布與優酷、滴滴出行、京東、新浪、谷歌和亞馬遜達成人才方面的合作,在招聘時,這些企業將會優先錄用通過Udacity納米學位的用戶,對于零基礎轉行的人來說,明顯是不錯的平臺和跳板。
盡管Udacity剛入華時,沿襲硅谷的英語授課是不少學習者的屏障,并且網絡環境擁堵,但近些年不斷努力漢化,課程大部分都推出了雙語教學,還有項目考核和代碼一對一審閱服務,通過項目練習去模擬數據分析的實戰過程,在老師的幫助下提升代碼的規范性和簡潔性。此外,Udacity最大的亮點是與名企合作開發的課程,更注重培養工作中解決問題的能力。
[圖片上傳失敗...(image-345ad0-1542838940755)]
合作企業
Udacity介于培訓和自學之間的中間態,既可以學到來自硅谷的標準數據分析流程和思維,節省大量時間,又給你留了足夠的空間發揮和延展,培養強大的自學能力。這兩方面,都是想拿高薪必不可少的思維。
確定職場方向
具備數據分析的能力后,你還要確定職場方向:
數據分析師
通過分析數據,可視化展示,將結果轉化為切實可行的商業方案,為公司的決策提供依據。偏重于數據挖掘與溝通交流。
數據工程師
將數據整理,存儲,方便其他人查詢,主要負責數據庫結構,數據建模,質量審核等后端工作。偏重于數據庫和編程語言的技能。
數據科學家
解決一切數據分析師解決不了的問題。偏重于數學,統計,算法和模型的開發。
所以,在學習階段,了解自己喜愛的崗位所需技能,有針對性的去學習;在求職階段,了解自己的特長與優勢,選擇對應公司的分析團隊。
最后送大家一句話:種一棵大樹最好在十年前,其次是現在。
— 完 —