引言:
本文不推薦什么大社群!不推薦課程!只是簡明地描述一下我是如何轉行到數據分析崗的。
--------------------------------------------------------------------------
2019.5.4更新:轉行數據已接近兩年,最近對數據分析崗有了些新的理解,總的來說就是數分不是局限于報告,而是自己能生成能夠落地的工具,比如api, web,模型等,讓數據產生“價值”。近期也開通了個微信公眾號,主要用于記錄從一個零基礎的會計生在數據甚至是算法的探索之路學了些啥,做了些啥,還需做些啥,以及數分工作的日常,雜談等。對轉行數據有疑問的朋友歡迎關注(微信公眾號):Dathon
最后公布一波18年12月我求職的部分簡歷內容。
--------------------------------------------------------------------------
(2019.6.21這里先說一下,往下正文有部分內容已經不適用于2019年了,主要是最近幾年太多人進入這個行業,拉高了入門門檻,目前python和機器學習可能入崗后很少用,但覺得也是必備的了)
正文:
先說說自身情況吧:16年本科畢業,專業財務管理。在家鄉,一個二線城市,做會計做了一年多(包括實習期)。這一年多,把我從一個會計粉轉變成一個會計黑,期間的辛酸在我某個回答里有寫上一些(小匿:會計轉行能做什么?)。有轉行的念頭是16年7月,當時就是刷刷知乎,百度一下,了解了數據分析崗的狀況,16年10月正式開始準備。后來不滿意準備的進度,2017年3月提出離職申請,待業在家學習,直至8月份在廣州才拿到稍微滿意的offer。薪資確實翻了個倍還有多,但也依托于以前會計崗位的薪資實在太低太低。
16年10月,從轉行數據分析,還是考二線城市的公務員兩個選項中掙脫出來,最終沒聽父母的,選擇了數據分析這個無底洞。剛開始,我是查看拉勾網上的公司崗位招聘要求,然后才決定我需要準備什么知識。當時拉勾網的廣州數據分析師崗幾乎都被我翻完了,總結了下需要做以下幾點準備;
1,統計學相關知識
2,excel的熟練使用,報表關聯,數據透視等。
3,SQL語法,了解數據庫知識。
4,python或則r,需要有建模能力。
5,業務理解能力。
6,項目經驗
1,統計學相關知識:
先看了《商務經濟與統計》第十二版,當時看起來真的蠻吃力的,自己定的目標,比如一天看一章,根本完成不了,斷斷續續看了接近兩個月,才看到12章。也越發發現在職學習真的需要很大的毅力,并且上班時候總是有一個念頭:好浪費時間啊。直到后面我又買了一本統計學書籍《深入淺出的統計學》。對比上本書,真的可讀性高很多,書里的案例很生動,里面的題目也不會太難,學起來相當有成就感,很快就把整本書看完了。因此也愛上了這個系列的書籍,又購買了,深入淺出的數據分析和深入淺出的SQL。但發現這里兩本有些啰嗦,并沒有看完這兩本書。
2,excel的熟練使用,報表關聯,數據透視等:
以前做財務就是一個十足的表哥,一直對excel比較有信心,所以這方面我沒有過多的復習。直到現在工作了,目前使用的是google.docs一個類excel工具,excel的公式也是能在這里使用,才發現自己的excel能力其實很弱。比如,我以前做財務寫的公式是這樣子的:
現在我寫的公式是這樣子的:
也是因為以前做財務的時候不用寫有關業務邏輯的公式吧。還有表和表的關聯也是個難點。推薦一下excel比較好的教程吧:https://zhuanlan.zhihu.com/p/24084300
3,SQL語法,了解數據庫知識:
雖說買了深入淺出的SQL,因為記得當時已經是我4月份了,當時定目標是5月找到工作(雖然最后8月才找到orz),所以覺得看書太耗費時間了,直接看的是w3c的sql教程:http://www.w3school.com.cn/sql/。看完后直接動手做面試題:http://blog.csdn.net/qaz13177_58_/article/details/5575711/。還要了解下SQL語法的順序(很重要!)然后面試SQL的筆試題基本沒啥問題了。反正面試時的筆試,印象中都會做。還有數據庫的知識推薦很多人推薦的一本:《MYSQL必知必會》吧(然而我并沒準備這方面知識,好像也不太影響。)
4,python或則r,需要有建模能力:
python和r,我選了python。單純覺得python好聽!面試了16家,其中只有3家公司是真正要求需要用到python或則r進行數據分析的,所以覺得這兩門語言并不是必備項。當時看的書籍是pandas作者寫的《利用python進行數據分析》至今工作后仍在溫習,跟著代碼打一遍,受益匪淺。當然,我覺得零基礎看這本書還是會有些吃力,所以可以先看看這些,
慕課網免費課程:http://www.imooc.com/course/list?c=python(里面的4,6,7章選看)
廖雪峰的Python博客:
https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000
還有建模知識:現在我越發懷疑數據分析所說的建模只是類似“漏斗模型”等等的業務模型,并非機器學習模型。因為數據分析崗必須用到機器學習模型的崗位幾乎沒有。只是你懂機器學習是一個加分項,工作時多一個技術層面分析數據而已。不過當時的我并不知道這些啊,傻傻的也準備機器學習來;首推當然是吳恩達老師在coursea的課程《Machine Learning》然后是周志華老師的西瓜書(我只看了一點點。)當時接觸了這些,我感覺機器學習好難好難,根本不可能在兩三個月內了解完常用模型的原理。后來我就用野路子了:不去了解原理,只是去用機器學習python的包:sklearn!,至少我能用模型。Sklearn的學習當然是http://scikit-learn.org/stable/index.html
Sklearn的官方文檔,寫的很詳細,也會推薦文獻去讓你學習原理,雖說是英文的,但你可以和我一樣用谷歌瀏覽器把它翻譯呀!
5,業務理解能力:
數據分析中的重中之重!無奈這方面實在沒有很好的學習途徑,結合自身面試的經歷給大家一些小Tips吧。
1, 做面試準備時,一定要去了解該公司的有哪些數據指標?這些指標是如何計算的?如何提高的?比如電商:如何提高復購率?或則運營的:有哪些常用的數據指標?答:https://zhuanlan.zhihu.com/p/27029515
2, 需要了解一些流量統計的常用工具:Google?Analytics;百度統計;百度指數等。
3, 要會畫思維導圖,面試時有一道題印象很深:用思維導圖預測廣州10年后人口數量。
4, 可以學學爬蟲工具,面試時有被經常問到這樣的問題:“你會用python?那你能幫我爬競爭對手的數據嗎”。我:”…………………………….只會數據分析的常用庫。”后來了解了幾款爬蟲工具,暫時已經能滿足我爬數據的需求,不過我后續仍會去學習python爬蟲的知識。
6,項目經驗:
沒有項目,憑什么一個轉行人士說你懂數據分析?所以,我乖乖的去做項目了。可能你覺得一個轉行人士哪有項目啊?實際上,想要有項目經驗,真不難!我總結了有以下途徑:
1, 在網上下載數據進行分析:http://www.moojnn.com/data-market/?篩選免費的數據就好!
附上一個報告的模板:
2, 自己爬數據進行分析,這就需要用到爬蟲工具了(百度一搜很多的)。我復試時候爬了競爭對手的數據去預測價格,然后,我拿到的offer。
3, 做比賽,類似于kaggle,天池,數據城堡等等都有算法競賽。我自己是選了這條路,但是這需要機器學習的知識。
除了面試的準備,還想提醒大家需要避免的幾個誤區:
也和大家分享下零基礎轉行需要注意的幾個誤區:
畢竟我(文科生)也是零基礎過來的,說說我覺得有幾個必須要注意的誤區吧。
1, 數據分析崗大多數用不到python與r!機器學習更是用不到!
以我目前的工作為例,我用到的工具是google.docs(類excel工具),和ppt.word.sql等等。而python和r是非必要工具,感覺像是簡歷中的加分項,當然我也認為數據分析需要必備掌握其的中一門,但是這并非求職中的必備項。機器學習就更不用說了,還是先理清自身公司數據的異常值,數據準確度,數據指標的邏輯等等吧。亂臟數據都沒理清,談何建模。若你想快速進入數據分析崗,python和r可以入崗之后學,專心做一兩個項目出來才是關鍵!
2, 認為數據分析崗普遍工資很高!
在知乎文章看多了,覺得轉行就有9K上萬,現在想想也是醉了,感覺做到這個數字的人。應該有他的原因,但我認為如果條件和我相差不遠的話,很難做到。在廣州面試了兩個禮拜,拿到的offer的工資都在4.5~6之間!然而這些崗位的招聘條件幾乎都是6-1w。印象最深的是有個做郵件推廣的公司,招聘時寫著7.5-1.2,去到只有3.5(黑人問號??。雖說拿到不少面試邀請(16個拿了8個offer,都是小公司)但滿意的真的很少很少,最后找到心灰意冷的時候,終于拿到一個算是滿意的offer。而我最滿意的三個公司都沒有給我復試的機會。想起還有些難受。
3, 誤認為數據挖掘崗就是數據分析崗!
面試時候就能強烈的感受到這兩者的區別。
一般數據分析崗,招聘標題為:
1,數據運營。2,數據分析師。3,數據分析專員。4,數據產品經理。等等
而招聘數據挖掘,標題:數據挖掘工程師。(算法工程師不算)
其中里面的要求更是十分不同,數據分析崗會偏向對業務的理解,學歷大專往上。工具除了excel和sql,也會包括一些流量統計的工具,比如google analytics,百度統計,百度指數等。對編程要求比較少,只是加分項。數據挖掘崗,除業務理解對編程也有一定要求。機器學習必須了解,對工作經驗也有要求。可以往下看我簡歷中的技能要求。我學習了python和機器學習并參加的算法比賽,這使我偏向數據挖掘方向,但我又不夠資格得到數據挖掘崗的offer,只能找數據分析崗,那種低不成高不就的感覺,很是尷尬。
想說的都快說完了,感覺說了很多,又感覺沒說什么,總感覺有一句很重要的沒說,想了很久,終于想起,轉行數據分析前,還是先問問自己一個問題:“喜歡對著數據嗎?”回答Yes的話,來不及解釋了,數據的“火”車還沒走,快上車!
最后附上自己簡歷里技能一欄吧:
一個記錄會計到數據、算法路上所學的微信公眾號:Dathon