本文為我剛轉行成功時的一篇復盤,對數據分析感興趣的同學可以看一下
(文章對應資源已經上傳到公眾號-人人都會數據分析,也歡迎關注知乎專欄-數據分析師養成(陸續同步到簡書))
剛剛轉行成功的我冒昧來回答一下這個問題。
其實從知乎的搜索框中打下“如何快速成為數據分析師”,“怎么轉行數據分析師”,“數據分析是干什么的”,諸如這類問題的人,可能很大一部分是零基礎、對這一行不甚了解的老鐵們。在一個月之前,我也是老鐵里的一員,深深了解老鐵們痛點,希望快速地了解數據分析師這一份職業,希望能夠快速地找到一份數據分析師的工作,或許我的經歷可以給你一點啟發。
簡單介紹下自己的情況,今年7月畢業,畢業,7-9月在一家建筑企業工作,9月2號提出辭職,從提出辭職到成功入職魔都一家互聯網工資從事數據分析的工作僅僅花了14天。
沒有看錯,14天,14天成功轉行毫不相關的職業,所以,腿長在自己身上,世界那么大,騷年想去哪,就去哪!!! 別猶豫!!!
廢話半天,進入正題,告訴大家如何如何正確地快速地入行。首先必須感謝知乎各路大v給我的啟發,有興趣地也可以去看看人人都是產品經理上的專欄,給我這樣的數據新人很多啟發。
一、初識數據分析
職業規劃以及目標
請自己動手,知乎或者其他搜一下了解一下,你會發現
數據分析主要十分偏業務和偏技術兩個方向的
二、心理和思想上的準備
勇氣、努力
可能阻擋你不能轉行的不是你沒有準備好,沒有相關學歷,沒有經驗等等這些看似相關的因素,其實只是取決于你的態度。
人的一生,會一直在路上,哪有什么能夠準備的盡善盡美的事情,及時行動才是真正的奧義。
下定決心之后就要平時多關注數據,關注互聯網,關注大知乎,培養自己的互聯網和數據分析的思維,改變自己的固有思維。
另外,不要把轉行想的那么難于上青天,對這一行有一個簡單大致的了解,掌握一些基礎知識,面試好好準備,找一份相關的工作還是很easy的。
答主我自己只是在工作的時候學習了一些統計學知識和excel、sql的基本操作、對python有一個初步的了解,花不了兩個星期,更需要認真準備的是你的簡歷和逆向公司所展現的態度。
三、知識技能儲備
A.統計學知識:讀一讀<深入淺出統計學>,對模型/數學量/分析模型有認識
統計知識對于一個優秀數據分析師就像內功之于武林高手,看不出來,但是卻是你武功高強與否的基礎,這門內功博大精深,得假以時日不斷修煉。不過在入行階段花大時間修煉吃力不討好,不妨先了解大概的數理統計概念,深厚的統計內功還得在工作之后不斷努力(借助搜索工具是個很好的辦法)。
基礎概念(重點是怎么得出自己的數據分析結論,客戶和老板不需要知道具體數值,他們需要知道的是,這個價格跌了嗎?為什么跌了?怎么不讓他跌?這些得結合更多的業務知識):
均值、中位數、標準差、方差、概率、加權平均、假設檢驗、假陽性、假陰性、區別估算、顯著性差異、p-value、p1/p25/p50/p75/p99、相關性、因果性、幸存者偏差、大數定律、80/20
這里有一份知乎大佬的解釋匯總,我得空之后好好總結給大家https://zhuanlan.zhihu.com/p/24700344?refer=data93
常用的分析模型(結合實際應用,列了一些比較經典的):
1. SWOT分析:戰略規劃的經典分析工具
S (strengths)是優勢、W (weaknesses)是劣勢,O (opportunities)是機會、T (threats)是威脅。按照企業競爭戰略的完整概念,戰略應是一個企業“能夠做的”(即組織的強項和弱項)和“可能做的”(即環境的機會和威脅)之間的有機組合。
2.PEST分析:組織外部宏觀環境分析工具
PEST分析是指宏觀環境的分析,P是政治(politics),E是經濟(economy),S是社會(society),T是技術(technology)。在分析一個企業集團所處的背景的時候,通常是通過這四個因素來進行分析企業集團所面臨的狀況。
3.麥肯錫三層面分析:企業設計戰略規劃、開拓增長的有效工具
三層面增長理論認為健康的企業增長要綜合平衡管理企業的三個層面的業務:第一層面是守衛和拓展核心業務,第二層面是建立即將涌現增長動力的業務,第三層面是創造有生命力的未來業務。
4.4Ps營銷組合模型:制定市場戰略最經典的營銷理論工具
杰羅姆·麥卡錫(E.Jerome McCarthy)于1960年在其《基礎營銷》(Basic Marketing)一書中第一次將企業的營銷要素歸結四個基本策略的組合,即著名的“4P’s”理論:產品(Product)、價格(Price)、渠道(Place)、促銷(Promotion),由于這四個詞的英文字頭都是P,再加上策略(Strategy),所以簡稱為“4P’s”
5.頭腦風暴法:激發團隊創新的有效決策工具
在群體決策中,由于群體成員心理相互作用影響,易屈于權威或大多數人意見,形成所謂的“群體思維”。群體思維削弱了群體的批判精神和創造力,損害了決策的質量。為了保證群體決策的創造性,提高決策質量,管理上發展了一系列改善群體決策的方法,頭腦風暴法是較為典型的一個。
6.5W2H分析法:一種調查研究和思考問題的有效辦法
發明者用五個以W開頭的英語單詞和兩個以H開頭的英語單詞進行設問,發現解決問題的線索,尋找發明思路,進行設計構思,從而搞出新的發明項目,這就叫做5W2H法。
(1) what——是什么?目的是什么?做什么工作?
(2)why——為什么要做?可不可以不做?有沒有替代方案?
(3)who——誰?由誰來做?
(4)when—何時?什么時間做?什么時機最適宜?
(5)where——何處?在哪里做?
(6)how——怎么做?如何提高效率?如何實施?方法是什么?
(7)howmuch——多少?做到什么程度?數量如何?質量水平如何?費用產出如何?
7.決策樹分析法:現代管理決策者常用的有效工具
決策樹分析法是指分析每個決策或事件(即自然狀態)時,都引出兩個或多個事件和不同的結果,并把這種決策或事件的分支畫成圖形,這種圖形很像一棵樹的枝干,故稱決策樹分析法。
8.STP分析:現代營銷戰略的核心分析工具
STP即目標市場營銷,是指企業根據一定的標準對整體市場進行細分后,從中選擇一個或者多個細分市場作為自身的目標市場,并針對目標市場進行市場定位。
推薦書籍:
《深入淺出統計學》《深入淺出數據分析》推薦在找工作之前閱讀完這兩本。
《女士品茶——20世紀統計學怎樣變革了科學》
《統計陷阱》數字是怎樣欺騙了你
《統計與真理----怎樣運用偶然性》
《統計學的世界》
《愛上統計學》
《漫畫統計學》
《社會心理學》戴維·邁爾斯第8版--這本書作為心理學的教材,超經典。畢業前曾認真讀了一遍,可以看到心理學與統計學的結合
另外推薦網易公開課上的教程:哈里斯堡社區大學公開課:統計學入門_全24集_網易公開課
B.excel
Excel無疑是數據分析師最常用的工具,就我從事數據分析這段時間來看,初級的數據分析師60%的工作都是與excel有關的,包括對SQL調取出來的數據的處理,從公司的各種管理后來調取,進行初步的分析與圖表的制作,包括后期報告的制作都離不開excel。
數據分析師掌握excel,我認為初步入門需要掌握Excel的三項主要功能,與實際工作息息相關。
1.數據透視表(工作和日常運用的神器)
數據透視表 (Pivot Table)是一種交互式的表,可以進行某些計算,如求和與計數等。所進行的計算與數據跟數據透視表中的排列有關。
之所以稱為數據透視表,是因為可以動態地改變它們的版面布置,以便按照不同方式分析數據,也可以重新安排行號、列標和頁字段。每一次改變版面布置時,數據透視表會立即按照新的布置重新計算數據。另外,如果原始數據發生更改,則可以更新數據透視表。
例如,可以水平或者垂直顯示字段值,然后計算每一行或列的合計;也可以將字段值作為行號或列標,在每個行列交匯處計算出各自的數量,然后計算小計和總計。
例如,如果要按季度來分析每個雇員的銷售業績,可以將雇員名稱作為列標放在數據透視表的頂端,將季度名稱作為行號放在表的左側,然后對每一個雇員以季度計算銷售數量,放在每個行和列的交匯處。
2.各種函數,實用的有 sumifs函數,vlookup函數,其他更多的函數可以在實際運用中去搜索引擎尋找,這里先介紹這兩種。
sumifs:sumif函數語法是:SUMIF(range,criteria,sum_range)
sumif函數的參數如下:
第一個參數:Range為條件區域,用于條件判斷的單元格區域。
第二個參數:Criteria是求和條件,由數字、邏輯表達式等組成的判定條件。
第三個參數:Sum_range 為實際求和區域,需要求和的單元格、區域或引用。
當省略第三個參數時,則條件區域就是實際求和區域。
criteria 參數中使用通配符(包括問號 (?) 和星號 (*))。問號匹配任意單個字符;星號匹配任意一串字符。如果要查找實際的問號或星號,請在該字符前鍵入波形符 (~)。
excel sumif函數的實例介紹
實例:求報表中各欄目的總流量
結果如下圖所示。
選中F2單元格,輸入公式:=SUMIF(B2:B19,E2,C2:C19),輸入公式完成后,直接按enter鍵,即可統計出辦公軟件欄目的總流量。
以此類推,選中F3單元格,輸入公式:=SUMIF(B2:B19,E3,C2:C19),輸入公式完成后,直接按enter鍵,可以求得網站
運營欄目的總流量。
選中F4單元格,輸入公式:=SUMIF(B2:B19,E4,C2:C19),可以求得電腦醫院欄目的總流量。
選中F5單元格,輸入公式:=SUMIF(B2:B19,E5,C2:C19),可以求得工具軟件欄目的總流量。
選中F6單元格,輸入公式:=SUMIF(B2:B19,E6,C2:C19),可以求得網絡安全欄目的總流量。
vlookup:
VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)
Lookup_value為需要在數據表第一列中進行查找的數值。Lookup_value 可以為數值、引用或文本字符串。當vlookup函數第一參數省略查找值時,表示用0查找。
Table_array為需要在其中查找數據的數據表。使用對區域或區域名稱的引用。
col_index_num為table_array 中查找數據的數據列序號。col_index_num 為 1 時,返回 table_array 第一列的數值,col_index_num 為 2 時,返回 table_array 第二列的數值,以此類推。如果 col_index_num 小于1,函數 VLOOKUP 返回錯誤值?#VALUE!;如果 col_index_num 大于 table_array 的列數,函數 VLOOKUP 返回錯誤值#REF!。
Range_lookup為一邏輯值,指明函數 VLOOKUP 查找時是精確匹配,還是近似匹配。如果為false或0 ,則返回精確匹配,如果找不到,則返回錯誤值 #N/A。如果 range_lookup 為TRUE或1,函數 VLOOKUP 將查找近似匹配值,也就是說,如果找不到精確匹配值,則返回小于 lookup_value 的最大數值。如果range_lookup 省略,則默認為近似匹配。
3.圖表的制作,excel圖表制作(推薦把誰說菜鳥不會數據分析里的各種圖表都實操一下)
推薦資源: 《誰說菜鳥不會數據分析》
excel論壇:excelhome?Excel教程學習,Excel表格交流,Excel技巧培訓教程下載-ExcelHome技術論壇 -?超多干貨
C.SQL
學習SQl和學習統計學知識一樣,都要記住,它們是工具/理論,最終都是要應用于實踐,為業務服務,所以開始入行不需要了解的太深,了解基礎知識即可。
那么SQL是干嘛的?
要知道,作為一名數據分析是,主要的工作是分為兩部分的,一部分是分析數據,另一部分就是提取數據,滿足各個部門的需求。產品經理會找你要新上線功能的點擊率,跳出率,下載轉化率,廣告部門惠找你要部分特定用戶的imei、手機號等各種各樣的信息。這些就是需求,滿足需求就是你的工作,也就是數據分析,工作的工具就是SQL,編寫各種SQL語言在數據庫里提取滿足條件的數據并整理分析。
所以首先,你得了解數據庫的概念:
在了解數據庫之后可以學習基本的sql語言了。
這個圖就是最常見的一個sql語句,其實認真看一下,其中的語言并不難理解,大致的意思就是選取滿足我給定要求的原始數據,稍稍了解一下sql的各種語句,學習安裝一下常用的數據庫管理軟件,很快就能夠上手。
平時工--作用到的語句主要有:
檢索數據(Select語句)
排序數據(Order by語句)
過濾數據(Where語句)
匯總數據(Group by語句)
聯結數據(Join語句)
在學習的時候著重這幾個語言的應用,90%的需求都是可以解決的。
其他的參考書籍和網站,在工作需要的時候查一下就行了。沒有基礎的人,在三四天集中學習之下也能迅速上手。
推薦書籍及資源:
《數據庫原理》 (選讀)
《MySQL必知必會》(找工作之前請看一遍)
常用的查詢網站:https://www.w3cschool.cn/sql/
《SQL沉思錄》提升期可以一讀
《SQL編程風格》
《SQL權威指南》
D.python:基本了解即可,后期視工作需要是否繼續學習
四、業務知識儲備
行業的運營指標,請自己動手查詢,比如app的運營指標,電商運營指標
五、求職
根據職業規劃定下方向:
我個人找的方向是偏業務方面的數據分析師
職位:數據分析師、數據運營、商業分析
做一份行業的數據分析報告、公司產品體驗報告(展現態度),可能更加考慮的是你的可塑性和思維
第一次很認真地寫文章,還有很多沒寫好,晚上回去繼續碼字,不斷補充
如有不足,請君指出。
手機辛苦碼字,也望大家給個贊。
另外我的一些學習資料均放在了
公眾號:人人都會數據分析
需要自取。?