關(guān)于數(shù)據(jù)分析師的幾個問題之我見!

  • Author: 杜七
  • Date: 2016.06.03

回答朋友關(guān)于『數(shù)據(jù)分析』的幾個問題,匯總于此。

1,市場和環(huán)境

『問』:

  • 1)現(xiàn)在一線城市和二線城市的數(shù)據(jù)分析師真有像報告上所說的那么稀缺嗎?現(xiàn)在的行情是怎樣的呢?

  • 2)數(shù)據(jù)分析師日常的工作是什么?分為哪幾類?傳統(tǒng)公司和互聯(lián)網(wǎng)的數(shù)據(jù)分析師工作有什么不同點嗎?

<u>杜七『答』:</u>

  • 1)目前『數(shù)據(jù)分析師』這個JOB 確實有缺口,為什么呢?這個由『數(shù)據(jù)分析師』本身工作特性決定:

    • 『數(shù)據(jù)分析師』,『數(shù)據(jù)』+『分析』+『師』,這個意味著從業(yè)者需要懂『數(shù)據(jù)』,也要會『分析』,到了『師』的境界,說明有一定的經(jīng)驗積累。一般的大學應屆畢業(yè)生,大學里面沒有類似的專業(yè),懂計算機的不懂數(shù)據(jù),懂數(shù)據(jù)的計算機技能差點,懂數(shù)據(jù)和計算機的邏輯性不好,最大的一個問題是,很多同學對于『定義問題』,『分析問題』,『思考問題』等基本的能力,都不具備,更別問『具體的市場,或者業(yè)務的分析和經(jīng)驗』,所以,應屆畢業(yè)生中『統(tǒng)計學』專業(yè)的相對靠近『數(shù)據(jù)分析師』的基本技能,但是,也僅僅是技能上的靠近。如果畢業(yè)以后不從事這個行業(yè),以后想轉(zhuǎn)行做這個行業(yè),就相對困難一點,畢竟,『隔行如隔山』。另外,上面也側(cè)面提到了,『數(shù)據(jù)分析師』需要具備很多技能,這個比JAVA開發(fā)工程師這樣相對單一技能來說,要復雜一點,所以,這個也是『數(shù)據(jù)分析師』缺的一個原因。
    • 另外,大數(shù)據(jù)火熱的時間比較短,頂多3-5年左右。應屆畢業(yè)生供求少,相應的從業(yè)人才比較少,又加上最近言必稱數(shù)據(jù),公司更是想盡辦法跟大數(shù)據(jù)沾邊,對于數(shù)據(jù)人才需求量大。尤其是互聯(lián)網(wǎng)公司的發(fā)展太快,互聯(lián)網(wǎng)公司對于數(shù)據(jù)人才的需求更大。儲備少 VS 需求大,自然就有缺口了。
    • 目前數(shù)據(jù)分析的行情,不同的公司和職位有不同的情況,大概介于『運營、產(chǎn)品』和『開發(fā)』之間吧。
  • 2)

    • 傳統(tǒng)互聯(lián)網(wǎng)公司我沒有待過,不敢說了解。但是從我自己對于『數(shù)據(jù)分析師』的了解,我猜除了分析和研究的業(yè)務有不同,本質(zhì)上沒有差別。舉個例子,A股是傳統(tǒng)企業(yè)公司,美股是互聯(lián)網(wǎng)公司,2個股市不一樣,但是,作為一名投資者,對于『基本面』、『資金面』和『情緒面』的研究方法,邏輯推理,投資方法,我覺得是一樣的,不會有差異。但是,涉及到具體的A股和美股不同的股市,具體操作的時候,會一些區(qū)別。古話說:萬變不離其宗 。
    • 數(shù)據(jù)分析師日常工作,大概有如下的幾方面(當然,各公司業(yè)務發(fā)展階段不同,稍有差異),核心都是圍繞『數(shù)據(jù)』,挖掘其價值:
      • 提供基礎報表,滿足基礎需求
      • 分析業(yè)務和產(chǎn)品,提供業(yè)務運營和產(chǎn)品優(yōu)化建議
      • 提供戰(zhàn)略分析和戰(zhàn)略性報告
      • 開發(fā)數(shù)據(jù)產(chǎn)品
    • 基本的工作是前三個,后面一個數(shù)據(jù)產(chǎn)品開發(fā),主要是數(shù)據(jù)產(chǎn)品經(jīng)理去做的,但是也不一定。可能是分析師提需求,其他人去做。

2,技能

問:

1)我目前比較熟悉 Python 的基礎數(shù)據(jù)包(Numpy,Pandas,Matplotlib 等)和 Linux Shell,Keynote、AI、Ps 做報告展現(xiàn)也沒啥問題,做過 5 年銷售,一年風投經(jīng)理,但數(shù)學和統(tǒng)計較弱,英語也一般,能找到合適的數(shù)據(jù)分析工作嗎?

2) 數(shù)據(jù)分析從入門到進階的路線是什么?核心技能是什么呢?至少要懂那些東西才能上手干活?

3) SQL 在數(shù)據(jù)分析工作很重要嗎?常用的 SQL 工具有哪些呢?

4)數(shù)據(jù)挖掘和數(shù)據(jù)分析的區(qū)別是什么呢?做數(shù)據(jù)分析一定要懂數(shù)據(jù)挖掘嗎?需要懂到什么程度呢?

<u>杜七『答』:</u>

  • 1)『數(shù)據(jù)分析師』職位,也有初、中、高級的區(qū)分,比如你去阿里巴巴崗位搜索『數(shù)據(jù)分析師』,會有『數(shù)據(jù)分析師』,『數(shù)據(jù)分析專家』等區(qū)分,所以,要求不也有,對于求職者的技能要求也不一樣。會Python,不是優(yōu)勢,反而你做過『一年風投精力』會給你的經(jīng)歷增色,為什么呢?一個好的數(shù)據(jù)分析師,一定是一個『商業(yè)分析家』,正確的定義問題,思考問題,找到解決辦法,才是一名合格的分析師需要具備的技能。所以,你肯定可以找到一份數(shù)據(jù)分析的工作。
  • 2)說到『從入門到進階的路線』,我個人覺得沒有一個明確和固定的路線,不像JAVA,從看《think in java》開始,到《如何治療頸椎病》結(jié)束。每個人都會『分析』,都有想法,也都有自己的『看法』。不過,分析師需要具備的技能,看值得分析師新同學關(guān)注的“軟技能”!這篇文章吧。這個是我自己的個人經(jīng)驗總結(jié),期望對你有幫助。
    -3)SQL主要是用來做數(shù)據(jù)提取的。目前公司的數(shù)據(jù),很多都放在數(shù)據(jù)庫,比如MySQL,mangoDB,等等;如果是ODPS,HIVE,也是sql提取,所以,這種情況讓別人覺得SQL很重要。其實,SQL也是一個技能。我們做數(shù)據(jù)分析,必須要把數(shù)據(jù)提取出來,這個是第一步。提取出來以后,再分析,是第二步。其實,在阿里巴巴這么高大上的公司,一個分析師會SQL+EXCEL+PPT,基本就可以把活干完了。相信么? 所以,只要會SQL的基本語法,會寫SQL代碼,寫個1W行,基本SQL就不是問題了。
  • 4)數(shù)據(jù)分析和數(shù)據(jù)挖掘,廣義的『數(shù)據(jù)分析』包括了數(shù)據(jù)挖掘,狹義的說呢,它們的目的一樣,都是挖掘數(shù)據(jù)的價值,但是過程和方法不一樣。『數(shù)據(jù)挖掘』偏重研究數(shù)據(jù)中的規(guī)律和模式,規(guī)律、模式一定要通過工具來挖掘;『數(shù)據(jù)分析』一般分析目標相對明確,從數(shù)據(jù)得到一些信息,不用那么深的規(guī)律的探討。做數(shù)據(jù)分析,不一定非要懂那么多數(shù)據(jù)挖掘的算法,或者機器學習。當然,技多不壓身,懂的東西越多越好。至于具體的一個『業(yè)務問題』的分析,一般不會涉及到復雜的『數(shù)據(jù)挖掘』,統(tǒng)計方法就夠了。

3,其他

問:

-2)會 Python 還需要學 R 嗎?他們在做數(shù)據(jù)分析時各自的優(yōu)劣是什么呢?

<u>杜七『答』:</u>

  • 1)這個書單和計劃,怎么說呢,挺完美。但是,要看完這些書,學會這些技術(shù),消化掉,很難。之前值得分析師新同學關(guān)注的“軟技能”!的文章里面我也推薦了一個書單,我覺得分析師的核心技能,還是『軟技能』方面的,比如,正確定義問題,分析問題,找到問題的串聯(lián)點,怎么樣去解決問題,如何正確的思考問題,這些才是分析師的『核心技能』。所以,我特別贊同查理芒格說的一句話:『不要做一名股票分析家,而要做一名商業(yè)分析家』。分析師亦然。 我個人覺得完美的學習計劃,不如這樣。找一家公司的IPO報告,然后仔細的研究這個IPO的報告,研究這個公司的發(fā)展和變化,以及股票的變化,思考一些問題。用到了分析的軟件,就去學習,學完了立馬使用它去研究IPO報告,等等。這種方法,比看XX軟件學習技能好多了。
  • 2)Python和R,一把是倚天劍,一把是屠龍刀。兩個都好。在高手那里,它們沒有半點區(qū)別。不用糾結(jié)。精通一個就夠用了。大部分的問題分析,用不到邏輯回歸和機器學習。

4,總結(jié)

其實,朋友問的幾個問題,基本涉及了『數(shù)據(jù)分析師』技能技能,工作內(nèi)容,成長路線等等,這里簡單再總結(jié)一下:

  • 數(shù)據(jù)分析師,工作涉及到『數(shù)據(jù)提取』,『數(shù)據(jù)整理』,『數(shù)據(jù)分析』,『數(shù)據(jù)報告』等幾個方面。
  • 『數(shù)據(jù)提取』這塊,目前SQL是必須要掌握的,上面也提到了。另外,有些時候可能也會用到爬蟲,爬取一些數(shù)據(jù);
  • 『數(shù)據(jù)整理』這部分,python和R,二者取其一就夠了。不多說。簡單的數(shù)據(jù),Excel就夠用了。目前做數(shù)據(jù)分析師用Excel打天下的,估計有90%。
  • 『數(shù)據(jù)分析』,這部分理解為『探索性數(shù)據(jù)分析』吧,比如做一些統(tǒng)計圖,統(tǒng)計方法來分析一些問題,研究方差變化,等等。這個方面,『軟技能』更需要,比如問題的定義,問題的分析,等等。當然,為了更大程度的挖掘信息,會用『數(shù)據(jù)挖掘』的方法,等等。從外界看,貌似會建模和挖掘,就高大上了,用excel就不高大上了。貌似巴菲特用電腦只會打橋牌,不會所謂的『股票挖掘和預測模型』,但是,不影響他是一個偉大的投資和理財家。想想他的投資理財?shù)幕貓舐剩H人們,你們不覺得你會excel就很牛了么?
  • 『數(shù)據(jù)報告』,好了,前面所有的提取,整理,分析,都是過程,『報告』才是我們做這個數(shù)據(jù)分析的一個『結(jié)果』。如果它有意義,對別人有幫助,OK,我們做的工作有意義了。如果它不正確,更沒有意義。前面的付出都是『一江春水向東流』,拜拜了。 大部分的報告,是PPT或者郵件形式。這部分,因為做個PPT不會特別復雜,大家都不關(guān)注。其實,它也是有很多技巧的。不展開了。
  • 最后說一點東西,關(guān)于『數(shù)據(jù)分析師』,舉一個巴菲特的例子。他不會挖掘算法,不會建模,但是他有一套自己的分析問題,解決問題的『模型框架』,他會自己去分析公司的財務數(shù)據(jù),分析經(jīng)濟發(fā)展走勢,等等。巴菲特,不是一個好的分析師么? 相信大家明白『數(shù)據(jù)分析師』的核心技能是什么了。
  • 晚安。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內(nèi)容