基于拉勾網(wǎng)的成都市數(shù)據(jù)科學(xué)職位分析報(bào)告

本文通過查詢相關(guān)資料,明確了市場上數(shù)據(jù)科學(xué)的相關(guān)職位,繼而確定了搜索職位為:數(shù)據(jù)分析師、算法工程師、數(shù)據(jù)挖掘、數(shù)據(jù)運(yùn)營、數(shù)據(jù)產(chǎn)品經(jīng)理、大數(shù)據(jù)工程師等。通過分析求職者的需求,確定了爬蟲的關(guān)鍵詞為工作經(jīng)驗(yàn)、學(xué)歷要求、公司發(fā)展階段、公司規(guī)模、薪資待遇、崗位職責(zé)、任職要求等。采用Python軟件對(duì)拉鉤網(wǎng)的數(shù)據(jù)進(jìn)行了爬取,接著將爬取的數(shù)據(jù)進(jìn)行去重等清洗工作,得到可供直接分析的數(shù)據(jù);最后通過Python和Excel等工具對(duì)數(shù)據(jù)進(jìn)行分析和探索,最終得到該分析報(bào)告,以期為求職者提供高價(jià)值的參考。

1 總體指標(biāo)分析

1.1學(xué)歷要求

學(xué)歷要求包括本科、碩士、博士、大專和不限這五類,考慮到數(shù)據(jù)行業(yè)的入門門檻較高的特點(diǎn),大專以下學(xué)歷能夠從事相關(guān)工作屬于小概率事件,因此將不限歸于大專這一檔。最終分析得出招聘單位對(duì)求職者的學(xué)歷要求情況如下圖:


圖1 學(xué)歷要求分布圖

由圖1可見,招聘崗位要求學(xué)歷為本科的占比最高,達(dá)到3/4;其次為大專,占比近20%;而要求求職者為碩士及以上學(xué)歷的企業(yè)占比較低,僅為6%。對(duì)原始數(shù)據(jù)進(jìn)一步分析發(fā)現(xiàn):學(xué)歷要求為碩士及以上的職位則主要集中在算法工程師、數(shù)據(jù)挖掘等對(duì)數(shù)學(xué)要求比較高的崗位。

1.2工作經(jīng)驗(yàn)

原始數(shù)據(jù)中存在“不限”和“1年以下”兩類工作經(jīng)驗(yàn),從含義上講,“不限”顯然是對(duì)招聘單位對(duì)求職者的經(jīng)驗(yàn)不作要求,因此將兩者合并為 “一年以下”工作經(jīng)驗(yàn)。最終分析得出招聘單位對(duì)求職者的工作經(jīng)驗(yàn)要求情況如下圖:


圖2 工作經(jīng)驗(yàn)分布圖

由圖2可知,1)要求求職者具備3-5年工作經(jīng)驗(yàn)的崗位最多,占比達(dá)到46%;2)要求工作經(jīng)驗(yàn)達(dá)為1-3年和5-10年的崗位分居2、3位,占比分別為28%和13%;3)對(duì)于具備1年以下工作經(jīng)驗(yàn)的崗位也達(dá)到12.5%。可見,求職市場對(duì)具備一定工作經(jīng)驗(yàn),能夠獨(dú)立勝任工作或者具備帶團(tuán)隊(duì)工作的人才非常需要,而對(duì)1年以下工作經(jīng)驗(yàn)的需求,也表明該行業(yè)對(duì)人才具有一定的缺口。

1.3薪資分布

由于網(wǎng)站上同一崗位的薪資并不是一個(gè)確定值,而是一個(gè)范圍值,為了便于進(jìn)行數(shù)學(xué)上的分析,取薪資范圍的上限與下限的均值作為該崗位的薪資待遇情況,同時(shí)將所得的薪資分為[0k,5k)、[5k,10k)、10k,15k)、[15k,20k)、[20k,+∞)這五個(gè)檔位。最終分析得出招聘單位對(duì)求職者提供的薪資情況如下圖:


圖3 薪資情況分布圖

由圖3可知,平均月薪位于[10k,15k)范圍的占比最大,超過30%;而平均月薪位于[15k,20k)范圍內(nèi)以及[5k,10k)范圍內(nèi)的占比也超過0%;值得注意的是月薪在[20k,+∞)范圍內(nèi)占比也達(dá)到了17%;而[0k,5k)的占比極少。
從領(lǐng)取的薪水與工作能力相關(guān)的角度來看,招聘崗位除了需要對(duì)業(yè)務(wù)熟練的有經(jīng)驗(yàn)員工,也非常渴望能夠帶領(lǐng)團(tuán)隊(duì)的骨干型人才(薪水對(duì)應(yīng)著[20k,+∞)范圍)。

1.4企業(yè)規(guī)模

通過對(duì)原始數(shù)據(jù)的企業(yè)規(guī)模分析,得出招聘單位的企業(yè)規(guī)模情況如下圖:


圖4 企業(yè)規(guī)模分布圖

從公司規(guī)模來看,職工人數(shù)在150-550人數(shù)的公司數(shù)量最多,達(dá)到220家,而15人到500人范圍內(nèi)的公司占比超過80%,可見招聘企業(yè)主要以中小型企業(yè)為主。

1.5企業(yè)發(fā)展階段

通過分析原始數(shù)據(jù)的企業(yè)發(fā)展階段,得出招聘單位的企業(yè)發(fā)展規(guī)模情況如下圖:


圖5 企業(yè)發(fā)展階段分布圖

從公司發(fā)展階段來看,成長型企業(yè)和初創(chuàng)型企業(yè)的占比接近90%,而成熟型企業(yè)數(shù)量只占10%,可見新型企業(yè)是數(shù)據(jù)科學(xué)相關(guān)職位招聘主力軍。


圖6 所屬行業(yè)分布圖

1.6所屬行業(yè)

很多企業(yè)的所屬行業(yè)包含多個(gè),并且很多行業(yè)指代不清(比如移動(dòng)互聯(lián)網(wǎng)行業(yè)),應(yīng)對(duì)方式如下:1)包含多個(gè)行業(yè)的情況,認(rèn)為第一個(gè)行業(yè)是其主要行業(yè),取第一行業(yè)為其所屬行業(yè);2)對(duì)于第一個(gè)行業(yè)指代不明的情況(例如“移動(dòng)互聯(lián)網(wǎng)”),采用第二行業(yè)為其行業(yè)所屬。通過分析得出招聘單位所屬行業(yè)情況如下圖示:


圖6 所屬行業(yè)分布

可見,數(shù)據(jù)相關(guān)職位需求最大的行業(yè)是電子商務(wù)、數(shù)據(jù)服務(wù)、金融等三個(gè)行業(yè),其占比超過50%,同時(shí)需求量最大的前四個(gè)行業(yè)占比達(dá)到60%。

1.7結(jié)論

通過對(duì)拉勾網(wǎng)成都市數(shù)據(jù)相關(guān)崗位的分析,可以得出:
1)本科和大專學(xué)歷能夠滿足市場上絕大多數(shù)崗位要求,要求學(xué)歷為本科和大專的占比分別為70%和20%;
2)招聘崗位比較看重求職者工作經(jīng)驗(yàn):要求求職者具備3-5年和1-3年工作經(jīng)驗(yàn)的崗位達(dá)到85%;但是對(duì)1年以下工作經(jīng)驗(yàn)的人員也有一定需求,占比達(dá)到12.5%;
3)總體薪資待遇偏高:主要集中在[5k,10k)、[10k,15k)、[15k,20k)這三個(gè)區(qū)間范圍內(nèi),占比達(dá)到80%;而[20k,+∞)范圍的占比也能達(dá)到17.6%;
4)招聘企業(yè)主要以中小企業(yè)為主,員工人數(shù)為15-500人的公司占比達(dá)到80%;
5)絕大多數(shù)公司為成長型和初創(chuàng)型企業(yè),占比達(dá)到90%:
6)從企業(yè)所處行業(yè)來看,電子商務(wù)、數(shù)據(jù)服務(wù)、金融是需求量最大的行業(yè),占比超過50%。

2 數(shù)據(jù)探索

求職者比較關(guān)心職位要求的工作經(jīng)驗(yàn)、學(xué)歷要求和薪資待遇方面的問題,那么從統(tǒng)計(jì)學(xué)的角度來看,企業(yè)發(fā)展階段和公司規(guī)模與這些因素是否具備相關(guān)性?如果具備,具體是怎樣的關(guān)系?

2.1 相關(guān)性檢驗(yàn)

很多情況下,采用參數(shù)檢驗(yàn)的方法進(jìn)行統(tǒng)計(jì)量的推斷,但是本課題下,由于信息太少等原因,無法對(duì)總體分布形態(tài)做簡單假定,因此此處采用非參數(shù)檢驗(yàn)的方法進(jìn)行相關(guān)性探討;同時(shí),考慮到我們分析變量為多項(xiàng)分類型變量,因此考慮采用卡方檢驗(yàn)的方式進(jìn)行相關(guān)性檢驗(yàn),其目的是通過對(duì)樣本的分析,推斷其總體分布是否與理論分布相吻合,從而判斷兩個(gè)或多個(gè)變量之間的關(guān)聯(lián)性。
其基本判斷過程如下:
1)假設(shè):H0,理論次數(shù)與實(shí)際次數(shù)相符,即是卡方值χ2為0;
顯著水平確定:設(shè)定該犯錯(cuò)誤概率(即顯著水平)為0.05;
計(jì)算期望值:
根據(jù)樣本,采用極大似然估計(jì)計(jì)算出兩兩變量的期望值,并通過雙向表的形式列出,雙向表內(nèi)部表格直接列出。
檢驗(yàn)計(jì)算:
計(jì)算出兩類變量的自由度n,并計(jì)算自由度為n,顯著水平為0.05條件下的臨界卡方值;通過雙向表列出樣本的實(shí)際次數(shù)f0。
計(jì)算卡方值:


卡方值計(jì)算公式

并比較,計(jì)算卡方值與臨界卡方值,如果卡方值小于臨界值,則表明這兩類變量具備統(tǒng)計(jì)學(xué)意義上的相關(guān)性。此時(shí)可進(jìn)行進(jìn)一步的規(guī)律分析。

2.2 企業(yè)發(fā)展階段探索

本節(jié)討論企業(yè)發(fā)展階段與學(xué)歷要求、工作經(jīng)驗(yàn)和薪資待遇等因素間的相關(guān)性,并提煉出基本規(guī)律,以指導(dǎo)求職者。

2.2.1 學(xué)歷要求探索

1)相關(guān)性檢驗(yàn):

假設(shè):H0:理論次數(shù)與實(shí)際次數(shù)相符,即是卡方值χ2為0;
顯著水平確定:按照慣例,設(shè)定該犯錯(cuò)誤概率(即顯著水平)為0.05;
計(jì)算期望值:
期望值采用極大似然估計(jì)進(jìn)行計(jì)算,最后達(dá)到如下期望值fe:


表1 不同類型企業(yè)學(xué)歷需求期望值

檢驗(yàn)計(jì)算:
本問題中企業(yè)的發(fā)展階段分為三類,而工作經(jīng)驗(yàn)分為四類,所以自由度為6;樣本實(shí)際次數(shù)f0如下圖所示:

表2 不同類型企業(yè)學(xué)歷要求實(shí)際值

計(jì)算卡方值:



通過查表知道,自由度為6,顯著水平為0.05的臨界卡方值為12.59,顯然計(jì)算卡方值小于臨界卡方值,所以其公司發(fā)展階段與工作經(jīng)驗(yàn)具備統(tǒng)計(jì)學(xué)意義上的相關(guān)性。

2)學(xué)歷要求規(guī)律分析

圖7 學(xué)歷要求需求量分布

圖8 學(xué)歷要求需求比例分布

由圖7知,成長型企業(yè)招聘總?cè)藬?shù)是所以類型企業(yè)中最多,同時(shí)不同學(xué)歷的需求量也是最大;由圖8可知,1)不同發(fā)展階段企業(yè)對(duì)本科學(xué)歷和大專學(xué)歷的要求均非常高;總占比超過90%;且隨著企業(yè)的不斷發(fā)展,對(duì)本科學(xué)歷需求比例遞增,大專學(xué)歷需求比例遞減;2)初創(chuàng)型企業(yè)和成長型企業(yè)對(duì)碩士及博士學(xué)位有一定需求,而成熟型企業(yè)需求極少;

2.2.2工作經(jīng)驗(yàn)探索

通過卡方檢驗(yàn),企業(yè)發(fā)展階段與薪資待遇具有統(tǒng)計(jì)學(xué)意義上的關(guān)聯(lián)性。因此對(duì)其進(jìn)行如下分析:


圖9 工作經(jīng)驗(yàn)需求量分布

圖10 工作經(jīng)驗(yàn)需求比例分布

由圖9知,無論是對(duì)總?cè)藬?shù)的需求還是對(duì)不同經(jīng)驗(yàn)人員的需求,成長型企業(yè)的需求量均是最多,初創(chuàng)型企業(yè)需求量其次;
由圖10知:1)不同階段企業(yè)對(duì)3-5年工作經(jīng)驗(yàn)的需求比例最大,其次是1-3年工作經(jīng)驗(yàn),但是對(duì)兩者的需求比例之和無差異,占比均為75%;2)成長型企業(yè)對(duì)3-5年工作經(jīng)驗(yàn)人員需求比例很大,是1-3年工作經(jīng)驗(yàn)需求比例的2倍,遠(yuǎn)超其他發(fā)展階段企業(yè);3)不同階段企業(yè)對(duì)1年以下和5-10工作經(jīng)驗(yàn)人員的需求比例相對(duì)穩(wěn)定,并無大的差異。

2.2.3 薪資探索

通過卡方檢驗(yàn),企業(yè)發(fā)展階段與薪資待遇具有統(tǒng)計(jì)學(xué)意義上的相關(guān)性。因此對(duì)其進(jìn)行如下分析:


圖11 薪資待遇的需求量分布圖

圖12 薪資待遇的需求比例分布圖

由圖11知,無論從總需求量還是從各個(gè)經(jīng)驗(yàn)階段的需求量看,呈現(xiàn)規(guī)律:成長型>初創(chuàng)型>成熟型。由圖12可知,1)初創(chuàng)型企業(yè)對(duì)[10k,15k)范圍內(nèi)的需求比例最高,為其他各個(gè)范圍需求量的1.7倍余;2)成長型企業(yè)對(duì)[5k,20k)范圍人才的需求比例最大,且呈現(xiàn)規(guī)律:[10k,15k) > [15k,20k) >[5k,10k);3)成熟型企業(yè)對(duì)各個(gè)薪資待遇范圍的人才需求相對(duì)均衡;4)橫向?qū)Ρ葋砜矗砷L型企業(yè)對(duì)[20k,+∞)范圍的高端人才和[0k,5k)入門級(jí)別人員的需求比例明顯少于其他階段企業(yè)。

2.2.4 結(jié)論

1)本科和大專學(xué)歷可以應(yīng)付絕大多數(shù)的職位需求;
2)對(duì)工作經(jīng)驗(yàn)小于1年的求職者的需求比例超過12%,因此依然有機(jī)會(huì);
3)無論是在求職市場上的需求總?cè)藬?shù),還是對(duì)不同學(xué)歷、工作經(jīng)驗(yàn)和薪資情況的需求人數(shù)來說,招聘數(shù)量均呈現(xiàn)如下規(guī)律:成長型企業(yè)>初創(chuàng)型企業(yè)>成熟型企業(yè),因此選擇進(jìn)入企業(yè)的優(yōu)先級(jí)別如下:成長型企業(yè)>初創(chuàng)型企業(yè)>成熟型企業(yè)。
4)從稀缺表明價(jià)值越大的角度來看,企業(yè)對(duì)不同類型人才的需求比例越高,表明該類人才在該企業(yè)越稀缺,因而其發(fā)展空間也會(huì)相對(duì)更大。基于此,得到更進(jìn)一步的擇業(yè)建議:
a.本科學(xué)歷更應(yīng)該去成熟型企業(yè),大專學(xué)歷更應(yīng)該去初創(chuàng)型企業(yè),碩士及以上學(xué)歷者應(yīng)該選擇初創(chuàng)或成長型企業(yè)。
b.對(duì)于3-5年工作經(jīng)驗(yàn)人員,應(yīng)優(yōu)先選擇成長性企業(yè);對(duì)于1-3年工作經(jīng)驗(yàn)優(yōu)先選擇初創(chuàng)型企業(yè);其余工作經(jīng)驗(yàn)人員按照3)中方法進(jìn)行選擇;
c.薪資要求在[10k,15k)和[20k,+∞)范圍的求職者,應(yīng)優(yōu)先選擇初創(chuàng)型企業(yè),而薪資要求在[15k,20k)范圍的求職者,應(yīng)優(yōu)先考慮成長型企業(yè)和成熟型企業(yè),其余薪資要求求職者按照3)中方法進(jìn)行選擇;

2.3公司規(guī)模探索

2.3.1 學(xué)歷要求探索

通過卡方檢驗(yàn),公司規(guī)模與學(xué)歷之間具備數(shù)學(xué)統(tǒng)計(jì)意義上的相關(guān)性。現(xiàn)對(duì)其進(jìn)行進(jìn)一步分析,結(jié)果如下圖示:


圖13 不同層次學(xué)歷需求量

從圖13知,1)企業(yè)規(guī)模在15-500人范圍內(nèi)時(shí),隨著規(guī)模的擴(kuò)大,其招聘人數(shù)不斷增加,其中本科學(xué)歷人數(shù)增多明顯,大專學(xué)歷需求人數(shù)基本不變;2)150-500人規(guī)模的企業(yè)對(duì)碩士學(xué)歷的需求大于其他規(guī)模企業(yè),但是需求量依然很少;3)500人以上規(guī)模企業(yè)對(duì)人才需求較少。


圖14 不同層次學(xué)歷需求比例

從圖14來看,1)隨著公司規(guī)模的擴(kuò)大,對(duì)本科學(xué)歷的需求比例逐漸增加,對(duì)大專學(xué)歷的需求比例逐漸降低,其中,500-2000人規(guī)模的企業(yè),本科需求比例最高,超過85%,大專需求比例最低,僅為8.5%;2)除少于15人規(guī)模的企業(yè)外,其余規(guī)模企業(yè)對(duì)本科及大專學(xué)歷的需求超過90%,而對(duì)碩士及以上學(xué)歷的需求極少,為6%左右;

2.3.2 工作經(jīng)驗(yàn)探索

通過卡方檢驗(yàn),公司規(guī)模與工作經(jīng)驗(yàn)具備統(tǒng)計(jì)學(xué)意義上的相關(guān)性。現(xiàn)對(duì)工作經(jīng)驗(yàn)做如下分析:


圖15 不同層次工作經(jīng)驗(yàn)需求量

由圖15可知,1)企業(yè)規(guī)模小于500人時(shí),隨著企業(yè)規(guī)模的增大,其人員總需求量及不同工作經(jīng)驗(yàn)人員的需求量均不斷增加,其中150-500人規(guī)模的企業(yè)對(duì)人才的需求最大;2)不同規(guī)模企業(yè)對(duì)3-5年工作經(jīng)驗(yàn)的求職者需求最為旺盛,其次是1-3年工作經(jīng)驗(yàn)的求職者;3)500人以上的企業(yè)對(duì)人才需求量相對(duì)較少。


圖16 不同層次工作經(jīng)驗(yàn)需求比例

由圖16知,1)規(guī)模小于500人的企業(yè),對(duì)5-10年及1年以下工作經(jīng)驗(yàn)人員的需求比例相對(duì)穩(wěn)定,為25%;而對(duì)1-5年范圍工作經(jīng)驗(yàn)人員需求比例維持在75%;2)規(guī)模小于500人的企業(yè),隨著規(guī)模的擴(kuò)大,對(duì)3-5年工作經(jīng)驗(yàn)需求比例不斷增加,對(duì)1-3年工作經(jīng)驗(yàn)需求比例不斷降低,150-500人規(guī)模的企業(yè)對(duì)3-5年工作經(jīng)驗(yàn)的需求比例是1-3年工作經(jīng)驗(yàn)的2.5倍;3)500-2000人規(guī)模企業(yè)對(duì)1年以下工作經(jīng)驗(yàn)的需求比例極少;4)2000人以上規(guī)模企業(yè)對(duì)大專學(xué)歷的需求最少,而對(duì)5-10年工作經(jīng)驗(yàn)人員的需求最高。

2.3.3 薪資探索

通過卡方檢驗(yàn),公司發(fā)展規(guī)模與薪資待遇存在統(tǒng)計(jì)學(xué)意義上的相關(guān)性。進(jìn)一步分析,得到如下結(jié)果:


圖17 不同薪資的需求量

由圖17知,1)15到500人規(guī)模的企業(yè),隨著企業(yè)規(guī)模的增大,對(duì)人才需求量也越大,而500人以上企業(yè)對(duì)人才的需求相對(duì)較小;2)各類企業(yè)對(duì)薪資待遇位于[5k, 20k)范圍的職位需求量最大,而大于20k的高端人才,需求量相對(duì)較小;


圖18 不同薪資的需求比例

由圖18知,1)規(guī)模大于15人的企業(yè),對(duì)薪資待遇位于[5k, 20k)范圍的職位需求最大,占比接近80%;2)15-50人規(guī)模的企業(yè)對(duì)[10k, 15k)范圍的需求旺盛,占比超過40%,超過其他薪資范圍比例的2倍;3)各類企業(yè)對(duì)高端人才的需求比較穩(wěn)定,其占比為15%~20%;4)人數(shù)少于15人的企業(yè),雖然總的需求數(shù)量較少,對(duì)[10k, +∞)范圍內(nèi)的人才需求比較旺盛,其占比超過80%,為所有企業(yè)之最。

2.3.4 結(jié)論

1)無論是在求職市場上的需求總?cè)藬?shù),還是對(duì)不同學(xué)歷、工作經(jīng)驗(yàn)和薪資情況的需求人數(shù)來說,招聘數(shù)量均呈現(xiàn)如下規(guī)律:150-500人企業(yè)>50-150人企業(yè)>15-50人企業(yè)>500-2000人企業(yè)>2000人以上企業(yè),若不考慮其他因素的情況下,求職者在選擇企業(yè)時(shí),其選擇的優(yōu)先級(jí)別應(yīng)按照上述順序;
2)隨著企業(yè)規(guī)模的增大,對(duì)本科學(xué)歷的需求比例不斷增大,并且在15-500人范圍內(nèi),企業(yè)規(guī)模越大,需求人數(shù)越多,因此,本科學(xué)歷求職者的最優(yōu)選擇是150-500人規(guī)模的企業(yè)。雖然15-50人和50-150規(guī)模企業(yè)對(duì)本科學(xué)歷的需求人數(shù)遠(yuǎn)多于500人以上規(guī)模企業(yè),但是由于企業(yè)規(guī)模較小,處于發(fā)展初期,其抗風(fēng)險(xiǎn)能力可能較差,此時(shí)的選擇需要求職者自行平衡風(fēng)險(xiǎn)和發(fā)展前景;
3)企業(yè)規(guī)模越大,對(duì)大專學(xué)歷求職者的需求人數(shù)并沒有發(fā)生明顯變化,其需求比例反而下降,因此,對(duì)于大專學(xué)歷求職者而言,選擇規(guī)模較小的企業(yè)進(jìn)行歷練可能是一個(gè)比較好的選擇;
4)對(duì)3-5年工作經(jīng)驗(yàn)的求職者來說,由于不同規(guī)模企業(yè)的需求量和需求比例均是最高的,考慮上企業(yè)的平臺(tái)和抗風(fēng)險(xiǎn)能力,最優(yōu)選擇是150-500人規(guī)模企業(yè);
5)對(duì)于1-3年工作經(jīng)驗(yàn)求職者,雖然隨著企業(yè)規(guī)模的增加,其需求量有輕微增加,但是其需求的比例總體上是減少的,因此對(duì)于該類求職者而言,選擇規(guī)模較小的企業(yè)進(jìn)行歷練或許是一個(gè)不錯(cuò)的選擇。
6)對(duì)于5-10年工作經(jīng)驗(yàn)求職者更多的應(yīng)該考慮企業(yè)的發(fā)展空間,由于2000人以上企業(yè)對(duì)該類型人才的需求比例最大,因此2000人以上企業(yè)對(duì)于其是個(gè)不錯(cuò)的選擇。
7)薪資期望在5k-20k范圍的求職者,無論是需求量還是需求比例均是較高,因此求職時(shí)因更多的考慮發(fā)展空間,選擇需求比例較高的規(guī)模企業(yè)或許是一個(gè)更好的選擇。

2.4 企業(yè)規(guī)模與發(fā)展階段探索

通過卡方檢驗(yàn)發(fā)現(xiàn),公司規(guī)模與公司發(fā)展階段之間并不存在統(tǒng)計(jì)學(xué)意義上的相關(guān)性;

3 詞云探索

通過以上分析,我們了解了成都市大數(shù)據(jù)行業(yè)的總體描述。但對(duì)于求職者而言,需要進(jìn)一步了解企業(yè)招聘相關(guān)行業(yè)的崗位職責(zé)和任職要求。由于上述分析涉及到多個(gè)職位,這些職位招聘的崗位職責(zé)和任職要求并不相同,因此下文選取一個(gè)崗位(數(shù)據(jù)分析師)進(jìn)行解讀。

3.1 崗位職責(zé)詞云分析

考慮到句子最核心的部分是名詞和動(dòng)詞,前者表示了所要描述的對(duì)象,后者表示了對(duì)描述對(duì)象(名詞)所要采取的行動(dòng),因此分別對(duì)崗位職責(zé)描述語句中的動(dòng)詞和名詞進(jìn)行詞云分析。
主要過程如下:根據(jù)崗位職責(zé)的描述,通過抽取樣本的方式進(jìn)行自定義字典設(shè)計(jì);通過Python jieba對(duì)爬取的崗位職責(zé)語句進(jìn)行分詞處理;在excel中進(jìn)行分詞的清洗;最后通過Python WordCloud 生成詞云。最后得出的詞云如下:


圖19 名詞詞云展示

圖20 動(dòng)詞詞云展示

3.1.1 詞云解讀

1)名詞出現(xiàn)頻次較高的詞語可以分為以下幾類:(1)數(shù)據(jù)分析、數(shù)據(jù)挖掘、建模等,與分析方式相關(guān)的詞語;(2)分析報(bào)告、報(bào)表、報(bào)告等,與展示方式相關(guān)的詞匯;(3)策略、數(shù)據(jù)支持、商業(yè)價(jià)值、趨勢等,與分析目的相關(guān)的詞匯;(4)Spark、Hadoop等,與需求軟件相關(guān)的詞匯;
2)動(dòng)詞詞云中出現(xiàn)頻次較高的詞語則包括:結(jié)合、理解、應(yīng)用、參與、跟蹤、優(yōu)化、發(fā)現(xiàn)、管理等。

3.1.2 結(jié)論分析

我們可以有一個(gè)數(shù)據(jù)分析崗位的初略認(rèn)識(shí):結(jié)合對(duì)業(yè)務(wù)本身的理解,通過相關(guān)軟件,對(duì)采集的數(shù)據(jù)進(jìn)行分析和挖掘,采用報(bào)表、分析報(bào)告等形式,以達(dá)到發(fā)現(xiàn)運(yùn)營和管理過程中的不足,挖掘出發(fā)現(xiàn)趨勢,并給相關(guān)部門的決策行為提供數(shù)據(jù)支持。

3.2 任職要求詞云分析

采用3.1中的分析思路和分析流程,得出任職要求的全部詞性詞云和名詞詞云:


圖21 全部詞性詞云

圖22 名詞詞云

3.2.1詞云解讀

1)詞云中出現(xiàn)頻次較高的詞云分為:(1)相關(guān)專業(yè)、工作經(jīng)驗(yàn)”、經(jīng)驗(yàn)等,與經(jīng)驗(yàn)、專業(yè)相關(guān)的詞語;(2)數(shù)學(xué)、統(tǒng)計(jì)學(xué)等,與數(shù)學(xué)相關(guān)的詞語;(3)SQL、Python、軟件、Hadoop、Excel等,與軟件相關(guān)的詞匯;(4)熟悉、熟練使用、優(yōu)先、能力、等其他詞匯。

3.2.2結(jié)論解析

可以得出任職要求的初略結(jié)論:相關(guān)崗位普遍重視求職者的工作經(jīng)驗(yàn)、相關(guān)專業(yè)等背景;要求求職者具備良好的數(shù)學(xué)基礎(chǔ)和熟練的軟件使用能力;良好的數(shù)據(jù)敏感性,較強(qiáng)的溝通能力、邏輯分析能力和學(xué)習(xí)能力等軟技能能夠幫你增分不少;相關(guān)職位表現(xiàn)出對(duì)某些特長的偏好,但是這需要不同崗位不同企業(yè)具體分析。

4 結(jié)束語

上文給出了成都市大數(shù)據(jù)相關(guān)崗位的整體情況描述和求職建議,但是求職者需要注意的是:
本文的思維角度是站在一個(gè)整體的角度去分析,得出的是一些共性的特點(diǎn)和總體趨勢;而求職者面臨的是具體的崗位和具體的公司,這些具體崗位和企業(yè)在共性的基礎(chǔ)上,更多的是體現(xiàn)個(gè)性,因此本文實(shí)際上只是求職者思考的起點(diǎn)(了解職位的共性和趨勢),還需要更多的去思考如何利用好該分析報(bào)告體現(xiàn)的共性和趨勢,并根據(jù)自己的實(shí)際情況做好具體的選擇。
從這一點(diǎn)出發(fā),數(shù)據(jù)分析也是一樣,得出的數(shù)據(jù)分析報(bào)告并不是分析問題的終點(diǎn),而應(yīng)該是起點(diǎn),還需要去探索實(shí)際問題的個(gè)性,才能比較好的解決問題。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,702評(píng)論 6 534
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,615評(píng)論 3 419
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,606評(píng)論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,044評(píng)論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,826評(píng)論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,227評(píng)論 1 324
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,307評(píng)論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,447評(píng)論 0 289
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,992評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,807評(píng)論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,001評(píng)論 1 370
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,550評(píng)論 5 361
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,243評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,667評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,930評(píng)論 1 287
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,709評(píng)論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,996評(píng)論 2 374

推薦閱讀更多精彩內(nèi)容