12月的來到預示著18年快要結束了,我不打算在這篇文章里總結18年發(fā)生的那些大事情,而是說一些看起來散發(fā)著人間煙火氣的事情。
自打我前段時間關注了知乎上月薪過萬是什么體驗這個話題,知乎總是會時不時的推送一些新的回答給我,我大眼掠過新的回答,看起來和之前的答主描述的都類似,但出于某種意愿,我不愿意關閉這個問題下新回答提醒。所以我打算做一些數(shù)據(jù)分析的工作,想知道2018年知乎上月薪過萬的人體驗究竟如何。
為了讓數(shù)據(jù)具有代表性,我分別抓取了北京、上海廣州和深圳相關問題下的回答,最后得到了大約5000多條回答。
拿到數(shù)據(jù)之后,我就開始著手進行一些簡單的分析工作。首先,我想知道2018年月薪過萬的人的性別分布是怎樣的。
紅色表示男性答主,黃色表示女性,藍色表示性別未知,這部分答主可能是在知乎沒有沒有填寫自己的性別。結果顯示在5000多條回答中男性群體占大多數(shù)比例。起初,我對此表示疑惑。因為我了解到,微博前段時間王校長的抽獎活動中女性中獎者遠超過男性,微博CEO解釋說是因為女性在社交網(wǎng)絡上的分享意愿是高于男性的。從知乎這個問題下的答案來看,事實卻不是這樣。后來我發(fā)現(xiàn)這個結果似乎也有道理,因為各類富豪榜榜單中,男性的比例都是大于女性的。
接下來的一張圖展示的是回答中的匿名者的比例。
粉紅色的區(qū)域表示的是選擇匿名的知乎用戶比例。3366位答主選擇不匿名,剩余1693位知乎用戶表示不想讓大家知道自己回答了這個問題,我對此表示理解。
接下來我對每個回答進行了情感分析,我覺得這可以一定程度上表示月薪過萬答主的心情,可以讓我們大體了解他們是開始還是不開心。范圍是0-1,數(shù)值越高(紅色)反應答主的積極情緒的概率越高,反之越低。圖中白色取的是0.5。
大部分答主所表現(xiàn)出來的都是正面情緒。正面情緒是會感染人的,這種答案讀者讀起來也會很爽,然后毫不吝嗇的送出自己贊同票數(shù)。下圖可以證明這一點,從中可以發(fā)現(xiàn)大部分得票較高的答案的情緒正面概率都大于0.5。圖中也有一些得票數(shù)較高的回答但是正面情感分析得分較低,這一般是因為答主刪除了原答案所導致回答得分較低。為了使圖片更加容易分辨,我過濾掉了得票數(shù)小于100的答案。
月入過萬的答主都是什么行業(yè)的,通過對答案的分詞我們也可以大體看到。例如工程師出現(xiàn)的頻次是非常高的,類似的還有設計師。近年來自媒體的興起,也讓做公眾號的不少朋友都跨過了月入過萬的門檻。
月入過萬的答主最常去那些地方?這里以在上海的答主為例,我們可以看到答案中提到的最多的地方。因為上海這個詞語出現(xiàn)了接近3000次,為了排除干擾,同樣我也去除了這個最高值。
國內(nèi)地點來看,北京深圳還有廣州是上海的答主經(jīng)常提到的城市。國外方面,可以發(fā)現(xiàn)上海的答主出國比較偏愛日本,我覺得地理位置上比較接近是較大的影響因素。 我認為東南亞也不錯,現(xiàn)在天氣宜人,不用穿厚厚的羽絨服,物價也相對便宜。
我同樣提取了所有答案中出現(xiàn)比較多品牌名詞。耐克、星巴克、華為和麥當勞出現(xiàn)的次數(shù)比較多,一定程度上代表了各位答主在衣食住行方面的選擇。
在2018年快結束的時候來看,月薪過萬并不是一個很高的門檻,在本次統(tǒng)計的一線城市更是如此,可能月薪2萬在這里也不算高薪。雖然如此,月薪過萬在全國范圍之內(nèi)來看肯定算得上是高薪了。生活對任何人來講都絕非易事,我對每一個認真生活的人心存敬意。在18年最后的一個月里,我祝大家2019年的收入節(jié)節(jié)高。
本次分析使用到了騰訊文智提供的自然語言然處理能力,圖片使用Tableau和Echarts生成。