繼簡書用戶數據第一篇之后,現在出第二篇啦。先看下數據分析的結果大概長什么樣!
圖里面是什么呢,下面就開始說說
這篇文章主要是對用戶的動態做分析。
0.分析什么
說是對動態做分析,啥是動態?就像你微信朋友圈的發表、點贊、評論、被評論一樣。你在簡書的操作也被記錄下來啦,像這樣:
在簡書的可見動態分為八種類型:發表評論,喜歡文章,贊賞文章,發表文章,關注用戶,關注專題,點贊評論,關注文集 。
1.數據從哪里來
當然還是用python寫爬蟲代碼來簡書抓了,一個個復制粘貼是不可能的,要又要不到,只能寫爬蟲來抓啊,這樣子才能維持數據來源……
看,蠻快的!數據嗖嗖的就來了,還不是美滋滋~
2.分析過程
略(不要在意這些細節,直接看結果啦)
3.分析結果
先以簡叔為例吧,記得剛注冊簡書,就收到一個私信,我還以為哪妹子看上我了!
嗯,扯遠了。咱還是來認(hu)真(luan)分析一下數據吧。
3.1基本信息
截止至2017-08-20 18:32:11,也就是我現在碼這段字的前幾秒。簡叔關注了2346個用戶(說好的上限1000呢~)。粉絲87137個,粉絲排行榜前幾名啦。
發表文章122篇,收獲喜歡30137,喜歡文章11292,嗯?點了那么多喜歡?
發表評論8454次,打賞文章2128次,土豪吧。想到我占1/2128,不禁有些激動。
3.2 第一次
隨著動態越來越多,因為動態按時間倒排,你可能翻了跟多頁還是不知道你在簡書第一個關注的用戶,喜歡的文章,發表的評論。沒關系,我記得(能快速找出來……)!
咱們看看簡叔的第一次!
2012-09-05 11:26:57
注冊,加入簡書。
(我以為是第一個注冊用戶,去抓下來的用戶中查了下,larryzhao是2012-09-05 11:08:37注冊的,早十幾分鐘??戳私榻B,這個也是簡書聯合創始人。應該沒有比這早了的吧)
2012-12-20 15:31:53
第一次發表文章:價值主張的工作表
2012-12-13 17:19:31
第一次喜歡文章:簡書發表的獻給寫作者的 Markdown 新手指南
2013-05-23 05:36:28
第一次關注用戶:趙云波
2013-12-08 11:40:56
第一次對文章 為什么你應該每天寫作 評論:
“我覺得哪怕真是有興趣,要堅持每天寫作也是非常困難的事情。一周寫上一篇,或者一個月寫上一篇,這種才是休閑活動?!该刻鞂懽鳌惯@個行為絕不可能成為一項「休閑活動」。可以做到「每天寫作」的人,要么他是一個真正從事文字工作的人,要么他對「每天寫作」這件事情有一種強迫癥?!?/p>
嗯,同意簡叔3.6年前的觀點。天天喊著「每天寫作」大都是文字工作者。上班族們,不要一聽別人的鼓動就給自己立個誓,到時候打臉的可是自己啊!一天記流水賬似的一篇,干嘛,感動自己???
2014-03-27 12:37:08
第一次關注文集:社區的藝術
文集這個概念在別的用戶瀏覽的時候好像不是那么重要,所以一般關注文集較少或沒有。
2014-07-30 06:13:35
第一次關注專題:毒眼尋珠
2015-03-30 11:47:11
第一次打賞文章 :劉淼 發表的20150318村上問答之「我的生活正發生怪事」
2015-07-27 17:01:30
第一次贊了評論: 我的比較波折,第一次發被快遞的臨時工搞丟了,簡書服務不錯,幫我和中通交涉,中通賠了錢,后來補發了一份。書看完一本了,還不錯誒,好評!
這個文章已經不在了,文章應該是關于簡書出版的書。
3.3 各種動態占比
喜歡文章、發表評論、關注用戶、贊賞文章,這四種占比較高,說明簡叔還是很關注和支持簡書的用戶創作。
3.4月度動態趨勢
總體呈波段上升趨勢,簡叔在簡書平臺還是很活躍的。
3.5 日動態趨勢
自注冊以來,每天的動態次數。像這樣,密密麻麻
峰值是 2016-01-04,這天動態次數212次。因為圖較大,降低了幀率,所以看起來有些卡頓。
3.6 時動態趨勢
如果按11點以后算熬夜的話,可以看出簡叔還是有不少熬夜情況的。大叔,注意身體!
白天各個時間段瀏覽簡書較均衡,畢竟是老板,沒有確切的工作時間段。有事沒事刷下簡書!
3.7 周內發表文章頻次
圓形氣泡越大,代表發文章頻率越高。簡叔非工作時段發文還是蠻多的。
其他用戶分析的,文字工作者一般都是集中在周一到周五,上班族周六周日更集中一些。
要想詩和遠方,還是要先解決眼前的茍且。
3.8 周內喜歡文章頻次
?。∈裁垂??一個個連續的飽滿的小球。09:00-15:00,21:00-0:00。這兩個時間段內簡叔喜歡文章很頻繁,下午少一些。
3.9 周內關注用戶頻次
早上關注用戶多一些?
3.10 周內打賞頻次
晚上打個賞?
3.11 發表的評論
對所有評論進行分詞,詞頻統計后制作出詞云,然后……
哈哈哈,簡叔天天好開心?。。。?/p>
愿大家都有簡叔的心態??!
你還愣著干什么?笑啊!
4.最后
其實我已經在封裝爬蟲和分析過程及web展示,由于域名過期還沒來得及上線到服務器上,完整的是requests+mongodb+flask+echarts集合成的微服務。輸入個人主頁,就能交互式自動生成展示頁面。如輸入彭小六主頁,提交后顯示分析結果:
項目(gayhub地址)還在籌備中,后面會上線該服務供大家訪問瀏覽。