一、前言
截止前天,來簡書正好一個月。20170730 注冊了賬號,當晚發布處女作《爬取張佳瑋138w+知乎關注者:數據可視化》,從而開啟了《python爬蟲和數據可視化》系列的寫作。
20170827 晚上寫完《簡書推薦作者風云榜(爬取簡書app數據)》,真的一萬個沒想到,會小火了下,成為自己目前戰績最佳的一篇文章,斬獲數據如下:閱讀 4274 評論 129 喜歡 213 贊賞 4。現在也仍偶爾在首頁出現。原本是想針對上一篇文章的點贊情況和關注情況進行研究,但想到正好來了一個月,那就用自己熟悉的方式進行下全盤的分析和可視化,用不一樣的視角,看看作為一名簡書用戶、一只小透明,我這一個月了都貢獻和斬獲了哪些數據。
二、爬取簡書app數據
爬蟲思路與上文《簡書推薦作者風云榜(爬取簡書app數據)》類似,不再贅述。部分數據格式如下:
三、數據可視化
1.發布文章
首先是一個月來我發布的12篇文章情況。兩個文集:《python爬蟲和數據可視化》和《隨筆》分別收錄了7篇和5篇文章。
閱讀數和獲贊數分布情況如下:有兩篇閱讀量破3K,正好分別是我的最新的和最早的兩篇文章,獲贊數也是最高。不過,今天突然發現《Gephi繪制微博轉發圖譜:以“@老婆孩子在天堂”為例》一文,閱讀量很莫名其妙的從1.5K變成了近3.9K,不知道發生了什么???
除了上述的三篇,其他文章的數據雖然非常慘淡,其實內容都還不錯,大家可以觀光下。
2.粉絲數
這大概是每個人對自己的賬號最關心的數據了吧。下圖可以直觀的看到在20170828當天粉絲數猛然增長,單日漲粉170人次。
雖然《簡書推薦作者風云榜(爬取簡書app數據)》一文,我自認為寫得并不怎么好,數據量僅230條,并不大,但一切就是那么出人意料,也許是無意中蹭上了“簡書”這一平臺的熱點吧。總之,在經歷漫長的、平緩的漲粉階段后,迎來了意外的驚喜,而這對于看到本文、目前戰績平平的寫作者來說,或許可以心存期待,不必那么悲觀,也許不遠的前方正有個surprise在等著你呢。
說起來,最初看到上圖時,咋覺得那么像不了解的股票走勢圖呢。那么,我大概可以自比為一只極具潛力的上升股吧!(臉是什么,能吃嗎?)大家快來關注我吧,以后我的走勢一定更蔚為可觀、牛逼哄哄的,等我成為萬粉大V,你們就都是開國元老呀!
3.獲贊數
再是第二重要的獲贊數。依舊是在20170828當天驟升。回想起當天文章被加入好多專題,也第三次上了首頁后,自己抖機靈的各種回復大家的評論,不無心機地使得文章占據版面和專題靠前的位置,還算有點效果。當然在信息爆炸之余,倍感作為一名臨時“運營”的辛苦,大概成為大V后,會招募個漂亮的小姐姐幫我運營,正所謂:“好風憑借力,送我上青天”。2333,有人留言預定不?
4.關注和點贊(more)
接著我們進一步將橫軸的日期換成最初爬取下的原始數據,即時間戳,可見切換成每一秒鐘后,圖形走勢大同小異。
時間戳是指格林威治時間1970年01月01日00時00分00秒(北京時間1970年01月01日08時00分00秒)起至現在的總秒數。
設置圓圈大小為關注(或點贊)用戶的粉絲數,效果如圖,之所以要看看對應關注者的粉絲數,是因為曾看到一些用戶瞬間關注了一堆賬號,故推測可能自己也無形中成為了簡書某推薦作者。
如果是因為用戶觸發了關注按鍵,自己才被關注,其實利的方面就是看起來漲粉了,弊的方面就是粉絲數虛高,無法轉化成有效的后續點贊和互動情況。而我更傾向于憑自己的本事和文章,開創一片天地,吸引真切的對我的文章感興趣的用戶關注我,并和我交流,甚至成為朋友。
單看關注情況還是不夠,結合點贊用戶的粉絲數可知,關注者用戶質量或許不如點贊用戶優質。不過可喜的是似乎這一個月來一直有一些大V小V為我點贊,看起來似乎沒那么寂寥,到底都是誰那么好心,“事了拂衣去,深藏功與名”呢,一定要找出來!
再是,在整個月所有點贊的343用戶和關注的295用戶里,同時給我點過贊并關注了我的共有107人,向你們表個白,你們是“巨眼英雄”,必須要努力貢獻出更好的內容來回報大家啊!
5. 20170827-20170829復盤
講了那么久20170828的飆升戰績,那么具體到那一天24小時里的情況又是如何呢?或許大家也和我一樣好奇。
那么,就由“西門大偵探”,帶你們重回那日的現場,復盤所有的經過吧!
正如上文的“股票趨勢圖”所示,所有數據在20170827發布新的文章之前都是平平無奇,偶爾會有幾個點贊和關注點綴在浩瀚的時間線上,而在22點57分,發布新文章后不久,點贊數就出現了一小波的上漲,追溯回去,當時距離當天結束時間已所剩不多,但就是在這一小時內文章先后被加入專題《今日看點》、被編輯推薦至首頁、被加入專題《我和簡書那些事兒》、被加入專題《@IT·互聯網》。所有這些為后續文章“小火”了下,埋下伏筆,此處手動感謝@South_Lin,這三篇上首頁的文章起碼兩篇都是小姐姐加入《今日看點》,并推薦到首頁的吧。
次日,0828,也就是最輝煌的一天,關注人數深夜不絕,夜貓子倒是不少呢,兩者數據均在6點后逐步發展壯大,于9點前后達到單位小時的頂峰,而當天乃是周一,新的一周的上班第一天。
再之后雖然數據開始走低,但兩者交相輝映,共同形成的信息轟炸依舊存在,直到29日才算漸漸落下帷幕。
6.頭像拼圖
上一篇文章小火了后,不少人表示會努力寫作,成為簡書推薦作者和簽約作者,然后出現在我的程序里。其實本文就已經包含了他們,當然本次沒有爬取評論情況,點贊和關注的用戶的頭像雖然爬取下來了,但拼圖大家真的想看嗎。不給你們看哦。
四、小結
這大概是另類的一篇初到簡書一個月的記錄,用的也是我還算熟悉的數據可視化,也許以后粉絲、點贊等數據質量不錯的話,還會繼續用這樣的方式來記錄。完。