引言
最近本人打算入門數據分析,也看了一些書。本文是對最近看的一些書籍觀點的提煉并結合個人在實習時候的思考。非常淺顯,估計也應該有些錯誤,請多包涵。
今天談的是數據分析的基本流程,即包括:“確認— 分解 — 評估 — 決策 ”四個基本步驟。
一、確認與分解
確認的含義是:確認問題,明白數據分析的目的是什么?作為一個現在都還沒入門數據分析的新手,我一開始拿到自己在實習的時候某一次H5活動的數據統計表格是懵逼,幾千行的數據(PV、UV、傳播量、二次傳播等等),根本就無從下手。這時候上司又要求你通過數據分析一下這次活動的效果如何?這時候該怎么辦呢?
因此,我們需要明確的第一點是“帶著目的去看數據”。這也是本書中,告訴我們第一件事情。
那么我們怎么去明確我們的目的呢?
書中談到有兩個方法:
第一,挖掘數據需求方(老板、上司...)的信息,這樣做的原因是,第一,數據需求方不僅可能知道更多消息、數據。第二,這會讓你最后分析的結果更加符合被報告方的需求。
比如:他也許會反饋給你說:
- H5活動頁面在游戲內部的入口上會不會有問題?
- 往期的活動數據效果是如何...
那么我們就可以提煉出“入口的深度”、“對比往期的數據”這兩個關鍵點。
第二,根據自己的經驗判斷、比如參考過往的其他案例的研究思路,比如研究H5的數據分析,我就會去看一些主流數據機構出具的報告,研究下對方是從哪一些角度進行分析的。
但總而言之,無論什么方法,最終的目的都是要回歸“能夠帶著清晰的目的去分析數據”這個點上。(而不是簡單地認為我要分析下傳播量)。
那么通過上司的反饋并結合自己的經驗和后,你就有了一個大概的分析方向。
接下來就是第二個步驟,分解。
我對書中的分解理解為兩個部分:
第一部分:分解問題。 即:在明確數據分析目的后,把問題進行拆分為小的模塊。
譬如:我們的目的是提高游戲中H5活動頁面的傳播量。這是一個非常寬泛的問題。我們可以把它拆分為:
- 從獲取用戶的角度分析:我們如何獲取用戶?單個用戶的成本如何?
- 從提高H5活動參與活躍度角度分析:活動排行榜的數據如何?玩家在活動中平均獲得的獎勵數量如何?
- 從H5活動的留存率角度分析:用戶會不會只是打開看一眼、參與一下就關掉頁面?PV或者UV會不會在短時間內就大幅減少?
- 從H5活動的最終轉換率角度分析?點擊“下載游戲”&“FAB頁面”的數量是多少?
二、分解數據
分解數據即:在把問題分解后,根據拆分的問題,把數據表拆成不同的小模塊,并對關鍵因子進行比較。譬如:
分析一個H5被點擊的方式,是從朋友圈進入比較多還是從好友/群進入比較多。那么需比較的關鍵因子就是“朋友圈進入數”和“好友/群進入數”。
當然這里的例子是比較簡單的。
總之,核心便是:明確分析的目的后對數據進行分解。而不是把是PV、UV、導入量亂加一通。
二、評估與決策
評估與決策的定義是:對數據收集、整理等過程后,做出新的預估與判斷。
比如在一個H5中,分享率不低(玩家把H5分享至朋友圈、好友),但是二次傳播量(被分享鏈接的打開數量)卻不高,說明:該H5頁面的標題可能不那么吸引人,無法吸引其他用戶去打開。
那么,我們做出的決策便是:可以在第二波宣傳的時候,對標題和縮略圖重新進行修改。
三、結語
在書中,提供了一個很基本的分析報告模板:
第一部分,背景:說明做這個數據分析的原因是什么?有哪一些背景資料?也是上面提到的四個流程中的,確認環節。
第二部分,數據解說:我們根據得到的數據,比較關鍵因子,得出一些基礎性的結論。也是上面提到的數據分解環節。
第三部分,建議:做完數據分析后,得出接下來該做出什么新的決策,去提高我們的銷量、活躍度、留存率等等。
本來是四個步驟,我只是歸納為兩個大步驟。
當然,這是數據分析最基礎的入門性知識,具體實施起來并沒有這么容易,比如我們會遇到:
得到的原始數據的格式是混亂不堪的,連簡單的匯總都很困難。
多個數據之間的定義是交叉的
數據之間是有一些混雜因素
在一些數據分析領域,我們需要做 A/B 測試去驗證
...
總而言之,任重而道遠。
本文參考:
《深入淺出數據分析》— Michael Milton
《游戲數據分析的藝術》— 于洋 / 余敏雄 / 吳娜 / 師勝柱
網上其他零碎的文章