你好,我是不二翔叔。
一、數據分析的目的
1.驗證產品模式是否可行
2.驗證用戶對產品功能的滿意度
3.挖掘新的需求,幫助產品、運營進行迭代
二、數據分析流程
1.數據采集
友盟+事件埋點
2.數據清洗
Excel清洗
3.數據分析
Excel + SPSS
4.數據可視化
Excel圖表
5.數據迭代
三、數據分析工具
四、數據分析指標
1.定性指標vs量化指標
2.探索性指標vs報告性指標
3.先見性指標vs后見性指標
4.相關性指標vs因果性指標
5.虛榮性指標vs可付諸行動指標
①整體
北極星指標:核心指標
一級指標:衡量公司戰略和目標
二級指標:一級指標的路徑
三級指標:二級指標的路徑
AARRR模型:
A:用戶獲取
渠道相關:
渠道規模、訪問量、訪問用戶量、拉新能力、新訪問用戶量、新訪問用戶量/訪問用戶總量、渠道質量、訪問時長、每次會話瀏覽頁面數、跳出率、用戶注冊轉化率、用戶其他轉化率、渠道留存率
激活相關:
下載量:已下載應用的用戶數量,以及應用商店排名和評分
安裝激活量:安裝并打開應用的設備數
激活率:激活設備數/安裝設備數
新增用戶數:新增設備的數量(激活數量,唯一)
注冊用戶數:所有激活用戶中注冊成功的用戶占比
用戶獲取成本:每獲取一個用戶所需要的費用
拋出一個疑問:何為真正的激活?
安裝之后打開就算激活嗎?注冊成功就算激活嗎?還是必須得首次體驗到產品核心功能才算激活?
A:用戶活躍
產品使用規模:
日活、周活、月活躍用戶量:一段時間內啟動過應用的設備數,表示用戶規模
訪問量,啟動次數:啟動應用的次數
活躍系數:日活躍用戶數/月活躍用戶數(大于0.2比較合適)
平均使用時長:平均每個用戶一天使用應用的時間
功能使用率:使用某功能的用戶數占活躍用戶的比例
新手引導效率:
新手任務完成率
新手任務完成耗時
用戶活躍度:
活躍訪次/全部訪次
各模塊用戶活躍度
產品轉化率:
核心流程轉化率
核心轉化步驟流失率
R:用戶留存
N日留存計算:統計日期新增的用戶或活躍用戶,在第N天又來使用的比例。
次日留存率
7日留存率
30日留存率
產品留存率:
核心產品功能留存率
拋出一個疑問:當留存率非常低時,如何利用指標發現問題?
次日留存比較低時,說明用戶對我們的產品不感興趣,或者說我們的產品做得太差
7日留存比較低時,說明用戶覺得我們的內容不耐玩,不好玩
30日留存比較低時,說明我們的版本迭代規劃做得不夠好,沒有及時給用戶更新內容
R:獲取收入
銷售額、轉化率
R:用戶傳播
推薦用戶數量
推薦用戶/全部線索用戶
NPS
K因子
口碑指數(百度,谷歌)
②局部
1.產品每一個具體功能的用戶體驗評估
heart模型:
2.產品每一個具體業務的指標
電商類:
UGC內容類:
游戲類:
平均同時在線人數(ACU: Average concurrent users):即在一定時間段抓取一次數據,以一定周期為期限;周期內的ACU可取時間段的平均數據。[例如:系統每一小時抓取一次數據,全天24小時共24個不同時刻的在線數據,則每天的ACU是這24個數據的平均值(每個公司有每個公司的定義,一般ACU取平均值,若針對某一時刻,則直接在某時刻內直接統計用戶數)
最高同時在線人數(PCU:Peak concurrent users)即在一定時間內,抓取最高在線數據。(例如:單天最高在線:系統每小時統計一次數據,全天24小時共24個不同時刻的在線數據,則24個時間段內最高的用戶在線數據為PCU)
充值金額(RMB):即在一定周期內充值總金額。
元寶消費金額(RMB):即在一定周期內,玩家在游戲商城中的消費總金額(仔細看,充值金額與元寶消費金額有著明顯區別,上者受活動影響,下者受商城道具需求影響。)
每付費用戶平均收益(ARPPU: Average Revenue Per Paying User):相似于下載游戲的消費比率,(國內很多人以“ARPU”稱呼,個人定義不同),此類數據主要衡量付費用戶收益(公式:月總收入/月付費用戶數)
平均每活躍用戶收益(ARPU: Average Revenue Per User):主要衡量游戲整體貢獻收益;畢竟除了付費收益,活躍用戶也能產生收益,(一般國內以此數據為核心,各家算法不同)(公式:月總收入/月活躍用戶)
平均生命周期:有新增賬戶在首次進入游戲到最后一次參與游戲的時間天數。比如記錄某一個月,這個月里,每個新增用戶的生命周期之和/MAU=平均生命周期。
LTV生命周期價值(LTV: Life Time Value):約定一個計算的生命周期值(比如上個月的平均生命周期,或者約定為15日,即這個月有15日登陸記錄的賬戶數),符合這個生命周期條件的賬戶數中,充值金額的和/條件賬戶數。
每日注冊并登陸的用戶數(DNU: Daily New Users):這個言簡意賅,就不詳談了,直接從后臺抓取即可。
新登用戶中只有一次會話的用戶(DOSU: Daily One Session Users):這個也很簡單,此類數據主要衡量新用戶的質量,買量的可以參考一下。
每日登陸過游戲的用戶數(DAU: Daily Active Users):直接從字面就能了解了,一般從后臺抓取。
七天內登陸過游戲的用戶數(WAU: Weekly Active Users):這個還是很好理解,就不廢話了,此類數據主要衡量周變化。
30天內登陸過游戲的用戶數(MAU: Monthly Active Users):淺顯易懂,主要衡量產量的粘性以及用戶的穩定性。
四、數據分析中的誤區
1.忽略沉默用戶
2.過度依賴數據
3.錯判因果關系
4.通過數據表達方式欺騙
5.妄談大數據
五、數據分析方法
從統計學的角度看:
按照難易程度分為:基礎統計分析、高級統計分析、數據挖掘方法。
常見的分析方法有如下:
①畫像分群:聚合符合某種特定行為/畫像的用戶,聚類分析
②趨勢分析:實時快速了解多維度趨勢,便于進行產品、市場迅速迭代
③對比分析:與競爭對手比,與過去的自己/版本比
④交叉分析:多維度交叉分析
⑤漏斗分析:按照已知轉化路徑,分析每一步驟轉化情況
⑥回歸分析:預測性的建模技術,研究因變量和自變量之間的關系
⑦聚類分析:物以類聚,人以群分,將相似或距離相近的對象/數據歸為一類
⑧相關性分析:對兩個或多個具備相關性的變量元素進行分析,從而衡量兩個變量因素的相關密切程度
⑨行為事件分析/用戶路徑分析:探索性了解某組用戶的行為軌跡
⑩留存分析:了解行為/行為組與回訪之間的關聯
⑩①A/B測試:對比不同產品設計/算法對結果的影響
⑩②優化建模:建立預測模型優化商業結果
六、數據分析框架/思維
①AARRR模型
不解釋了。
②邏輯分層拆解
七、數據應用的場景
產品設計前:通過數據分析發現問題
產品設計中:輔助決策,判斷思路(A/B測試)
產品設計后:數據驗證方案
所謂的數據驅動,其實就是一套量化的發現問題和解決問題的流程,在產品設計的重要環節,數據都在發揮著主觀臆斷無法替代的作用。
八、回歸實際,解決重要的三個問題
①數據如何科學的采集?(關于埋點方式的探討)
目前市面上有的埋點方式主要是三種:
a.可視化/全埋點
所謂全埋點,就是在產品中嵌入一段SDK,做一個統一的埋點,也叫“無埋點”。
優勢:
可視化展示宏觀指標,滿足基本的數據分析需求;技術門檻較低,使用與部署較簡單;用戶友好性強
缺陷:
只能采集到用戶交互數據,自定義的某些屬性無法采集;無埋點兼容性有限,同一按鈕可能出現不同名稱,造成混亂;屬于前端采集的方式,有天然的缺陷,如數據采集不全面、傳輸時效性差、數據可靠性無法保障等。
b.代碼埋點
又分為前端代碼埋點和后端代碼埋點。前端類似全埋點,所不同的是,對于每一個關鍵行為,都需要調用SDK,將必要的事件名、屬性字段寫入代碼;后端代碼埋點則將相關的事件、屬性等通過后端模塊調用SDK的方式,發送到后臺服務器,這種方式更適合安全性要求高、精細化分析的場景,如金融服務。
c.導入輔助工具
還可以采用日志、數據庫的方式生成數據,然后對數據進行轉換,通過實時或批量工具完成數據的導入。
那么,如何選擇合適的采集方式呢?因企而異。
一般三種都是結合起來用的,只不過看全埋點是用第三方現成的,如友盟、神策數據、growthingio等,還是用官方自己搭建數據分析平臺,這要根據公司具體業務來定。
②一款產品在什么時期就要開始做埋點工作了?(尤其是早期冷啟動產品)
建議在早期就要有數據分析體系搭建的意識,可能暫時還用不上,如果產品驗證還不錯,公司資源又跟的上,那建議盡早去做。
③數據深度挖掘算法
現在大家都在談大數據,大數據該怎么做?怎么智能化?有以下幾個方向:
a.決策樹模型
b.神經網絡
c.機器學習
因為涉及的領域太深、太難,此處不做過多分析。
九、擴展:如何培養數據分析能力
①心法層面
1.好奇心
2.求知欲
寬廣的胸懷,敢于打破常規和局限。
②基礎層面
基礎指標:pv、uv、跳出率、轉化率、點擊數等
學習網站:
http://bluewhale.cc/
書籍:
《統計數據會撒謊》
《深入淺出數據分析》
《誰說菜鳥不會數據分析》
《赤裸裸的統計學》
《深入淺出統計學》
《MySQL必知必會》
《流量的秘密》
《數據之美》
《精益數據分析》
《利用Python進行數據分析》
③對業務足夠了解
④重視數據,保持敏感
時刻關注數據,時刻反思優化
我是不二翔叔,歡迎關注我~