數據分析體系構建

你好,我是不二翔叔。

一、數據分析的目的

1.驗證產品模式是否可行

2.驗證用戶對產品功能的滿意度

3.挖掘新的需求,幫助產品、運營進行迭代


二、數據分析流程

1.數據采集

友盟+事件埋點

2.數據清洗

Excel清洗

3.數據分析

Excel + SPSS

4.數據可視化

Excel圖表

5.數據迭代


三、數據分析工具


四、數據分析指標

1.定性指標vs量化指標

2.探索性指標vs報告性指標

3.先見性指標vs后見性指標

4.相關性指標vs因果性指標

5.虛榮性指標vs可付諸行動指標


①整體

北極星指標:核心指標

一級指標:衡量公司戰略和目標

二級指標:一級指標的路徑

三級指標:二級指標的路徑


AARRR模型:

A:用戶獲取

渠道相關:

渠道規模、訪問量、訪問用戶量、拉新能力、新訪問用戶量、新訪問用戶量/訪問用戶總量、渠道質量、訪問時長、每次會話瀏覽頁面數、跳出率、用戶注冊轉化率、用戶其他轉化率、渠道留存率


激活相關:

下載量:已下載應用的用戶數量,以及應用商店排名和評分

安裝激活量:安裝并打開應用的設備數

激活率:激活設備數/安裝設備數

新增用戶數:新增設備的數量(激活數量,唯一)

注冊用戶數:所有激活用戶中注冊成功的用戶占比

用戶獲取成本:每獲取一個用戶所需要的費用

拋出一個疑問:何為真正的激活?

安裝之后打開就算激活嗎?注冊成功就算激活嗎?還是必須得首次體驗到產品核心功能才算激活?


A:用戶活躍

產品使用規模:

日活、周活、月活躍用戶量:一段時間內啟動過應用的設備數,表示用戶規模

訪問量,啟動次數:啟動應用的次數

活躍系數:日活躍用戶數/月活躍用戶數(大于0.2比較合適)

平均使用時長:平均每個用戶一天使用應用的時間

功能使用率:使用某功能的用戶數占活躍用戶的比例


新手引導效率:

新手任務完成率

新手任務完成耗時


用戶活躍度:

活躍訪次/全部訪次

各模塊用戶活躍度


產品轉化率:

核心流程轉化率

核心轉化步驟流失率


R:用戶留存

N日留存計算:統計日期新增的用戶或活躍用戶,在第N天又來使用的比例。

次日留存率

7日留存率

30日留存率


產品留存率:

核心產品功能留存率


拋出一個疑問:當留存率非常低時,如何利用指標發現問題?

次日留存比較低時,說明用戶對我們的產品不感興趣,或者說我們的產品做得太差

7日留存比較低時,說明用戶覺得我們的內容不耐玩,不好玩

30日留存比較低時,說明我們的版本迭代規劃做得不夠好,沒有及時給用戶更新內容


R:獲取收入

銷售額、轉化率


R:用戶傳播

推薦用戶數量

推薦用戶/全部線索用戶

NPS

K因子

口碑指數(百度,谷歌)


②局部

1.產品每一個具體功能的用戶體驗評估

heart模型:


2.產品每一個具體業務的指標

電商類:


UGC內容類:

游戲類:

平均同時在線人數(ACU: Average concurrent users):即在一定時間段抓取一次數據,以一定周期為期限;周期內的ACU可取時間段的平均數據。[例如:系統每一小時抓取一次數據,全天24小時共24個不同時刻的在線數據,則每天的ACU是這24個數據的平均值(每個公司有每個公司的定義,一般ACU取平均值,若針對某一時刻,則直接在某時刻內直接統計用戶數)

最高同時在線人數(PCU:Peak concurrent users)即在一定時間內,抓取最高在線數據。(例如:單天最高在線:系統每小時統計一次數據,全天24小時共24個不同時刻的在線數據,則24個時間段內最高的用戶在線數據為PCU)

充值金額(RMB):即在一定周期內充值總金額。

元寶消費金額(RMB):即在一定周期內,玩家在游戲商城中的消費總金額(仔細看,充值金額與元寶消費金額有著明顯區別,上者受活動影響,下者受商城道具需求影響。)

每付費用戶平均收益(ARPPU: Average Revenue Per Paying User):相似于下載游戲的消費比率,(國內很多人以“ARPU”稱呼,個人定義不同),此類數據主要衡量付費用戶收益(公式:月總收入/月付費用戶數)

平均每活躍用戶收益(ARPU: Average Revenue Per User):主要衡量游戲整體貢獻收益;畢竟除了付費收益,活躍用戶也能產生收益,(一般國內以此數據為核心,各家算法不同)(公式:月總收入/月活躍用戶)

平均生命周期:有新增賬戶在首次進入游戲到最后一次參與游戲的時間天數。比如記錄某一個月,這個月里,每個新增用戶的生命周期之和/MAU=平均生命周期。

LTV生命周期價值(LTV: Life Time Value):約定一個計算的生命周期值(比如上個月的平均生命周期,或者約定為15日,即這個月有15日登陸記錄的賬戶數),符合這個生命周期條件的賬戶數中,充值金額的和/條件賬戶數。

每日注冊并登陸的用戶數(DNU: Daily New Users):這個言簡意賅,就不詳談了,直接從后臺抓取即可。

新登用戶中只有一次會話的用戶(DOSU: Daily One Session Users):這個也很簡單,此類數據主要衡量新用戶的質量,買量的可以參考一下。

每日登陸過游戲的用戶數(DAU: Daily Active Users):直接從字面就能了解了,一般從后臺抓取。

七天內登陸過游戲的用戶數(WAU: Weekly Active Users):這個還是很好理解,就不廢話了,此類數據主要衡量周變化。

30天內登陸過游戲的用戶數(MAU: Monthly Active Users):淺顯易懂,主要衡量產量的粘性以及用戶的穩定性。



四、數據分析中的誤區

1.忽略沉默用戶

2.過度依賴數據

3.錯判因果關系

4.通過數據表達方式欺騙

5.妄談大數據



五、數據分析方法

從統計學的角度看:

按照難易程度分為:基礎統計分析、高級統計分析、數據挖掘方法。


常見的分析方法有如下:

①畫像分群:聚合符合某種特定行為/畫像的用戶,聚類分析

②趨勢分析:實時快速了解多維度趨勢,便于進行產品、市場迅速迭代

③對比分析:與競爭對手比,與過去的自己/版本比



④交叉分析:多維度交叉分析

⑤漏斗分析:按照已知轉化路徑,分析每一步驟轉化情況

⑥回歸分析:預測性的建模技術,研究因變量和自變量之間的關系

⑦聚類分析:物以類聚,人以群分,將相似或距離相近的對象/數據歸為一類

⑧相關性分析:對兩個或多個具備相關性的變量元素進行分析,從而衡量兩個變量因素的相關密切程度

⑨行為事件分析/用戶路徑分析:探索性了解某組用戶的行為軌跡

⑩留存分析:了解行為/行為組與回訪之間的關聯

⑩①A/B測試:對比不同產品設計/算法對結果的影響

⑩②優化建模:建立預測模型優化商業結果



六、數據分析框架/思維

①AARRR模型

不解釋了。

②邏輯分層拆解




七、數據應用的場景

產品設計前:通過數據分析發現問題

產品設計中:輔助決策,判斷思路(A/B測試)

產品設計后:數據驗證方案


數據驅動產品閉環


所謂的數據驅動,其實就是一套量化的發現問題和解決問題的流程,在產品設計的重要環節,數據都在發揮著主觀臆斷無法替代的作用。


八、回歸實際,解決重要的三個問題

①數據如何科學的采集?(關于埋點方式的探討)

目前市面上有的埋點方式主要是三種:

a.可視化/全埋點

所謂全埋點,就是在產品中嵌入一段SDK,做一個統一的埋點,也叫“無埋點”。

優勢:

可視化展示宏觀指標,滿足基本的數據分析需求;技術門檻較低,使用與部署較簡單;用戶友好性強

缺陷:

只能采集到用戶交互數據,自定義的某些屬性無法采集;無埋點兼容性有限,同一按鈕可能出現不同名稱,造成混亂;屬于前端采集的方式,有天然的缺陷,如數據采集不全面、傳輸時效性差、數據可靠性無法保障等。


b.代碼埋點

又分為前端代碼埋點和后端代碼埋點。前端類似全埋點,所不同的是,對于每一個關鍵行為,都需要調用SDK,將必要的事件名、屬性字段寫入代碼;后端代碼埋點則將相關的事件、屬性等通過后端模塊調用SDK的方式,發送到后臺服務器,這種方式更適合安全性要求高、精細化分析的場景,如金融服務。


c.導入輔助工具

還可以采用日志、數據庫的方式生成數據,然后對數據進行轉換,通過實時或批量工具完成數據的導入。


那么,如何選擇合適的采集方式呢?因企而異。

一般三種都是結合起來用的,只不過看全埋點是用第三方現成的,如友盟、神策數據、growthingio等,還是用官方自己搭建數據分析平臺,這要根據公司具體業務來定。


②一款產品在什么時期就要開始做埋點工作了?(尤其是早期冷啟動產品)

建議在早期就要有數據分析體系搭建的意識,可能暫時還用不上,如果產品驗證還不錯,公司資源又跟的上,那建議盡早去做。


③數據深度挖掘算法

現在大家都在談大數據,大數據該怎么做?怎么智能化?有以下幾個方向:

a.決策樹模型

b.神經網絡

c.機器學習

因為涉及的領域太深、太難,此處不做過多分析。



九、擴展:如何培養數據分析能力

①心法層面

1.好奇心

2.求知欲

寬廣的胸懷,敢于打破常規和局限。


②基礎層面

基礎指標:pv、uv、跳出率、轉化率、點擊數等

學習網站:

http://bluewhale.cc/

書籍:

《統計數據會撒謊》

《深入淺出數據分析》

《誰說菜鳥不會數據分析》

《赤裸裸的統計學》

《深入淺出統計學》

《MySQL必知必會》

《流量的秘密》

《數據之美》

《精益數據分析》

《利用Python進行數據分析》


③對業務足夠了解

④重視數據,保持敏感

時刻關注數據,時刻反思優化

我是不二翔叔,歡迎關注我~

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,505評論 6 533
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,556評論 3 418
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,463評論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,009評論 1 312
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,778評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,218評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,281評論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,436評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,969評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,795評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,993評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,537評論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,229評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,659評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,917評論 1 286
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,687評論 3 392
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,990評論 2 374

推薦閱讀更多精彩內容