互聯網公司數據分析的應用場景
運營:用戶運營(用戶分類,用戶生命周期),活動運營,內容運營,商品運營
產品:產品功能,產品體驗,產品調研,用戶需求調研
市場:商務合作效果,渠道推廣效果,投入產出比
流程
需求分析——數據收集——數據清洗——數據分析——報告撰寫——報告分享——投入應用,收集反饋
數據類型
定性數據(一般通過問卷調查獲取)
· 分類數據:男生/女生 天氣好/壞……
分類數據不能區分大小,也不可以進行算術計算
· 順序數據:滿意度評分,教育水平等級,年齡層……
順序數據可以區分大小
定量數據(一般通過日志獲取)
· 離散型:用戶數,消費次數……
可加減,進行頻數分析
·連續型:成績,消費金額……
可算術運算,進行頻數分析,集中趨勢分析(均值,眾數,中位數)&離散程度分析(標準差,方差,最大值,最小值,全距/范圍)
數據收集
(1)數據埋點??
UV,PV,用戶數,用戶停留時間,瀏覽頁面等用戶行為數據
(2)第三方數據平臺
Growing IO,SimilarWeb, Google Analytics, 國家統計局網站……
(3)問卷調查
線上問卷調查,線下問卷調查 & 電話回訪
數據清洗
(1)數據異常表現:空值,波動太大,不同數據源獲取的數據相互矛盾
(2)數據異常原因:系統故障 & 人為因素
(3)清洗方法:刪除異常值,平均值填充,通過統計計算值填充 & 不同數據源交叉驗證
數據分析體系
常用數據分析指標(Key Performance Indicator)
網站分析指標:
UV(unique visitor)? 獨立訪客數
PV? (page view)? 網頁瀏覽量
VV (visit view)? 訪客網站的訪問次數,該網站所有頁面visit=page1+page2+……
IP(?Internet Protocol)? ?獨立IP數
DAU (daily active user)日活躍用戶
點擊率,轉化率,網頁停留時間,網站停留時間,跳出率,退出率等
eg:小皮用ADSL撥號上網,今天9am訪問了www.universityofwarwick.co.uk下的兩個網頁,5pm訪問了同一個網站下的五個網頁,則:
PV=7,UV=1,VV=2,IP=2(ADSL撥號上網每次IP不同)
渠道分析指標:
新增用戶數,用戶轉化率,渠道ROI(return on investment),渠道流量,渠道流量占比
活動效果指標:
活動點擊率,活動參與人數,活動轉化率,活動ROI
收入指標:
付費人數,轉化率,訂單數,客單價,GMV,復購頻次,毛利率,毛利額
用戶類指標:
新增用戶,活躍用戶,留存用戶,回流用戶,流失用戶
用戶價值指標:
用戶最近一次下單時間,用戶下單頻次,用戶消費總金額
#####通過需求分析,找到目標,把目標拆解成不同指標(一級指標,二級指標等)####
橫向拆解數據體系原則:遵循MECE原則,即互相獨立,完全窮盡;同一類型的數據在同一層級
縱向拆解數據體系原則:拆解的時候只能選一條主流程;主流程應該選擇大多數用戶的操作流程
不同類產品關注常見指標「例子」:
電商類
{GMV=流量*轉化率*客單價;毛利額=流量*轉化率*客單價*毛利率}
工具/社群類產品
?{活躍用戶數=新增活躍用戶數+已有活躍用戶數
二級:活躍用戶數=新訪客流量*新用戶激活率+已有用戶數*已有用戶留存率}
游戲類產品
{付費收入=活躍用戶數*付費率*ARPU
二級:付費收入=(新活躍用戶數+留存用戶數)*付費率*ARPU
三級:付費收入=(渠道流量*轉化率+老用戶*留存率)*付費率*ARPU}
O2O類產品
{訂單完成率=已完成訂單數/需求訂單數
二級:(新用戶訂單數+老用戶訂單數)/(新用戶需求數+老用戶訂單數)
常用數據分析框架(數據分析方法論)
1. QQ模型
數量(絕對數):用戶數,瀏覽量,點擊量
質量(相對數):留存率,轉化率,參與率
eg:某banner活動點擊量很高,但參與率低,說明可能活動能吸引用戶,但是參與門檻高
2. 用戶行為理論
3. 5W2H分析法
4. AARRR模型(“海盜模型”)
5. RFM模型(用戶價值模型)
6. 人貨場模型
常用數據分析方法
對比分析法,分組分析法,矩陣關聯分析,邏輯樹分析方法,漏斗分析法