數據分析入門(1)

互聯網公司數據分析的應用場景

運營:用戶運營(用戶分類,用戶生命周期),活動運營,內容運營,商品運營

產品:產品功能,產品體驗,產品調研,用戶需求調研

市場:商務合作效果,渠道推廣效果,投入產出比

流程

需求分析——數據收集——數據清洗——數據分析——報告撰寫——報告分享——投入應用,收集反饋

數據類型

定性數據(一般通過問卷調查獲取)

· 分類數據:男生/女生 天氣好/壞……

分類數據不能區分大小,也不可以進行算術計算

· 順序數據:滿意度評分,教育水平等級,年齡層……

順序數據可以區分大小

定量數據(一般通過日志獲取)

· 離散型:用戶數,消費次數……

可加減,進行頻數分析

·連續型:成績,消費金額……

可算術運算,進行頻數分析,集中趨勢分析(均值,眾數,中位數)&離散程度分析(標準差,方差,最大值,最小值,全距/范圍)

數據收集

(1)數據埋點??

UV,PV,用戶數,用戶停留時間,瀏覽頁面等用戶行為數據

(2)第三方數據平臺

Growing IO,SimilarWeb, Google Analytics, 國家統計局網站……

(3)問卷調查

線上問卷調查,線下問卷調查 & 電話回訪

數據清洗

(1)數據異常表現:空值,波動太大,不同數據源獲取的數據相互矛盾

(2)數據異常原因:系統故障 & 人為因素

(3)清洗方法:刪除異常值,平均值填充,通過統計計算值填充 & 不同數據源交叉驗證

數據分析體系

常用數據分析指標(Key Performance Indicator)

網站分析指標:

UV(unique visitor)? 獨立訪客數

PV? (page view)? 網頁瀏覽量

VV (visit view)? 訪客網站的訪問次數,該網站所有頁面visit=page1+page2+……

IP(?Internet Protocol)? ?獨立IP數

DAU (daily active user)日活躍用戶

點擊率,轉化率,網頁停留時間,網站停留時間,跳出率,退出率等

eg:小皮用ADSL撥號上網,今天9am訪問了www.universityofwarwick.co.uk下的兩個網頁,5pm訪問了同一個網站下的五個網頁,則:

PV=7,UV=1,VV=2,IP=2(ADSL撥號上網每次IP不同)

渠道分析指標:

新增用戶數,用戶轉化率,渠道ROI(return on investment),渠道流量,渠道流量占比

活動效果指標:

活動點擊率,活動參與人數,活動轉化率,活動ROI

收入指標:

付費人數,轉化率,訂單數,客單價,GMV,復購頻次,毛利率,毛利額

用戶類指標:

新增用戶,活躍用戶,留存用戶,回流用戶,流失用戶

用戶價值指標:

用戶最近一次下單時間,用戶下單頻次,用戶消費總金額

#####通過需求分析,找到目標,把目標拆解成不同指標(一級指標,二級指標等)####

橫向拆解數據體系原則:遵循MECE原則,即互相獨立,完全窮盡;同一類型的數據在同一層級

縱向拆解數據體系原則:拆解的時候只能選一條主流程;主流程應該選擇大多數用戶的操作流程

不同類產品關注常見指標「例子」:

電商類

{GMV=流量*轉化率*客單價;毛利額=流量*轉化率*客單價*毛利率}

工具/社群類產品

?{活躍用戶數=新增活躍用戶數+已有活躍用戶數

二級:活躍用戶數=新訪客流量*新用戶激活率+已有用戶數*已有用戶留存率}

游戲類產品

{付費收入=活躍用戶數*付費率*ARPU

二級:付費收入=(新活躍用戶數+留存用戶數)*付費率*ARPU

三級:付費收入=(渠道流量*轉化率+老用戶*留存率)*付費率*ARPU}

O2O類產品

{訂單完成率=已完成訂單數/需求訂單數

二級:(新用戶訂單數+老用戶訂單數)/(新用戶需求數+老用戶訂單數)

常用數據分析框架(數據分析方法論)

1. QQ模型

數量(絕對數):用戶數,瀏覽量,點擊量

質量(相對數):留存率,轉化率,參與率

eg:某banner活動點擊量很高,但參與率低,說明可能活動能吸引用戶,但是參與門檻高

2. 用戶行為理論

3. 5W2H分析法

4. AARRR模型(“海盜模型”)

5. RFM模型(用戶價值模型)

6. 人貨場模型

常用數據分析方法

對比分析法,分組分析法,矩陣關聯分析,邏輯樹分析方法,漏斗分析法




?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容