【產品方法論】精益數據分析

注:內容來源于網易云課堂產品經理微專業

一、數據分析概述

數據是量化事物的手段,數據指標代表了現實存在的客觀情況,客觀性是數據最大的魅力所在。但人對數據不同的分析方法和手段融入了主觀因素加工,可能會導致相同的數據得出完全相反的結論(例如辛普森悖論)。1%的疏忽導致100%的失敗,數據的證明力是有兩面性的,在做數據分析時務必嚴謹負責,也不要過分依賴數據分析而限制了產品本身的靈感和創意。

因此,在對數據進行解讀時,要涵蓋數據樣本范圍、提取手段、樣本數量、數據來源、是否經過二次處理、樣本是否完整(在總體的占比)等,判斷數據能證明哪些問題,不能證明哪些問題,不要行動了才知道這個功能只有小部分用戶在用。要深挖數據背后的原因,就需要我們對數據多問為什么,通過邏輯推理,提出有的放矢的追問和假設,然后通過數據或其他手段來驗證,好的追問能夠幫助我們發現數據中隱藏的問題。

1.1、數據分析的三種類型

數據分析按目的的不同可以分為描述性數據分析、探索性數據分析、驗證性數據分析。

描述性數據分析屬于初級數據分析,在統計學中,描述統計是將研究中所得的數據加以整理、歸類、簡化或繪制成圖表,以此描述和歸納數據的特征及變量之間的關系的一種最基本的統計方法。一般來說什么數據都可以作描述性分析,常見的分析方法有:對比分析法、平均分析法、交叉分析法。

探索性數據分析及驗證性數據分析側重于在數據中發現新的特征,屬于高級數據分析。不同之處在于,前者注重于對數據進行概括性的描述,不受數據模型和科研假設的限制,而后者只注重對數據模型和研究假設的驗證(無目的/有目的)。常見分析方法有相關分析、因子分析、回歸分析等。

(來自:《誰說菜鳥不會數據分析》)

1.2數據分析與大數據

大數據必須包含三個要素:用全部數據、注重相關關系、全新的計算方法。沒有包含這三個要素就只是普通的數據分析而不是大數據。

用全部數據:當通過數據分析一個問題時,涉及到所分析問題的所有數據都必須納入到計算范圍當中,無論是常規合理數據,還是一些異常的樣本數據都必須包含。甚至傳統數據分析當中可能都完全忽略的數據,都需要包含在大數據分析當中。

注重相關關系:通過大數據分析,最終分析獲得并關注數據當中的相關關系,并通過相關關系指導分析、決策預測,但對因果關系的探索,將不再是這種數據分析所關注的核心內容。

全新的計算方法:即大數據分析,其計算過程不再是傳統的數據分析中,必須精確統計、不容許任何臟數據、錯誤數據的分析方法,而是包含了各類混雜數據的簡單相關性計算。

二、數據驅動產品

數據分析應貫穿產品工作始終,產品開發迭代中也要保持數據敏感性,即平時注意積累數據信息,遇到不懂的信息立刻想到通過數據的因果聯系,讀出其中蘊含的產品趨勢、變化原因及應對方法。

2.1產品三個階段的數據分析需求

立項前的數據分析:更多停留在商業層面的分析及競品分析,前幾章需求分析時有講到。

產品迭代數據分析:更多關注功能本身的表現,通過數據進行迭代,這也是本章重點。

產品衰落數據分析:其實這時候該重新立項或者分析戰略轉型方向起死回生了。

2.2數據驅動產品的方法

在進行數據分析之前,我們首先要對產品和業務流程有深入了解,也包括產品算法、玩法、形勢、相關影響因素等。了解這些內容的原因是每個產品有都自身獨特的指標,指標對不同產品的重要程度都有所差別,因此我們要梳理跟分析問題相關的指標及重要性,確認分析需要的時間周期等。

提出數據需求的過程,是一個“界定產品目的和目標,根據目標提出假設、預判產品效果”的過程,要求對功能目標、功能預期效果有完整且清晰的掌握。確定了產品指標之后,就可以在網站監測工具中設立各種功能、頁面的監測指標。一些重要產品可能不會隨意使用第三方網站監測工具,因此在設計時也要考慮到如何設置跟蹤這些指標。

一旦發現數據指標與預設目標不同、有所變動、出現異常數據,就可以提出問題、進行跟蹤調查。數據能引導我們定位問題,通過具體數據發現具體行為的共性特點,最后找到產品設計的問題,看最終改版后數據是否回歸預期。

除了日常監測,在我們收集到的其他數據中,也可能包含對產品發展有利的數據,這時可能會用到一些探索性數據分析方法,對用戶進行畫像等。

案例:網站注冊流程功能的數據統計需求

? ? 1、注冊流程的完整方案設計文檔。-根據方案設計確定統計方法。

? ? 2、做這個功能的意義:讓所有新用戶快速完成注冊流程,并正確提供所需的必要個人信息。-根據目的統計哪些數據,及功能完成情況。

? ? 3、所需指標及定義:圍繞2中的目標設計所需的數據指標,思考哪些數據指標,可以描述目標完成情況;比如:每一個注冊環節的用戶跳出率,每一個注冊填寫字段的出錯率,各類注冊錯誤的出現頻次分布等。-回溯功能合理性,如果找不到直接的數據指標來統計這個功能那就需要思考是否真正抓住用戶需求/是否在產品階段有必要去做。

2.3數據驅動產品閉環

? ? 發現問題-確定指標-產品設計-開發測試-產品上線-數據驗證

三、如何獲取數據

3.1常用分析工具

網站:

? ? 網站排名工具:Alexa、中國網站排名、網絡媒體排名

? ? 網站監測工具:Google Analytics、百度統計、CNZZ

APP:

? ? 國內分析工具:友盟、TalkingData

? ? 國外分析工具:Flurry,Google Analytics

? ? Crash分析工具:Crashlytics(關注新功能小機型crash、BUG率,盡量避免流失)

3.2獲取數據的方式

1、分析日志

程序員記錄日志-分析師/產品經理給出計算邏輯-程序員計算指標-excel分析或報表。

缺點:周期長、產品經理需對指標計算邏輯清楚。

2、第三方分析工具

第三方分析工具可以自定義事件、轉化漏斗、參與深度。

缺點:網站文件被第三方獲取(可以利用開源網站/APP分析工具,自行架設跟蹤)。

四、常用數據指標

4.1網站數據指標:

訪問量:Session,一段時間訪問量就是這段時間內的會話次數。每次會話都會編號一個sessionID=x,30分鐘內無操作/關閉瀏覽器=同一次會話。

訪客數:Unique Visitor,依據用戶的設備、瀏覽器分配Cookie,訪客數=網站cookie數。

瀏覽量:PageViews,cookie瀏覽頁面的數量。

頁面停留時長:該頁面的總停留時長除以該頁面的訪問量。

網站停留時長:指訪問一次會話的時間長度,等于網站所有訪問量的總停留時長除以訪問量。

跳出率:網站的重要指標。指從這個頁面進入網站,沒做任何事就從這個頁面退出,等于只訪問了落地頁面的訪問量除以總訪問量。

退出率:衡量某個頁面退出網站的比例,指無論從哪個頁面進入網站,最終從這個頁面退出的比例。等于從一個頁面的退出次數除以訪問次數。

轉化率:達成某種目標的訪客數占總訪客數(訪客數換成訪問量也是同樣成立的)

tips:關于采用訪問量還是訪客數作為分母?如果將訪客量作為分母,這回認為一個訪客在購買之前,多次訪問是正常的。

4.2移動應用類數據指標(參考下文AARRR模型)

用戶獲取階段(下載-激活):

1.下載量(已下載應用的用戶數量,以及應用商店排名和評分,靠前助于吸引下載)

2.安裝激活量(安裝并打開應用的設備數)

3.激活率(激活設備數/安裝設備數)

4.新增用戶數(如果設備是首次激活應用,那么這個設備就是新增)

5.用戶獲取成本(每獲取一個用戶所需要的費用)

用戶活躍與參與階段(使用應用):

數量指標

1.日活躍用戶數

2.月活躍用戶數(一段時間內啟動過應用的設備數,表示用戶規模)

質量指標

3.活躍系數(日活/月活)

4.平均使用時長(平均每個用戶一天使用應用的時間)

5.功能使用率(使用某功能的用戶數占活躍用戶的比例)

用戶留存階段(迭代新內容防止流失):

1.次日留存率

2.7日留存率

3.30日留存率

tips:統計日期新增的用戶或活躍用戶,在第N天又來使用的比例。可以參考行業值來對標自己應用的留存是否健康。

用戶轉化階段(讓用戶付費):

1.付費用戶比例(付費用戶站總用戶的比例。付費用戶和免費用戶的行為差別、流失率、營收差別很大。建議將付費用戶和免費用戶區別對待)

2.首次付費時間(用戶激活多久后才會開始付費。有助于把握轉化用戶的時間點)

3.用戶平均每月營收(月收入除以月活躍用戶數)

4.付費用戶平均每月營收(月收入除以月付費用戶數)

4.3電商類數據指標

重要指標:

銷售額:網站的收入

購買客戶數:購買了商品的人數,會按照帳號去重計算。統計新老客戶,增長速度、回購率。

客單價:每個客戶購買的金額,等于銷售額除以購買客戶數

購買轉化率:訪客中購買了商品的比例,購買客戶數除以訪客數(UV)

UV(訪客數)

詳情頁UV(IPV_UV)

訂單數:訂單數關系到支付壓力和倉庫發貨的任務量

妥投及時率:妥投到客戶的訂單中,按照約定時間妥投的比例。

重點商品缺貨率:爆款缺貨的比例

常用公式:

銷售額=UV*轉化率*客單價

UV*轉化率=購買客戶數

轉化率*客單價=訪問價值

客單價=人均購買件數*件單價

客單價變動-件單價-熱銷商品價格變動/人均購買件數-組合裝、單件裝比例/推薦效果

2.4UGC類數據指標

UGC目標:讓用戶產出內容。因此從訪客到產出內容的用戶參與度逐漸加深。

重要指標:

訪客數:Web端訪客數+移動端訪客數

登陸訪客數及占比:登陸的訪客數占總訪客的比例

沉默用戶數及占比:超過7天未產生內容的賬號數占總賬號數的比例

平均停留時長:總停留時長除以訪客數

點贊、推薦、分享、評論、創作訪客戶數及占比=功能使用訪客/登錄訪客數

UGC依賴優質內容,篩選出優質內容的一般公式:

熱度=分享次數+推薦次數+點贊次數(訪客參與度)

2.5數據指標分析案例

網站類:

1.有多少訪客訪問網站,訪問深度怎么樣?

查看GA上的“受眾群體”概覽頁來了解網站的訪客數和訪問深度,結合指標的變化趨勢來看,進一步分析可以看渠道來源的變化、落地頁的跳出率。

2.這些訪客從那里來,以及效果怎么樣?

從哪來?查看GA上的流量獲取的概覽頁:

Referral:引薦網站,如博客、聯盟等等;如果推廣網站靠譜,可以考慮合作。

Direct:直接進入網站;考慮公眾號等轉化

Organic Search:自然搜索;考慮做搜索優化

Paid Search:付費搜索

效果?看哪些頁面跳出率高。

3.訪客在網站上做了什么?

1-流量最大的著陸頁:可以在GA“行為”模塊的“著陸頁”查看。

查看數據:找出流量最大的著陸頁,著重優化,降低跳出率。

2-瀏覽最大的頁面:可以在GA“行為”模塊的“所有頁面”查看。

查看數據:找出流量最大的頁面,并與預期對比,發現差異;與流量最大的著陸頁對比,就能發現訪客瀏覽了哪些頁面,從哪里退出。

3-頁面點擊熱圖:對用戶點擊了哪些鏈接進行分析,可以在GA"行為"模塊的“網頁內分析”查看。

查看數據:可以選擇流量最大的幾個頁面進行分析;

4-主要流程的轉化漏斗:可以在GA"行為"模塊的“渠道可視化”定義轉化漏斗。

查看數據:分析每一步驟的轉化率,找出流失最多的步驟,重點優化。

APP類:

以云音樂為例,云音樂改版較大,因此七天出第一版數據,初步判斷是否存在重大問題。若不存在,兩周出一版進一步確認。

分析思路:

1.看新用戶留存,前14天內新版本是否對新用戶留存起到促進作用。從數據上看,整體增加了留存,初步判斷不存在問題。

2.核心功能使用率,前14天內新增用戶聽歌比例。從數據上看,有提升,說明有利于引導用戶播放歌曲。

3.新功能使用率和繼續使用率(本周使用過功能的用戶,下周繼續使用功能的比例)。

4.對核心功能的促進效率(核心貢獻的概念:使用過功能A的聽歌人數比例-未使用過功能A的聽歌人數比例)

UGC類:

1.有多少訪客,訪客有什么特征?

訪客特征:訪問時間段、在哪些地域訪問、用什么設備、網絡

2.訪客從哪些渠道獲取,效果怎么樣?

基本思路:帶來多少新訪客、瀏覽深度、留存及轉化率情況

WEB網站:新訪客占比(代表渠道拓展用戶的能力)、跳出率、瀏覽頁面數、轉化率。

移動應用:新設備占比、次日留存率、轉化率

3.訪客參與深度如何?

跳出率、瀏覽頁面數、轉化率、核心功能使用率

4.這些訪客最終有沒有轉化,轉化漏斗是否順暢?

任何有意義的動作都可以認為是轉化

最終目標:產出優質內容

轉化漏斗:按功能先后順序、按參與深度

順序漏斗:入站UV、瀏覽商品詳情頁、提交訂單、支付成功

參與深度漏斗:訪客數、登錄訪客數、點贊評論、原創

六、數據分析方法

6.1方法縱覽

一、初級數據分析方法索引

①對比分析(對比思路有——目標對比、不同時期對比、同級部門|單位|地區對比、行業內對比、活動效果 ?對比)

②分組分析法:總體中的數據根據性質做歸類,不同類對比(如年齡組、性別組、學歷組等

③結構分析法:就是某成分占總體的百分比和比率(很容易懂吧)

④平均值分析法:(沒啥好說的)

⑤交叉分析法:通常用于分析兩個變量之間的關系,【如:原數據(地區、水果類型、銷量)→交叉分析后(某地區某水果的銷售量)】

⑥綜合評價分析:多個指標換成一個能夠衡量的綜合情況的指標(好比找找工作,你要求發展前景、薪資、工作環境等,但是面對10個公司做選擇的時候,這些分散的指標并不能幫助你做決策,但如果發展前景60%,10個公司從0-1分別給分;薪資30%,10個公司從0-1分別給分;工作環境10%,10個公司從0-1分別給分,最后計算一個總分降序排列,是不是瞬間感覺決策變的簡單了?)

⑦杜邦分析:涉及財務知識,百度吧~不過原理是找到一個綜合指標,并依次往下找到其相關指標

⑧漏斗分析:漏斗分析(適用于網站中某些關鍵路徑轉化率的分析)+對比分析——不一樣的效果

⑨矩陣關聯分析(重點):百度,一句話說不清,不過感覺經濟類很多模型都是這種類型的呀~書里提及的一個比較好的方法就是在矩陣的基礎上加一個權重分析,可以是的數據更具體形象。。。。。建議看書

二、高級數據分析方法索引

①產品研究:相關分析、對應分析、判別分析、結合分析、多維尺度分析等;

②品牌研究:相關分析、聚類分析、判別分析、因子分析、對應分析、多維尺度分析等;

③價格研究:相關分析、PSM價格分析等

④市場細分:聚類分析、判別分析、因子分析、對應分析、多維尺度分析、logistic回歸、決策樹等

⑤滿意度研究:相關分析、回歸分析、主成分分析、因子分析、結構方程等

⑥用戶研究:相關分析、聚類分析、判別分析、因子分析、對應分析、logistic回歸、決策樹、關聯規則等

⑦預測決策:回歸分析、決策樹、神經網絡、時間序列、logistic回歸等

注:摘自簡書作者 fishD 《數據分析方法索引》

原文鏈接:http://www.lxweimin.com/p/b92d28092475

6.2常用數據分析方法

對比分析:橫向對比-跟目標值比、跟上個月比;縱向對比-跟競爭對手比。

象限分析:通過兩個維度劃分四類。

交叉分析法:對數據在不同維度進行交叉展現,進行多角度的結合分析。交叉分析的主要作用是從多個維度細分數據,從中發現最為相關的維度來探索數據變化的原因。例如縱橫結合對比,橫向:月份;縱向:OS客戶端、渠道。

6.3數據分析框架

常見分析框架:PEST-宏觀環境、5W2H-萬能、SWOT-戰略分析、SMART-目標管理、4P理論-營銷。

互聯網分析常用框架-AARRR(轉化率漏斗)

漏斗分析法除了AARRR,也可以用功能漏斗,即按產品主要功能流程進行漏斗分析。轉化率可以對比-與上月、行業均值對比。

Acquisition(獲取)Activation(激活) Retention(留存) Revenue(收入) Refer(推薦)

獲取:產品運營基礎,用戶從哪里來的。

? ? ?指標:曝光數、點擊數、打開率、下載量、安裝量、用戶獲取成本

激活:用戶開始使用產品。

? ? 指標:設備激活量,新注冊用戶數、訂閱數量、事件達成數、瀏覽數、日活躍率

留存:體驗過產品后,如何讓用戶持續使用。

? ? 指標:次日留存率、7日留存率、距離上次使用時長、DAU/MAU、7日回訪率

收入:關鍵階段,引入用戶貢獻多少價值。

? ? 指標:付費率、付費頻次、客單價、用戶價值

推薦:推薦他人使用產品。

? ? 指標:轉發數、邀請數、評論數、K因子

6.4通過邏輯拆解細化指標

邏輯拆解,即尋找跟核心指標有邏輯關系的相關指標。

原則:找到的指標一定是能夠影響核心指標變動,他們之間對應要存在強烈的邏輯關聯,選用這些相關指標之前,我們必須清楚的了解他們是如何影響核心指標的。當核心指標發生了變動,我們一般會去看跟核心指標最為相關的指標變動從而定位其原因。

分層拆解(邏輯拆解后):

? ? 第一層:直接解釋核心指標、變動的大的方向

? ? 第二層:針對這個大方向的細分,從而能夠將問題定位的更加準確和可操作性。

? ? 原則:同一層里面的各個相關指標都是代表了一個尋找的方向,所以他們之間不能有相關性。

? ? 案例:銷售額=UV*轉化率*客單價(邏輯拆解,看三個指標的變化)然后進行分層拆解:如UV-細分流量相關的指標-推廣來源流量、新老訪客,還可以第三層,直到定位到原因。

? ? 存在的問題:拆解指標時不能保證與核心指標相關的所有信息都能找到。

? ? 遺漏指標:建議多找幾個人頭腦風暴,在其他的方向和因素中找出來。

七、寫在最后

寫得有點亂誒,不過數據分析很多文章、書籍都有寫,但更重要的果然是實踐環節,平時多練練,做不到的話可以多想想平時用的產品應該分析哪些指標,指標的預期是多少,如何改進...

tips:大家還可以找找數據需求文檔,看看別人是如何提出數據需求的。

心法層面:

好奇心、求知欲、寬廣的心懷、敢于打破常規、熱愛生活享受生活

通過正向反饋去培養能力

基礎層面:

核心基礎概念:PV、UV、跳出率、轉化率、訪問數、點擊數等

基本統計原理:cookie、訪問請求、日志等

如何結合工具:

1.數據驅動產品的思維方式

2.對業務邏輯做足夠的了解-了解底層、系統調用-從底層業務出發提取關鍵數據

3.日常中重視數據保持敏感,關注數據活用數據

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容