數據分析思維系列文章第一部分留了一個尾巴,還有一個底層思維——事實思維沒有介紹。但是我覺得事實思維可以直接引申到指標思維,因此干脆放到一起說。
先說說什么是事實思維
我們平時表達的內容基本可以分為事實和觀點兩部分。
美國從小學開始教育如何分辨事實與觀點,告誡學生事實不可否認,而觀點則可以不認同。事實和觀點混淆不清,是無法進行有效思辨和質疑的。
如果和別人辯論,對于事實,你可以用可信的證據去反駁;對于觀點,則可以各自表述。
比如,當一個人說:“我覺得今天好熱啊!”這就是一個觀點陳述,你不能以“今天才28度,不熱啊”去反駁他。因為對于說話者,28度可能就算很熱了,因為各人的感受和標準是不同的。
但如果一個人說:“今年夏天比去年的溫度高多了!”,涉及到事實層面的問題,你就可以拿兩年溫度對比的數據作為證據去反駁了。
由于中國的學校教育普遍缺失這一部分知識,所以很多中國人搞不清這兩者的區別。所以中國人的溝通往往容易陷入一些無畏的爭論中。
比如主管批評下屬:“你怎么經常遲到!”
下屬很容易抗拒,什么叫經常?我才遲到了三次,李四這個月還遲到了四次怎么不說他?然后對話就陷入了對抗模式。
“你怎么經常遲到”這句話是一個觀點,代表了主管心目中的評價。如果把觀點換做事實,那么溝通會更加容易。
“小張,你本月遲到了3次。”這句話是一個事實,無可辯駁,主管也沒有加上評判。
這時候小張的對抗情緒就會淡化很多,更容易找出問題的根源。
數據分析工作的目的是為了提升公司的決策水平。如果不能描述客觀事實,那么信息在溝通過程中很容易變形。
如果開會的時候說“本月的銷售額大幅下降”這樣的觀點,不同的人會有不同的理解。有些人會覺得下降20%以上叫大幅下降,有些人覺得下降10%就叫大幅。
如果去掉“大幅”呢?“本月的銷售額下降”這句話怎么樣?
這是一個事實,但是不同的人理解的可能是不同的事實,因為沒有說清所謂的下降是拿什么做對比。所以這個事實很容易造成誤解。
說話者腦海中想的可能是相比上個月銷售額下降了。但是有些人關注的是和去年同期相比是上升還是下降。
最清晰的事實是“本月的銷售額相比上個月下降了10%”。這句話是客觀事實,無法改變,每個人獲取的信息也是相同的。
團隊中每個人擁有相同的信息,才有可能提升決策水平。
這種只說事實不說觀點的能力要求很高,人們總是喜歡情緒化的表達。印度哲學家克里希那穆提曾經說過:不帶評判的觀察是人類智力的最高形式。想要將事實思維融入到日常交流中,需要大量的訓練。
這也是數據分析師入門容易,精通難的原因之一。
用指標描述事實
想要保持穩定的說事實的能力,最簡單的辦法就是把需要衡量的事物數據化。
目前互聯網行業里諸如瀏覽量、活躍用戶、響應時間等等指標的應用已經非常普遍了。每個互聯網從業者或多或少都知道一些常見的指標。許多指標已經約定俗成,即使你換一家公司,甚至換一個行業,這些指標依然沒有溝通成本。比如衡量用戶粘性就用留存率,反應產品的流量就用日活月活。
這些基礎的數據指標知識,相信你或多或少都有了解。這種基礎的監控型的指標這邊就不多說了,下文會附上一些常見的數據指標。
不僅指標能提升我們對業務的理解,單單是確定指標的過程,就能極大地提升我們對業務的理解。也就是說,當我們知道我們要用什么指標的時候,我們就能更好的理解業務。
剛才提到,現在的各種指標大家已經很熟悉了,比如留存率、日活用戶數等等。但在時間周期拉長了看,會發現互聯網行業的指標側重點是不斷變化的。
比如最早的PULSE指標體系,這些指標是用來衡量用戶體驗的。指標包括:
Page view:頁面瀏覽量
Uptime:正常運行時間
Latency:延遲
Seven days active user:7天活躍用戶數
Earning:收益
那個時代對產品的要求很低,只要能解決問題就好,所以這些指標更多地關注產品的可用性。只要確保產品能穩定快速運行,不會出現負面的體驗就行了。
隨后又發展到HEART指標,也是衡量用戶體驗的,是PULSE指標的升級版。包括:
Happiness/愉悅度
Engagement/參與度
Adoption/接受度
Retention/留存率
Task success/任務完成度
相比PULSE,HEART指標不單單是注重可用性,而是開始考慮到產品體驗的優化。這個時候同類產品開始出現,單純拼功能已經無法獲得競爭優勢,而是要在用戶使用體驗上優化以此獲得用戶的喜愛,所以增加量愉悅度、參與度等這些維度。
舉個例子,原來在沒有聊天軟件的時候,你只要做到“可用”就可以了。但是到了后來,聊天軟件越來越多,有更好體驗的產品才能活下來,所以需要考慮用戶的更多需求和體驗,于是有了群聊、陌生人社交等功能加入。
互聯網發展到現在,產品的差異性越來越小,公司之間競爭的陣地從產品切換到運營,于是近幾年開始流行基于AARRR的指標體系。
Acquisition:獲取,用戶如何發現(并來到)你的產品?
Activation:激活,用戶的第一次使用體驗如何?
Retention:留存,用戶是否還會回到產品(重復使用)?
Revenue:收入,產品怎樣(通過用戶)賺錢?
Refer:傳播,用戶是否愿意告訴其他用戶?
相比之前的指標模型,AARRR站在更加宏觀的全局角度審視整個產品,并且更偏向運營。
在過去,用戶有自發需求,會去“找”產品。現在的用戶,大部分需求都得到了滿足,該找的產品都找好了,再想讓用戶選擇自家產品,就需要通過運營手段引起他們的使用興趣。
所以,現階段互聯網環境下主流的指標體系都是基于AARRR構建的。文章最后一個部分會介紹現有比較常見的基于AARRR的指標體系。
可以看出,確定指標的過程,不僅可以達成“說事實”的結果,還能夠幫助自己梳理思路。你知道要量化什么,就說明你清楚了自己更看重什么,你對自己業務的理解往往也就更加清晰了。
如何量化指標?
日常的分析工作中,除了這些基礎指標,還會遇到一些特定的業務問題,需要用數據分析解決。比如業務想對比用戶對兩款產品的喜愛程度,或者衡量APP的穩定性。這種情況下我們該怎么辦?
曾任阿里巴巴數據委員會會長的車品覺在《數據的本質》一書中,給出了如何量化問題的方法。
想要量化某個事物,關鍵是要先搞清楚量化后的數據是為了解決什么問題。如果我們關心X,我們可以通過下列步驟完成量化。
首先,我們要澄清X到底是什么?
比如,你想量化用戶對某個功能的喜愛程度,那么究竟什么算是“喜歡這個功能”?是使用頻次嗎?是使用深度嗎?還是用戶分享的比例?你需要不斷用問題去澄清X到底是什么。
然后考慮如何量化X
如果是使用的深度,那么我們可以量化“使用深度”嗎?可以用功能內的停留時長,或者各個子功能的使用廣度等等。找到可以用數據衡量的指標來表示“深度”。
最后,量化后的數據能增加我們對X的了解嗎?
或者說能降低我們的不確定性嗎?
比如“子功能的使用廣度”這個指標能讓我們確定用戶喜歡這個產品嗎?如果這個指標比較高的用戶只是用戶不明白如何使用產品,而進行的探索動作。功能使用率高的用戶不能代表用戶喜歡這款產品,那么這個數據不能有效降低我們對產品受歡迎程度的了解。
如果量化后的數據對我們理解X沒有什么幫助,那么我們就得回到第一步,重新澄清什么是X。
如果你覺得你的業務問題是無論如何都不能用數據量化的,那么我建議你看一下《數據化決策》這本書。我更喜歡這本書的英文名,how to measure anything——如何量化一切。
書中有很多精彩的例子,比如如何衡量數據的價值,如何評估一本書的閱讀難度,以及婚姻帶來的幸福感等同于多賺多少錢?
有興趣的朋友,可以讀一讀。
好的指標長什么樣?
《精益數據分析》一書介紹了什么是好的數據指標,好的指標有以下特點:
好的數據指標是比較性的
如果能比較某數據在不同的時間段,用戶群體,競爭產品之間的表現,我們可以更好地洞察產品的實際走向。“本周的用戶轉化率比上周高”顯然比“轉化率為2%”更有意義。
我們現在的數據大部分都是可對比的,不可對比的數據是哪些呢?
比如一次用戶調研,為各個功能的產品體驗打分,最高5分,最低1分。這種數據就不容易對比。分數是4的功能相比分數是2的功能,產品體驗是2倍的關系嗎?顯然不是。
好的數據指標是簡單易懂的
如果人們不能很容易地記住或討論某指標,那么通過改變它來改變公司的作為會十分困難。
前不久,一個朋友在交流群里問:過去90日B端用戶14天內休眠比例,和B端下單用戶次月留存,這兩個指標用哪個好?
雖然我并不了解這位朋友的具體業務形態,但是第一個指標很明顯太復雜了。如果采用了這個指標,遇到的第一個困難就是如何向團隊成員解釋這一指標。為什么是過去90天?為什么是14天?
如果要向領導匯報,領導還要花點時間先理解一下這個指標的含義。
相比之下,次月留存的理解成本就非常低,和團隊其他成員溝通完全沒有障礙。因此我推薦他用更簡單的次日留存。
有些指標雖然可能更“貼合業務現狀”,但是復雜的指標不利于團隊協作,只有少數人理解的精準指標還不如所有人都理解的近似指標。
好的數據指標會改變行為
這是最重要的評判標準,錯誤的數據指標會引導錯誤的業務行為。現實中,最常見的導向錯誤行為的指標是“虛榮指標”,即數字看起來很好看,但是實際上對業務并沒有什么幫助。
純銀寫過一篇文章《不可靠的數字》,舉了很多虛榮指標的案例。
曾經的大眾點評,搞了不少“團購消費后發評論賺積分”的活動,評論數大漲,但評論質量很水,不得不用各種算法把這批低質量評論沉下去。這些業務動作的原因是美團的點評數上升很快,大眾點評感到了壓力。
而國外的TripAdvisor,是旅行行業巨頭,在那上面去點評一家酒店,限制必須寫50個漢字以上,必須寫“標題”與“來訪類型”,不寫全就不讓發。這種機制對點評數KPI是多大的傷害啊。
然而TripAdvisor是全世界最大與最具盛名的旅行點評產品,甩了第二名幾百條街。
可見點評數是一個虛榮指標,雖然看起來點評多了,但是實際上垃圾信息也多了,用戶體驗反而下降。
年前馬蜂窩被爆裁員,有人就從指標的角度進行了分析。
馬蜂窩本質上是一個旅行攻略的分享網站,基本盤是寫攻略 +消費攻略的人。
它的核心策略應該是增加優質內容的供給提升內容分發的效率,圍繞日消費超30分鐘 的以上的用戶持續做優化。
但是馬蜂窩在融資以后追求日活數據,采用了一套不適合自己的運營方式。雖然這期間馬蜂窩的日活從80萬漲到了200萬。但是核心用戶在最近3個月從26萬降低到18萬再到現在10萬且 持續降低,基本盤差不多都流失了。
產品的核心價值越來越低,自然失去了競爭力。
前不久,有朋友問了我如何衡量產品粘性,用留存率還是流失率。
這兩個指標剛好互補,留存率是仍然在使用的用戶比例,流失率是不再使用的用戶比例。從數學意義上來說,知道了留存率,也就知道了流失率,兩者的和肯定等于100%。
那么在業務上,是不是隨便用哪個指標都可以用來衡量用戶粘性?
要記住,我們選擇了什么指標,就會導向什么業務動作。
留存率更加關心的是,從用戶獲取的角度綜合分析獲取用戶的渠道方式是否合理,產品用戶規模是否能夠增長。而流失率則關心為什么有些用戶離開APP。
如果我們選擇了流失率,那么我們就更傾向于流失用戶的召回。可能會選擇短信召回,老用戶禮包等運營方式降低產品的流失率。這些運營動作一旦奏效,就很容易滿足于短期運營行為帶來的數據優化,失去對產品價值提升的關注。
如果我們選擇了留存率,那么我們就更容易聚焦在更具長期價值的工作上,比如產品的優化。
如果產品是穩定期,產品形態已經非常固定,每一個現有用戶的流失都會有較大的損失,那么流失率就是比較好的選擇。
如果產品還在用戶增長階段,那么留存率可能是更好的選擇。
指標的選擇很大程度上取決于業務的需求,一定要找到符合當前業務需求的指標。
好的數據指標是一個比率
為什么比率是一個好的指標呢?
因為比率符合前面說的三點。比率比較容易對比,容易理解,而且比率的可操作性強,是行動的向導。
比如一次促銷活動的銷售收入是10萬,而之前是30萬,能說活動很失敗嗎?不一定,我們必須知道覆蓋人群,才能衡量這次活動的效果好壞。
也許這次活動覆蓋人群只有上次的十分之一,那么我們用轉化率作對比,就可以只用一個指標,就能評估這次活動的好壞。
順便提一下,《精益數據分析》這本書常讀常新,我一直建議數據分析師經常看看這本書。
一些常見的業務指標
最后列舉一些常見的業務指標,我以目前最常見的AARRR數據指標體系舉例。
AARRR分別代表了五個單詞,又分別對應了產品生命周期中的五個階段:
獲取(Acquisition):用戶如何發現(并來到)你的產品?
激活(Activation):用戶的第一次使用體驗如何?
留存(Retention):用戶是否還會回到產品(重復使用)?
收入(Revenue):產品怎樣(通過用戶)賺錢?
傳播(Refer):用戶是否愿意告訴其他用戶?
每個步驟下常見的數據指標有:
1. 獲取用戶(acquisition)
1)日新登用戶數
定義:每日注冊并登錄APP的用戶數。
對于一些APP而言,則是首次啟動進入APP的用戶。所以對于DNU的定義也可以是:首次登錄或啟動APP的用戶。在移動端統計中,一般按設備來計算。
2)注冊用戶成本
定義:獲取一個注冊用戶的成本
該指標,對于分析各渠道獲取注冊用戶的成本,制定最優的投放計劃。
3)ROI
定義:各渠道投資用戶的投資產出比
衡量渠道和用戶的性價比,找出優質渠道。
2. 提高活躍度(activation)
1)日活躍用戶數(DAU)
定義:每日登錄過APP的用戶數,一般簡稱日活。
對于某些APP而言,啟動就是一個活躍用戶,而另一些則要通過賬號注冊,形成一個網絡賬號,才算作一個活躍用戶。活躍用戶的計算是去重的。一個用戶一天來N次也只計算一次。
2)周活躍用戶數(WAU)
定義:最近7日(含當日)登錄過APP的用戶數,一般按照自然周計算。
和日活類似。
3)月活躍用戶數(MAU)
定義:最近一個月即30日(含當日)登錄過APP的用戶數,一般按照自然月計算。
MAU變化幅度較小,產品用戶規模穩定性來說,MAU是風向標。但在推廣時期,版本更新、運營活動的調整,對于MAU的沖擊則更加明顯。
此外,產品的生命周期階段不同,MAU的趨勢變化也不同。
4)日均使用時長(DAOT)
定義:每日總計在線時長/日活躍用戶數。
關于使用時長,可以分為單次使用時長、日使用時長和周使用時長等指標,通過對這些指標做區間分布和平均計算,了解參與黏性。
5)DAU/MAU
通過DAU/MAU可以看出用戶每月訪問App的平均天數是多少,這是評估用戶粘性的一個比較重要的指標。
DAU/MAU介于3.33%到100%之間,但顯然這兩種情況現實中基本不可能出現。在不同領域的App會有不同的基準值可參考。
DAU/MAU的值越高,說明App的粘性越強,表示有更多的用戶愿意使用App。如果DAU/MAU的值很低,并不能直接說這個App是失敗的。
3. 留存(retention)
我們需要可以用于衡量用戶粘性和質量的指標,這是一種評判APP初期能否留下用戶和活躍用戶規模增長的手段,留存率(Retention)是手段之一。
1)N日留存率
定義:用戶自登錄后,在第N日還有登錄的用戶比例。
一般常用的N日有次日、三日、七日。其中的登錄可以根據實際業務情況更換成注冊、使用功能等業務動作。
留存率可以判斷渠道的真實性和活躍性。
有時,也要關心流失率的分析。
正如之前提到的,留存率和流失率的關注重點不同,根據業務情況不同,選擇重點關注留存率或者流失率。
4. 收入(revenue)
收入是平臺運營最核心的指標,他直接影響平臺及產品能否良好運營下去。
1)付費率(PR或者PUR)
定義:付費用戶數占活躍用戶的比例。
通俗地說,付費率也稱作付費滲透率,在移動APP市場,多數只關心日付費率——即Daily Payment Ratio。
付費率的高低不代表產品的付費用戶增加或減少,付費率在不同APP類型的產品中表現也是不同的。該指標可以評估產品的收益轉化能力。
2)活躍付費用戶數(APA)
定義:在統計時間區間內,成功付費的用戶數。一般按照月計,在國際市場也稱作MPU(Monthly Paying Users)。
3)平均每用戶收入(ARPU)
定義:在統計時間內,活躍用戶產生的平均收入。
公式:ARPU=總收入/用戶數
國內的ARPU往往計算的是 總收入/付費用戶數,實際上國內說的這個口徑嚴格上是ARPPU。ARPU用于產品定位初期的不同規模下的收入估計,也是LTV的重要參考依據。
4)平均每付費用戶收入(ARPPU)
定義:在統計時間內,付費用戶產生的平均收入。
公式:ARPPU=總收入/付費用戶數,即總收入除以總付費用戶數。
部分頭部用戶會影響平均值,分析時需要看一下用戶付費金額的分布,盡量避免頭部用戶和長尾用戶的影響。
5)用戶生命周期價值(LTV)
定義:客戶終生價值,是公司從用戶所有的互動中所得到的全部經濟收益的總和。
這個指標決定了獲取一個用戶我們能接受的最大成本,在獲客階段的成本如果超過LTV是不劃算的,當然除非正處在砸錢圈用戶的階段。
5. 傳播(refer)
互聯網時代,用戶自傳播變得越來越重要。近幾年有許多經典的病毒式營銷案例,比如拼多多的微信拼團,就是通過用戶自發的行為達到產品推廣的目的。
1)傳播用戶數
定義:有分享傳播行為的用戶人數
一般是已經使用產品的種子用戶,該指標可以衡量產品的被認可程度。
2)傳播次數
定義:傳播用戶傳播的次數
3)被邀請注冊用戶數
定義:傳播過程中邀請過的轉化成注冊用戶的人數
4)K因子
定義:(每個用戶向他的朋友們發出的邀請的數量) * (接收到邀請的人轉化為新用戶的轉化率)。
K因子也被稱為病毒系數,用來衡量推薦的效果,即一個發起推薦的用戶可以帶來多少新用戶。
比如用戶向用戶發起3次邀請,每次邀請轉化的比例是30%,那么最終的結果就是3*0.3=0.9,即一個用戶會邀請來0.9個新用戶。
5)NPS分值
不是所有場景都像互聯網一樣可以追蹤用戶的分享行為,很多傳播行為是口口相傳,這種無法獲得推薦和轉化率的情況下,NPS分值是較為常用的評估指標。
NPS是通過發放問卷的方式,然后在問卷中問用戶有多大的意愿向身邊的朋友推薦這款產品,分支分為0-10分,其中0-6分為不推薦,7-8分為不納入NPS計算范圍,9-10分為推薦者。
NPS=【(推薦用戶數—不推薦用戶數)/返回分數的用戶數】*100
通常認為,30分算不錯,50分算很好,70分就算優異了。此前的一些調查顯示,蘋果公司的NPS分值是77分,特斯拉是97分。
寫在最后
指標思維的內容并不復雜,難點在于保持“說事實”的習慣。優秀的數據分析師在日常溝通時,是不能出現諸如“一些、有點、非常”這樣的模糊詞匯的,而是說出具體的數據。
所以本文只是做一個引導,更重要的還是要時時提醒自己,做到冷靜的觀察,用指標數據代替情緒化思考。
長期堅持,就能忘掉堅持,成為一種思維習慣。
參考文檔:
《數據的本質:無人不是數據分析師》車品覺
《精益數據分析》
《數據化決策》
《不可靠的數字》純銀V
如何看待馬蜂窩被曝疑似裁員40%,真實性如何?- 章魚老師的回答
《5分鐘建立超詳細的AARRR模型數據指標體系》 公眾號:從南跡
《talkingdata:互聯網金融運營指標體系藍皮書》