10.
如何理解人群包?
第一,人群包是平臺為了數據變現在個人隱私和商業應用之間平衡的產物。不管是阿里也好還是騰訊也罷,在人群包上都有「一次打包人群不得低于5000人」的規定,為的就是避免個人信息和個人隱私在使用中透出;
第二,人群包和「精準到人」并不沖突。人群包解決的是人群細分問題,也就是說要我的信息要觸達什么樣的一群人,我從數據上、算法上、策略上予以定義,利用平臺的數據工具打包成一個黑箱;而「精準到人」指的則是在打包人群之后,利用機器對機器之間的黑箱機制,定位和精準推送到人群包中的每個個體,推送過程不可見;
第三,人群包中,人能影響的部分在于初始的人群定義,以及算法的設定等等。人群定義來自于對經驗的抽離,以及準確而有效的數據挖掘,如果涉及商用,則需要更多的行業經驗輸入,根據商業常識提出算法邏輯,以及進行算法調優。
第四點,也是理解上最重要的一點,人群包首先是工程問題,其次是業務問題,最后才是數據問題。
以前在朋友圈發了一條吐槽:「偏激點說,如果沒有工程能力,就別談大數據了。」點贊的朋友不少,不過,對于大部分沒有碰過數據的童鞋來說,恐怕很難理解這里的槽點在哪。
下面我就依據一年來投身大數據的經驗,從我的角度聊聊這件事情。一家之言,不求正確,但求有所啟發。
11.
先從對大數據的認知入手來聊聊對于big data的兩種截然不同的誤解。
第一種,矮化big data,把big data等同于survey data和census data,只關注數據質量好壞和分析方法是否合理。
第二種,神話big data,就是對于大數據存在不合理的想象,似乎大數據一出,什么問題都解決了。
如果簡單粗暴地來跟之前個人觀點做對照的話,第一種觀點把big data視為數據問題,認為BI就可以解決;第二種觀點把big data視為業務救星,卻忽略了數據上所需要的條件,以及缺乏清晰的目標指向——我知道有機會,但不知道機會在哪;我知道有風險,但不知道風險在哪。
這兩種誤解本質上都仍然停留在數據分析的思維上,也即用數據分析來輔助(高層)決策,而并沒有真正使用數據來驅動業務:
如果你自稱是數據驅動,但每件事情都必須由一位分析師經手,那么,你就不是真正的數據驅動。
數據分析和數據驅動的gap在于,在科層制組織中,傳統BI的目標在于支持決策層更好地決策,因此更重視數據本身的質量,更重視分析和洞察的精確性,而對于效率要求并不那么高,最終的成果需要濃縮成為PPT和PDF,由決策層根據報告進行決策,并向下傳達命令;但是在扁平化的互聯網公司,數據驅動的目標在于支持打仗中執行層的業務和決策,更重視的是決策效率,更重視的是普通員工是否能用數據進行自我決策,對于分析和洞察的精確性要求并不高,更在意的是分析、洞察環節都能用機器的方式完成,解放人去做人的事情,從而提高執行效率,更重視的是執行后的優化和迭代。
簡單來說,對于傳統BI,大數據只是分析和洞察的其中一個數據選項,但是對于大數據環境下的數據驅動,更重視的是「快速、規模和效率」前提下的數據工業化處理、數據挖掘以及使用者的自我決策。
這個gap,存在傳統BI和大數據BI之間,也存在BI和業務之間,業務抱怨BI給的數據沒有任何用途,BI抱怨業務沒有給出明確的分析方向。但是,通常來說,業務和BI都會抱怨沒有高質量數據和可靠的分析工具(躺槍)。
不管是把大數據視為業務問題還是數據問題,都忽略了數據存儲、計算、消費過程中的工程難題——如何讓每個員工都能夠通過數據自我決策,如何讓每個業務行為都能夠通過數據自我檢測,如何讓數據驅動業務成為實踐而不僅僅是掛在嘴邊……所有這些問題,都需要通過計算機工程來解決,在平臺上做數據產品,最缺的從來不是產品經理,而是各種工程師。
事實上,這就回到了題目中的第一句話:「(大數據)首先是工程問題」,如果不從這個角度來理解大數據,業務和BI永遠處于一種互相打架的狀態,而不是合作來推動大數據的產品化、商業化。
12.
把人群包以及背后的大數據視為工程問題,意味著在使用人群包之前,需要趟過諸多數據采集、存儲、計算、消費背后的社會、技術、經濟(也稱SET效應)坑。
以平臺為例,(以下6條引用自@才言 的總結)
1、從線下IDC到線上計算平臺的gap(IOE帶來的諸多坑);
2、計算平臺常規作業到熟練使用大數據開發套件的gap(先搞懂BI吧);
3、從開發節點調度管理到熟悉使用數據產品服務使用的gap(人和物的數據不一樣);
4、從拼湊數據產品服務到理解整套解決方案的應用場景的gap;
5、從解決方案確定到預算、合同和項目周期等商務環節的gap;
6、這里面還沒有提到算法,走到建立在分布式集群上的算法平臺還存在gap。
具體的就不一一解釋了,反正碰到了實際的業務問題,自然會懂。
這些gap,首當其沖的就是工程落地的gap,不考慮是否能落地的大數據業務,就好像沒有打地基的樓房,看著威武雄壯,實際上風一吹就倒,沒有意義。
以數據收集為例,我們可能會碰到以下問題:
1.目標所需要的數據是否可收集
2.收集成本是否可以接受
3.不同數據源的數據是否可以打通
4.海量的數據存儲問題如何解決?
5.數據架構如何設計?
……
其次,就是從產品到業務的gap。是否需要開發新的數據產品(模塊),以及,需要什么樣的產品(模塊)組合,類似這樣的問題,常常令人撓頭。
以品牌建設為例,我們就至少會碰到以下實際的問題:
1.如何從行為數據(current behavior)推導出真實的消費欲望(desire behavior)?
2.如何從互聯網的GMV KPI切換為Brand KPI?
3.如何從人群的Targeting(定向)推導出Insight(洞察)?
4.如何保證品牌所使用的人群洞察有效可用?
……
從產品到業務的gap,一句話來說就是「算法代替經驗公式」的gap——哪些經驗公式可以被算法代替,哪些暫時不能,還要從商業服務維度考慮有效的產品組合、業務進度、灰度管理以及企業數據的安全等等問題。
對于訓練有數的分析師來說,這些或許都不是大問題,但是對于數據挖掘來說,或者更進一步說,對于數據產品的落地,都是大問題。
總的來說,為數據找到實際的應用場景,在今天,是比討論大數據的數據質量和分析方法更有意義的事情;而大數據工程能力的缺乏,則會讓以上討論都毫無意義。
13.
回到人群包的討論上來。
前文提到目前阻礙大數據規模化使用的兩大基本問題:數據打通和數據質量,這兩點在上一篇《數據上云之一》里面已經有過解釋,這里說一說為什么理解人群包非常重要。
以前在其他文章里講過一個基本觀點:
電商1.0是零售上網,電商2.0是數據上云。(詳見詘作《什么是大數據業務》一文)
分享一種最近一直在用的數據視角來分別解釋這兩者。
簡單來說,就是以貨為中心和以人為中心的區別:「零售上網」是基于貨的id去mapping(匹配)所有的數據,不管是天貓、京東,還是順豐、菜鳥,核心視角是貨的供求關系;而「數據上云」是基于人的id去mapping所有的數據,核心視角是人有哪些需求,又是如何被滿足的。
和貨的數據相比,人的數據要更為海量和多元,也更難收集和處理。僅以投放舉例,過去你只是想賣貨,那么,阿里媽媽三千個標簽就足夠滿足你的需求,但當今天你不只是想賣貨,還想和消費者建立一些聯系,并且想通過這種聯系從激烈的競爭中脫穎而出,那么,阿里媽媽的數據標簽就不夠用了。后來御膳房一度成為投放的新寵,以及今天鉆石展位(阿里的display廣告產品)越來越成為商家曝光的首要選擇,都是這種需求的表現。
當這種需求無法通過數據滿足的時候,人們就只能轉向媒體誕生后的「內容定向」來尋求和消費者的強聯系,自媒體以及自媒體廣告的火熱,背后隱藏著的正是數據營銷從「以貨為中心」向「以人為中心」的轉變。阿里巴巴大舉旗幟進入內容營銷、以及去年阿里媽媽在大會上宣布「去標簽化」、阿里巴巴商家事業部發布客戶運營平臺,都是這個過程中最具有代表性的事件。
再舉一個例子,我之前所參與的大數據策略產品,核心在于「每個人的價值觀由其喜愛的事物所構成」,試圖從人的One ID的角度來重新梳理底層數據以及算法,用價值觀分群的方式,用大規模、工程化的數據處理能力,智能化洞察每個個體的需求,來重新定義人、貨、場之間的關系。
這也一定是未來數據產品的發展方向。
把商業從數據意義上強回歸到「以人為中心」,這就是人群包的意義所在。
14.
如果略加展望,那么,未來那些擁有「數據圍欄」,并能夠從各種業務中收集到人群數據的商業項目最具有商業前景。
舉生鮮超市為例。
線下的生鮮超市,在高德地圖上只能說是一個point(點),而不是POI(point of interest)點,因為在地圖的這個點上,你只能查看到地址在哪,從我所處的為止過去要多少公里,可能還有一些外觀的照片和店鋪自己寫的介紹;
好一點的生鮮超市會開展線上配送業務,那么,你在餓了嗎的app上可以查看這家店鋪有哪些生鮮供貨,價格如何;
但是,當消費者的ID在平臺上和其他平臺數據打通以后,那么,店鋪或許就會知道核心消費者的消費水平如何,他們更喜歡在外面吃飯還是自己做法,他們經常聽什么音樂,喜歡什么明星,因此,就可以在店鋪中針對性的開展新業務和提供新的服務,這個時候,在這個point上就富集了大量的人群興趣,并且,我們有途徑(比如支付寶)可以和人群產生互動,讓數據流動起來成為活數據。
我并沒有說盒馬鮮生,不過我認為這就是接下來最具有數據商業前景的模式:
- 首先是線下某類人群的富集區域或工具(原生或者后來創造);
- 其次是該業務整體上線,并且可以通過第三方支付、移動app等方式和人群發生互動;
- 長遠來說一定是數據可規?;杉蛘邔儆讵毺氐臄祿愋?,或者就是數據質量特別高,短期內的表現可能是人群需求富集,或者是人群(包)質量比較高。
這個公式簡單來說就是:數據上云=零售上網+人群包。
下一篇會對這個公式進行詳細解釋,這篇就寫到這里了。
<未完待續>
人了解世界的時候,都是先問who & where,慢慢學會問why,當對答案不滿足的時候就開始問how,所以,knowhow才是人對世界的回答。謝謝關注Knowhow_Ho,何夕一言堂,這是我對世界的回答,一家之言,不求正確,但求有所啟發。