微觀上,沒有唯一答案才是推薦系統唯一的答案
在相當長的一段時間里,百度搜索的pm們有一項基本功就是搜索結果滿意度的評估。搜索的結果是固定集合,每個query的結果千人一面。每個PM都有上帝能力,在不看用戶行為的時候能大體判斷出哪個是更好的結果。
從搜索切換到推薦,從固定query(一個詞)切換到了富含上下文的模糊query(時間、地點、人物偏好、閱讀歷史、網絡環境),也就從千人一面唯一答案 切換至了千人千面的多元答案。
例子:
在霧霾當道的環境里,給關心親子內容的用戶推薦怎樣的內容是好的?
是霧霾口罩,還是英語教育?
主觀判斷是霧霾口罩吧(這正是傳統網站編輯的選擇)。但是細拆一下就會發現,坐標在云南、西藏的人,他們是將霧霾當社會問題來看的,而不是親子健康問題來看的。他們不那么關心霧霾口罩、空氣凈化器的選購。
進一步,推薦給身在北京的家長可好?細拆一下還是有問題,如果一個用戶已經看了足夠多的霧霾相關內容,他還會不會看更多的同類內容呢?新的內容是換個角度論述,還是包含更多的信息?
一連串的拆分做下來,你會發現在千人千面的場景下,主觀判斷頹然無力。你也許還有能力判斷什么是極差的,但很難判斷什么是更好的。
放下了主觀預判,接受每個用戶的個體差異性,才能夠更好的通過后驗數據來驗證自己的想法,把提案權留給自己,把決定權交給用戶。讓每一個策略、規則、產品形態、交互方式,都成為經過已有用戶群體檢驗的合格品。
宏觀上,圍繞滿意度和留存優化,才能更可持續的發展。
在微觀上放棄了主觀臆斷,才能夠在宏觀上,在統計數據和產品方向上去設定目標,產出方案,檢驗效果。
常見的指標如點擊率,多樣性等不用多說,是最敏感且易測的指標。但推薦產品經理需要跳脫局部指標的KPI導向,站在整個產品來看:只有用戶(無論是C端還是B端)滿意度【反饋、問卷】 和 留存指標,才是可持續發展的根本。
以視頻為例,如果為了湊VV,可以做自動播放、可以偏向于推薦較短的內容、可以推高熱的內容、可以不做興趣探索等等,常見的指標不一定 甚至說 一定不會下降。但這樣,從長期來看喪失了更好的發現C端新需求的機會,也對B端作者的分發不夠友好。這種變化也會慢慢體現在C端或B端的留存指標上。
圍繞敏感指標做優化的時候,你不僅需要是一個用戶【站在如新用戶、老用戶的角度來考慮】,還需要是一個自媒體【站在我是一個自媒體,這個新策略對我的內容分發量有什么影響】,換位思考滿意度,從而預估這個操作是否會對留存產生影響。
舉個例子,在打擊某類內容的時候,最直觀想到的是全局指標。一個數填進報表里,從多少降低到多少,這個雙月的OKR就達成了。
但是這個指標是否會出現某個用戶身上出現密集?造成用戶個體的體驗變差?那就需要引入用戶個體指標,在用戶層增加強規則打散;
解決了全局指標和個體指標,那是否會存在某個內容漏網獲得極大的展示量,從而引發B端的破窗效應?那就接著要引入內容個體指標,確保這樣的內容不會有太高的展示量。
把平臺、C端、B端都想一遍,得出的產品才不會偏得太遠。
操作性:將方向量化成指標,PK指標重要度,指導解決方案選取
我現在在做粉絲方向的,我很痛苦。
因為對于粉絲的內容進行強Boost,是一個很明確有損點擊、有損停留時長的事情,甚至于僅從C端用戶的閱讀需求上來說,幾乎沒有什么正收益。
那,為什么還要做?
- 可能刺激C端做更多的互動,享受更多內容之外的服務。
- 幫助B端更好的變現,從而增強B端的留存。
點擊、停留時長都是看得見的數字。
為了推進粉絲向的事情,就必須補充可量化的B端指標如跟其他平臺發文量的對齊,回復粉絲評論的情況,C端指標如外鏈點擊率、粉絲互動率等等。
指標間可能是沖突的,進一步PK指標的重要程度,達成一個為了實現指標A可以損失百分之幾指標B的折衷,從而在此范圍內進行迭代。