評分、評星、投票是很多網站的標配,比如淘寶的寶貝評價、知乎的贊同。有些網站甚至以這些功能為生存根基,比如大眾點評、豆瓣等應用,用戶的打分、評論是它們的主要功能,目的就是對不同對象進行排序,從而為有需求的用戶提供決策依據。目前大多涉及打分、投票的網站,所有參與用戶的權重都是一樣的。但這其實存在一些問題。
一、存在問題
1.針對單一項目:由于偏好等主觀因素和專業性等客觀因素導致結果失真
以大眾點評為例,吃是一件很個性化的事情,是完全基于主觀感受的,這就導致結果的參考性并不強。舉個例子,兩個人同時去吃泰國菜,對于喜歡這種酸辣口味的人來說,會覺得這家餐廳很好吃,那么他在打分的時候就會偏高了打;而對于吃不慣泰式口味的人就會覺得這家店很難吃,打分的時候自然會往偏低了打。假設在短時間內,去這家泰國餐廳吃飯的人以吃不慣泰國菜的人居多,最后評分總體偏低,此時一個喜歡吃泰國菜的人在大眾點評上看見這家店評分太低就不去吃了,但其實總的來說這家店的口味是中上水平的,那這時候這個評分就會對用戶產生誤導作用。而這個誤導作用的根源就是因為沒有對用戶進行劃分,所有用戶的打分占比的權重是一樣的,沒有把其中真正有效的打分從眾多無效打分中區分出來。
通過劃分用戶屬性改變權重來增強結果的有效性
針對大眾點評而言,我認為合理的打分機制應該是這樣的。首先對用戶的偏好口味和商家的口味都進行標簽化,然后當用戶打分的時候,將用戶的偏好和商家的進行匹配,再根據兩者的匹配度給用戶分配一定的權重。為什么這樣合理呢?我舉一個有點極端的例子。原來的打分機制就好像一群身份完全不同的人,醫生、律師、投資人、學生、家庭主婦、清潔工等等聚集在一起討論一個醫學問題,然后得出了一個平均答案。而我說的這種投票機制也是同樣一群人,不同的是我把其中的醫生區分出來,給他們賦予了更多的權利,在統計結果的時候主要參考他們的意見,然后再輔之以其他人群的意見。對兩種打分機制進行比較,顯然后者統計的結果更具參考意義。
歸根究底就是權重兩個字。首先,劃分用戶身份;然后,根據具體情況分配權重;最后,計算出加權分。其實最根本的問題是如何區分用戶身份。我前面提供了一種標簽化的方法,根據一定的屬性來細化用戶身份。我設想的大眾點評打分機制其實就是根據兩者的共同點來匹配雙方。像知乎,也有人提議對贊同根據專業領域進行加權。比如中醫的討論,就應該以醫界人士的意見為準,那么學醫人士的一票贊同就應該等于普通人的1.5票(1.5票只是舉例,沒有科學依據)。
2.針對多個項目:由于參與人數差異導致的不可比較性
以電影點評網站為例,這里就有一個問題:熱門電影與冷門電影的平均得分,是否真的可比?舉例來說,一部好萊塢大片有10000個觀眾投票,一部小成本的文藝片只有100個觀眾投票。這兩者的投票結果,怎么比較?如何才能公平地反映出一部電影真正的質量?
通過加權分來彌補差異
一個合理的思路是,如果要比較兩部電影的好壞,至少應該請同樣多的觀眾觀看和評分。既然文藝片的觀眾人數偏少,那么應該設法為它增加一些觀眾。IMDB網站是目前互聯網上最為權威、系統、全面的電影資料網站,它所特有的電影評分系統深受影迷的歡迎,注冊用戶可以給任何一部影片打分并加以評述,網站又會根據影片所得平均分、選票的數目等計算得出影片的加權平均分并以此進行TOP250(最佳250部影片)和Bottom100(最差100部影片)的排行。
根據IMDB網站上公布的TOP250評分標準,IMDB top 250用的是貝葉斯統計的算法得出的加權分(Weighted Rank-WR),公式如下:
WR = ( v/(v+m))×R + (m÷(v+m) )×C
(其中:R是用普通的方法計算出的平均分;v是參與投票的人數;m是進入IMDB top 250需要的最小票數;C是目前所有電影的平均得分)
仔細研究這個公式,你會發現,IMDB為每部電影增加了m張選票,并且這些選票的基本評分都為c。這樣做的原因是,假設所有電影都至少有m張選票,那么就都具備了進入前250名的評選條件;然后假設這m張選票的評分是所有電影的平均得分;最后,用現有的觀眾投票進行修正,長期來看,v/(v+m)這部分的權重將越來越大,得分將慢慢接近真實情況。這樣做拉近了不同電影之間投票人數的差異,使得投票人數較少的電影也有可能排名前列。
二、權重是否違背了公平原則
無論打分還是投票,我們都是秉著公平公正公開的原則,如果給一個人多一點權利,是不是就違背了公平?其實并不然。什么是公平?我的老師曾這樣給我解釋,真正的公平是,公交上所有的女性、兒童、老人都有座位,而不再這范圍之內的男性都站著。我們并不是生而平等的。我所謂的生而不平等是指,術業有專攻,在不同的專業領域我們這些業余的就是沒有專家的科學和權威。那么如何突出他們的身份,加權。因為只有這樣,我們才能得出最精準、最科學的結果。
三、加權的其他意義
1.區分核心用戶,避免惡意打分/投票
下面再給大家分享一種付費用戶權重大的例子。造作是一個C2B的家具電商平臺。在家具設計方面,用戶通過投票參與設計。造作給出用戶使用場景、材料、解決方式等命題,設計師會給出設計方案,用戶進行投票,得票高的設計進入后續生產。在投票過程中,造作會考慮到所有用戶的意見,但付費用戶的權重更大。造作為什么要這樣做呢?在我看來,造作是為了通過付費這一行為,一方面使來篩選出平臺的核心用戶。用戶行為代表了他的消費傾向和消費潛力。平臺可以把這些消費傾向和消費潛力直接和產品掛起鉤來,這會讓平臺的銷售顯得無比精準。另一方面,付費用戶較高的權重可以從一定程度上彌補部分搗亂分子的亂投票、惡意打分。我們不可能保證每一分每一票都是有效的,只能通過某些手段盡量減少這些無效打分無效投票。
2.避免同票同分的尷尬場面
當我們做決策的時候最害怕出現平局的現象,這往往使得我們陷入選擇困難或者重選的局面。那么在這種情況下,權重就發揮其作用了。怎么理解呢,舉一個通俗易懂的例子,玩過狼人殺的朋友都知道,警長是擁有1.5票投票權的,為什么呢?因為白天票人的時候很有可能出現平票的情況,那就要進行二次陳述、二次投票,而第二次的投票結果說不定仍然是平票,陷入死循環。此時警長那多出來的0.5票就可以完美解決這個問題了。
以上純屬個人的一些小想法,歡迎大家指錯、討論。