文/明道創始人任向暉
艾瑞和今日頭條的爭吵背后,大家都在評論兩家公司的公關水平,依我看,因為難得吵架,水平都不怎么樣。張一鳴和楊偉慶都是業內謙謙君子,這樣吵下去,會有失身份和水準。
業內很多朋友都知道我和艾瑞的關系,我也不避諱。但以Henry的為人和我對艾瑞的了解,并不擔心此事的最終結果。所以我也不需要偏袒艾瑞,只是希望大家更加關注這個行業背后的理性基礎,更完整地了解媒體評估業,不用把注意力都放在公司PR上。
這個事情的爭議本質在于媒介評估(也有人稱為媒體測量,媒體審計)的方法是否合理?艾瑞在執行這個方法的時候是否行為一致?如果你要評價兩家公司的言論是否有道理,先要明白媒體評估的基本原理和行業實踐。
媒體評估的方法在不同的媒體時代完全不同。印刷媒介時代只有絕對值審計服務(由出版商委托),只是美國的審計市場高度集中,只有ABC,BPA等少數公司做,所以自然也就能夠根據絕對值得出排名。而報刊發行量的審計基本就是依靠出版商提供的印刷發票和發行記錄進行的。中國企業很難理解這一點,這不是明擺著可以作弊么?可是事實上,這個行業用這個方法已經有100多年的歷史了,貌似沒有聽說過有哪家報紙雜志虛報發行量給審計公司的。當然,無論是ABC還是BPA,都會毫不客氣地根據品類和發行量對審計過程進行收費,簡單說就是“你要我證明你的數據是真的,請付錢給我的證明服務,數據越大,付錢越多”。這個邏輯建立在相當程度的商業誠信度基礎上,如果企業對商譽沒有那么關切,自然就有作弊的動力。但實話說,美國的印刷廠也絕對不愿意幫自己的客戶撒謊提供假發票,因為如果因此引來訴訟,那個后果是沒有人能夠承擔的。
到了電波時代,媒體審計模式遷移到媒體評估模式,評估商不需要電視臺提供什么數據,而是在城市家庭中,按照人口統計學數據抽樣樣本家庭,然后每家發一個專門的遙控器(被稱為PeterMeter),通過遙控器記錄的數據反推出每個電視節目的收視率絕對值,有了絕對值,排名當然也就有了。尼爾森靠這個在全世界建立了一個基本壟斷的生意(在中國曾經和央視索福瑞競爭),因為建立樣本收視戶是一個固定成本比較高的事情。
艾瑞的發展起源于PC互聯網時代,它的方法和在大洋彼岸的Alexa類似,通過合作的應用軟件獲取樣本用戶,然后根據樣本用戶比重反推絕對值。依據統計學原理,這個方法對于跟蹤市場滲透率較大的網站和應用是沒有問題的。Alexa早期自己就是一個瀏覽器工具條(Toolbar),后來數據來源逐步轉移到瀏覽器擴展應用上(Extentions),所以凡是使用艾瑞或者Alexa數據的用戶都會發現對于大眾類的領先網站,數據是很平滑的,而對于流量較低的垂直類網站就不見得湊效了,甚至有的時候數據都沒有辦法跑出來。所以,通常這個方法只能服務每個國家的top 1000網站媒體。這個方法被稱為User-centric measurement。
與此相對應,Nielsen采用了Site-centric measurement模式,說白了,就是回到了媒體審計的老路,它要求客戶在網站中加入跟蹤代碼,獲得全量數據。但和今日頭條的問題類似,如果沒有購買這個審計服務的網站就無法參與排名。盡管當年Nielsen中國為了解決這個問題采用了一個混合策略,和一家中國公司合作,通過補充樣本用戶模式數據來計算出完整的網站排行。
實際上,每一家媒體評估商為了讓數據能夠更加準確,都可能綜合使用兩種方法讓樣本反推數據更加接近真實值。差異主要在于審計商是否依賴加碼審計建立收費商業模式。艾瑞在中國也是提供Site Audit服務的,只是它的收入比重遠不如樣本數據來源的iUserTracker.
到了移動互聯網時代,情況變得更加復雜了。需要被評估的對象變成了一個個的App,通過瀏覽器插件取樣的樣本研究法走不通了。想要獲得所有用戶訪問所有app的數據幾乎不可能。業內一直有通過運營商獲得路由級全量數據的講法,技術理論上有這個可能,但實踐上我從來沒有看到過此類數據能夠提供實際的媒體評估服務。
所以,現有的移動互聯網媒體評估依然通過樣本研究的方法,只是獲取樣本的手段和PC互聯網時代不同而已,這里最有代表性的是Talkingdata和AppAnnie,前者通過提供免費的移動訪問統計平臺讓部分App愿意使用它的SDK,后者通過提供免費的應用商店排名信息讓部分app愿意綁定應用商店帳號,從而獲得可靠的絕對值。兩種方法都不可能保證覆蓋所有的App,所以評估商需要利用統計學知識來進行推算。因為AppStore和Google Play的排名信息基本是公開的,所以評估商就可以根據排名次序和部分具備絕對值信息的app的節點來描點推算所有app的使用量絕對值。比如,如果知道了排名第5名的App的DAU是500萬,排名第10名的App是200萬,那么可以推測6-9名的App的DAU都在200-500萬之間。擁有的節點信息越多,描述真個市場的能力就越強。
在中國,Talkingdata,信諾數據,以及其他若干家擁有樣本數據的公司,例如從事移動測試的Testin,以及老牌廠商友盟都定期發布移動應用市場報告。因為商業模式選擇的原因,他們并不一定提供媒體評估服務。
在這個領域,每一家的數據來源都不可能覆蓋整個市場全貌,因為采樣來源限制的原因,每一家甚至都不可能提供所有的指標。但整個評估方法和數據來源模式已經比PC互聯網時代更加有效和準確,尤其是確定排名的過程,對長尾媒體的覆蓋也更加完整。但是,因為顯而易見的原因,在缺乏絕對值控制點的鄰近位置上,App的絕對值指標推算會誤差較大。我個人猜測今日頭條聲稱的偏差就來自這類原因。
艾瑞的mUserTracker的數據來源大體也是這么個模式,至少我知道Talkingdata本身就是艾瑞的數據來源之一。
媒體評估業之所以經常被詬病,主要的原因并不是提供不了準確的數據,如果通過第三方就能夠輕而易舉獲得完全符合事實的評估數據,那么這個行業也就不必要存在了。就像每個人的身高體重測量是一個完全沒有技術含量和門檻的事情,自然也就不會需要什么第三方來提供這個服務。
艾瑞的數據產品面向那么多付費客戶要提供連續服務,斷然是不可能隨意片段修改的。真正的爭議在于評估商在提供加碼監測的過程中到底是不是應該是一種有償的服務?如果是,是不是應該和媒體受眾量直接相關。我個人覺得這個事情在移動互聯網時代有待商榷。因為這里有一個顯然的差異在于App在進行加碼審計的過程同時,也是優化數據產品的過程。例如某App審計結果的500萬DAU其實也指示了排名前后的App的DAU范疇,評估商理應在商業回報上考慮這一點,這也許是評估業自我超越的一個機會。