今日頭條,大家公認的一個超級大流量平臺,其最大的特點就是文章的智能推薦系統。
但是,有些人在今日頭條文章動輒幾十萬、幾百萬,甚至上千萬閱讀,但有些則只是幾十、幾百的流量。
除了內容本身的質量以及賬號區別之外,最大的關鍵就在于其算法推薦規則。搞懂今日頭條文章推薦規則,是在這里進行精細化運營的核心關鍵。
那么,今日頭條海量文章推薦的機制是怎么樣呢?為什么有的文章展現量幾百萬,有的卻只有幾十幾百?對于文章的推薦機制我們又能做些什么?
首先在說文章推薦規則之前,另一個機制大家一定要先了解,那就是今日頭條的消重機制。
你在頭條號發布的內容,在通過審核和進入推薦系統之間,還有一道難關,那就是下面要說的消重機制。
基本上,文章被消重是頭條號所發布內容無推薦量的最常見的原因。
1想要被推薦,先了解消重機制
1)什么是消重?
我們都知道,在互聯網上,同樣的文章、圖片、視頻往往會被很多其他媒體轉載或復制。
如果我們在百度搜索一篇內容,經常會得到多個網址。所以,我們一般需要自己篩選和判斷,哪個網址更權威,更有價值,再點擊去訪問就可以了。
但是今日頭條不一樣,它是基于算法推薦給用戶的。所以一定要保證不能連續給用戶推薦了幾篇相似的內容,否者用戶體驗會非常差:怎么老是給我推薦一樣的內容,什么鬼系統!
所以,今日頭條在推薦你的文章之前,必須確定這篇內容:
● 在系統里是否存在相同或者高度相似的內容?
● 如果存在,那么這篇內容的來源是否是最權威、最有價值、是否最有可能是原創來源?
那么,消重就是指對重復、相似、相關的文章進行分類和比對,使其不會同時或重復出現在用戶信息流中的過程。
今日頭條首先會通過消重機制來決定同樣主題或內容的文章是否有機會被推薦給更多用戶。
2)頭條號內容消重的關鍵項
那如何判斷兩個內容是否相同呢?
如果讓人來判斷,可能就要逐字逐句地把文章讀完才能判斷得出來。通過計算機這樣去判斷當然也是可以的,不過,當每天需要處理的內容達到十多萬篇次的時候,這么做即使對于計算機來也太麻煩了。
今日頭條的做法是,通過系統的計算,一篇文章的文本、標題、圖片等都是可以轉換成一串數字代碼,也就是信息指紋。這就像我們每個人的身份證,如果兩個人的身份證號碼一模一樣,那么就可以肯定這是兩個一樣的人。
而文字信息的「身份證」也能起到類似的作用,對于圖片、視頻等信息形式,原理也是類似的。這種算法模型這里就不多說了,重點來看影響消重的關鍵項。
● 來源頭條號是否開通「原創」標記;
● 發布時間(首發很重要);
● 來源的權威性和在網絡上被引用的次數。
除了內容消重的規則外,頭條號平臺上實際上還存在這一些針對內容之外的消重規則:
● 標題和預覽圖片的消重。
這個原理與內容消重相似,只不過是只比較標題以及預覽圖片的「信息指紋」。
之所以要對具有相同的標題或者預覽圖片的內容進行消重(哪怕它們的內容并不相同),是因為,假如用戶沒有點擊內容詳情頁,他是不知道內容寫的什么的。
那么,光看標題和預覽圖就是系統把兩篇一樣的內容重復推薦給了自己,可想而知這樣的瀏覽體驗是很糟糕的。
況且,很少有人愿意連續點擊幾篇看上去一模一樣的內容,因此這樣的推薦也很少起效果。
● 針對相似主題的消重。
你肯定對這樣的景象不陌生:每當有某個社會熱點事件或者話題出現的時候,媒體、自媒體、KOL們一擁而上,競相報道事件細節或者發表觀點,讓你的微博、朋友圈被有關這件事的種種內容“刷屏”。
但是,對于用戶來說,需要的其實并不是反復看到相同的信息,如果有足夠優質的報道或者觀點的話,其實看有限的幾條就夠了。
相似主題的消重其實和內容的消重其實原理是一樣的,是對文章中全部的關鍵詞(也就是我們常說的標簽)進行統計并計算信息指紋,當然也可以對其中與話題相關的關鍵詞進行統計分析。
一旦系統發現了可能對某篇內容感興趣的用戶,那么系統會自動把具有同樣「信息指紋」的內容或話題中,經過挑選最優的一篇推薦到用戶的信息流。
剩下具有相同「信息指紋」的內容,就幾乎不可能獲得推薦了。
這里,我重點說一下相似主題消重,這個與我們是最最最相關的。因為頭條要追熱點,基本是大家公認的事實。
3)追熱點小心被消重
在頭條號追熱點話題的時候,一定要謹慎追逐。
因為有這個相似主題消重,那具有相同「信息指紋」的話題或熱點,幾乎不可能獲得推薦了。這就是為什么很多時候我們的熱點文章在頭條號會推薦慘淡。
一個熱點再熱,用戶的興趣也是有限的,特別是如果你的熱點角度沒什么區別,平臺已經推薦過相似內容了,那系統是不愿意再推薦的,因為用戶他已經懂了,再推薦就是打擾了!
所以說你追熱點的角度一定要差異化,寫熱點文章有很多切入點,你可以把一個熱點進行拆分關鍵詞,每一個都可以是一個很好的切入口,這就是所謂的“同主題異角度”。
與此同時,你的標題也要明顯的差異化,因為這個熱點標簽的提取統計,主要來自于標題,而后才是內容。并且,在一個大熱點下,用戶想知關于熱點的各個方面,所以標題角度也要明顯。
如果不能確定自己創作的角度足夠獨特,及自己的內容足夠優質,那么就不要隨意地追逐熱點,免得做了無用功。
2今日頭條文章推薦規則解析
我們知道,文章的閱讀量很大程度上取決于系統的推薦量,那么一篇文章的推薦量,是由什么因素決定的呢?
之前,頭條官方給過一些標準,即影響文章推薦的 8 個因素是:
1)點擊率+讀完率:點擊標題并讀完文章的人越多,推薦越高;
2)分類明確:文章興趣點越明確,推薦越高;
3)文題一致:做恰如其分的標題黨;
4)內容質量:優質內容才是根本;
5)賬號定位明確:文章題材隨意寬泛的賬號,得到推薦的概率更低;
6)互動數、訂閱數:讀者越活躍,推薦越多;
7)站外熱度:在互聯網上關注度高的話題,推薦越多;
8)發文頻率:經常發文,保持活躍很重要。
不過這些都是一些表象的東西,這里更系統和深入的說一下,只有知道本質了我們才能更好的做好這些。
1)系統是怎樣理解你的文章的?
今日頭條的文章識別系統會對文章進行特征識別,從而判斷文章講的是什么類型和領域的內容。特征識別的維度有很多,在這里我們重點解釋「關鍵詞」。
系統會根據文章中出現的頻率,提取出一些詞語作為關鍵詞,關鍵詞的判定原則有二:
詞頻高:如一篇體育類文章內容關于某場足球比賽,那么文章可能會出現的高頻詞就包括球員名字、足球術語或技巧等,如「C 羅」、「射門」、「突破」。
同類文章中出現次數少:作者撰文時常用到的虛詞、轉折詞等出現頻率也很高,但它們不會作為關鍵詞被提取出來,因為這些詞在文章中是普遍存在的。
系統判定出一篇文章的關鍵詞后,會將這些關鍵詞與文章分類模型進行比對,命中哪些分類詞庫關鍵詞的比例大,文章即被打上該分類的標簽。
如,一篇文章排名靠前的關鍵詞為「C 羅」、「射門」、「西甲」、「馬德里」,那么該篇文章可能會被打上「足球」、「國際足球」、「西班牙」等標簽,完成對文章的初步認知。
而除文章正文關鍵詞識別外,系統還會對標題進行關鍵詞的識別和分類比對。因此,在標題中露出具代表性的實體詞非常重要。
2)你的文章會被推薦給哪些用戶?
每個人的閱讀興趣都是大不相同的,個性化推薦機制要做的事情就是——讓每位用戶看到可能感興趣的內容。
這種精準推薦,是建立在機器對每位用戶都有充分認知的前提下的。在系統里面,每位用戶實際是由大量數據構成的,用戶的閱讀興趣就藏在這些數據中:
● 用戶的基本信息
性別、年齡、所處地理位置(城市或地區);還有使用機型、授權賬戶(如微博、微信等)、手機上經常使用的其他 App 等。
● 用戶主動訂閱或喜歡的內容
訂閱帳號;訂閱頻道;關注的話題。
● 機器通過計算得出的用戶閱讀興趣
用戶閱讀過的文章分類和關鍵詞;相似類型用戶還喜歡閱讀的其他文章類型;用戶在今日頭條客戶端主動標記「不感興趣」的實體詞或文章類型。
根據以上數據,系統對用戶的閱讀興趣就能有個基本的判斷。然后通過對數據的處理,每位用戶將被系統打上各種標簽。
如一個用戶閱讀的文章中關鍵詞排名靠前的是:C羅、皇家馬德里、歐洲杯、小米、魅族、蘋果。
那么,這位用戶可能被打上「足球、「皇馬」、「科技」、「手機」、「米粉」等標簽。不同的用戶會被打上不同的標簽。
最后,當一篇帶有「C 羅」、「足球」標簽的文章在進行推薦時,系統會將其自動匹配給帶有「C 羅」或「足球」標簽的用戶,這便是推薦引擎的個性化推薦。
當然,系統推薦的實際情況會遠比這復雜得多,但推薦的基本原理便是:
系統先通過數據來來給內容和用戶打上各種標簽,然后通過算法將內容標簽跟用戶標簽進行匹配,接著根據第一批推薦情況,決定后續的推薦量,這個下面說。
3)你的文章是如何被推薦的?
為讓受歡迎的內容被更多用戶看到,不受歡迎的內容不占用過多推薦資源。頭條號文章在推薦時,會分批次推薦給對其感興趣的用戶。
如何理解分批次推薦呢?
文章首先會被推薦給一批對其最可能感興趣的用戶(這批用戶的閱讀標簽與文章標簽重合度最高),這批用戶產生的閱讀數據,將對文章下一次的推薦起到決定性作用。
數據包括點擊率、收藏數、評論數、轉發數、讀完率,頁面停留時間等,其中,點擊率占的權重最高。
這很好理解,能吸引眾多用戶點擊的文章自然會被認為更可能是好文章。
文章的首次推薦,如果點擊率低,系統認為文章不適合推薦給更多的用戶,會減少二次推薦的推薦量;如果點擊率高,系統則認為文章受用戶喜歡,將進一步增加推薦量。
以此類推,文章新一次的推薦量都以上一次推薦的點擊率為依據。此外,文章過了時效期后,推薦量將明顯衰減,時效期節點通常為24小時、72小時和一周。
因為這種擴大推薦的機制,你想獲得更多的閱讀量,就必須努力把各維度閱讀數據(點擊率、用戶閱讀時間、收藏數、評論數、讀完率等)維持在高位水平。這也就上面官方的一些標準。
其中,至關重要的當然是點擊率,也因此,標題和封面圖的重要性便不言而喻。這也是今天注意力稀缺時代,文章獲得好的傳播的關鍵要素。
雖然如此,但除了點擊率,有一個特別重要的點總是被大家忽視,就是:
文章所對應的標簽,直接決定了匹配的相對應標簽的用戶量。有的標簽本身就對應很大體量的用戶,而有的標簽對應人群很小,就算點擊率再高,天花板也很低。
這就是為什么很多專業性文章閱讀不高,而情感雞湯、娛樂八卦、社會新聞的推薦一般會很高。這也是為什么大家都會去追熱點,因為熱點標題對應的用戶群體非常大。
所以說,我們選題,包括文章標題以及內容里面的關鍵詞使用,一定要基于用戶量大的標簽,這樣可以獲得更多的推薦量。
之前今日頭條官方就發過最受歡迎的一些標簽,這些都是一級標簽,你有沒有經常使用?
而且,今日頭條還專門推出了熱詞分析功能,幫助大家找到不錯的標簽。利用熱詞分析功能可以大大增加系統推薦量,提高文章的閱讀量。