一切看命?
看命的冷啟動
如前所述,一篇內(nèi)容在推薦初期的冷啟動階段,更多的是基于Item-Based的特征探索。
如果內(nèi)容本身的特征不足,就極容易造成冷啟動的偏差,影響后續(xù)的推薦效果:
- 文章由于有更豐富的文本資源,通常冷啟動的準(zhǔn)確性會好很多。
- 對于視頻 和 短內(nèi)容來說,由于文本信息過短,則往往容易出坑。
先來看幾個例子:
- 視頻標(biāo)題:普京曾經(jīng)實習(xí)的單位,最牛逼的國家狗仔隊是如何工作的。
- 短內(nèi)容:感恩一起戰(zhàn)斗的日子,感謝我的戰(zhàn)友
- 視頻標(biāo)題:堪比電影中出現(xiàn)的場景:死神來了!
第一個標(biāo)題,拆分開有三部分【普京】、【單位、實習(xí)、工作】、【狗仔隊】
第二個短內(nèi)容,從文本特征上來看,基本上命中【戰(zhàn)斗、戰(zhàn)友】
第三個標(biāo)題,只從標(biāo)題上來看基本上命中電影【死神來了】
但事實上,第二個短內(nèi)容的場景是,某個藝人在戲劇殺青后的感言。
第三個視頻的內(nèi)容描述的是一場車禍,內(nèi)容如下:
堪比電影中出現(xiàn)的場景:死神來了!
上述三個內(nèi)容,除了第一個內(nèi)容命中了“普京”,使得其冷啟動不至于太偏之外,其余的兩篇內(nèi)容基本上死在了冷啟動階段。
先天不足病,后天不足命。
除了特征缺失導(dǎo)致的推薦問題外,還存在一類生不逢時的問題。如在王寶強事件時,基本上所有的娛樂新聞都被這個熱點事件蓋掉了。如果有新媒體創(chuàng)作的朋友們,應(yīng)該都對避熱點、蹭熱點深有同感。
更微觀的粒度上,在一次刷新當(dāng)中,露出位置、上下文關(guān)系等都會對文章的冷啟動推薦構(gòu)成影響。
冷啟動的改命?
從推薦系統(tǒng)全局來看,冷啟動作為一種探索行為,客觀上對于系統(tǒng)而言是有損的。優(yōu)化冷啟動,不僅是改進單篇內(nèi)容推薦效果的訴求,同時也是優(yōu)化整體系統(tǒng)的訴求。
五行缺水的人,起名或許會包含“淼”,以彌補“命格的不全”。對于內(nèi)容推薦來說亦如是,缺什么、補什么。
- Item信息層面的補充:
- 從展示樣式來說:在“多圖+標(biāo)題”的展示樣式下,一篇文章如果沒有足夠的封圖會影響其冷啟動點擊率,故從引導(dǎo)作者創(chuàng)作的角度來看,應(yīng)當(dāng)建議其做更好的傳播性的設(shè)置。
- 從文本信息量來說:對于視頻,應(yīng)當(dāng)引導(dǎo)作者補充摘要信息、標(biāo)簽信息,讓內(nèi)容更好的被機器理解。(有些公司是通過組織人工打標(biāo)簽、評級、納入結(jié)構(gòu)化信息來解決這一問題的)
- User反饋層面的補充:
- 更好的理解不同內(nèi)容的消費特點,對于不同的載體給出略有差異性的產(chǎn)品設(shè)計。進一步,對用戶不同行為給出不同的主觀價值評估建議,從而提升冷啟動的點擊價值。