熱點(diǎn)事件識(shí)別在新聞推薦系統(tǒng)中的應(yīng)用

頭圖

現(xiàn)今流行的熱點(diǎn)事件識(shí)別,其實(shí)更多的關(guān)注如何在海量的內(nèi)容中去發(fā)現(xiàn)一個(gè)熱點(diǎn)事件。這里面既包含了對(duì)于實(shí)體事件的提取,也包含的類似摘要的信息挖掘,再配上用戶行為的反饋。

什么是熱點(diǎn)事件?

熱點(diǎn)事件普遍是指在社會(huì)(或者某些領(lǐng)域)中引起廣泛關(guān)注、參與討論、激起民眾情緒,引發(fā)強(qiáng)烈反響的事件,通俗點(diǎn)說(shuō)就是被很多人熟知且討論的事件。

熱點(diǎn)事件對(duì)于新聞推薦系統(tǒng)的意義?

推薦系統(tǒng)的目的,在于分發(fā)用戶感興趣的新聞。但是熱點(diǎn)是一個(gè)不同于普通新聞的數(shù)據(jù),即使一人并不對(duì)娛樂新聞感興趣,但是當(dāng)馬蓉和王寶強(qiáng)的這種爆炸新聞出現(xiàn)的時(shí)候,他也會(huì)去關(guān)注,去看上一看。一個(gè)是這源于人對(duì)于爆炸性新聞的好奇心,一個(gè)是出于在我們這種世俗社會(huì)中,對(duì)于談資的積累需求。

所以,當(dāng)熱點(diǎn)事件來(lái)臨的時(shí)候,可以降低對(duì)于垂直興趣的追求,熱點(diǎn)本身,就可以看作是一種興趣。

對(duì)熱點(diǎn)內(nèi)容的分發(fā),可以體現(xiàn)一個(gè)推薦系統(tǒng)的媒體屬性,也可以增強(qiáng)推薦的新穎度,防止興趣收斂。

什么是熱點(diǎn)事件識(shí)別?

通俗點(diǎn)說(shuō),就是及時(shí)發(fā)現(xiàn)一個(gè)熱點(diǎn),并能找出或者寫出熱點(diǎn)相關(guān)的文章,并分發(fā)給用戶。

為什么要進(jìn)行熱點(diǎn)事件識(shí)別?

對(duì)熱點(diǎn)的追蹤和敏感度,是反應(yīng)一個(gè)媒體的媒體屬性是否強(qiáng)烈的標(biāo)準(zhǔn)之一。一個(gè)優(yōu)秀的媒體,必然會(huì)對(duì)熱點(diǎn)有足夠的敏感度,能夠及時(shí)的發(fā)現(xiàn)熱點(diǎn),迅速的報(bào)道熱點(diǎn),并對(duì)熱點(diǎn)內(nèi)容提出有價(jià)值的深度跟蹤,以滿足新聞?dòng)脩魧?duì)于熱點(diǎn)的關(guān)注。

所以,在機(jī)器時(shí)代,如何在海量的數(shù)據(jù)中找到熱點(diǎn)事件并及時(shí)推送給用戶也成了一個(gè)很大的挑戰(zhàn)。

如果能夠非常有前瞻性的發(fā)現(xiàn)熱點(diǎn),并及時(shí)推送給用戶,引起用戶的關(guān)注和廣泛的傳播,就能夠把握互聯(lián)網(wǎng)中的大量流量,從而為app帶來(lái)更多的收益。

目前效果較好的熱點(diǎn)事件發(fā)現(xiàn)技術(shù):

1.基于傳播的熱點(diǎn)事件發(fā)現(xiàn)

簡(jiǎn)單來(lái)說(shuō),就是通過(guò)監(jiān)測(cè)信息在大規(guī)模人群中的傳遞情況,假如一個(gè)事件在一個(gè)時(shí)間段內(nèi)迅速的由某些節(jié)點(diǎn)傳遞給了很多的節(jié)點(diǎn),并呈現(xiàn)出指數(shù)級(jí)增長(zhǎng),那么可以發(fā)現(xiàn)到這個(gè)熱點(diǎn)事件。

2.基于搜索的熱點(diǎn)事件發(fā)現(xiàn)

這個(gè)是基于搜索引擎,應(yīng)該也很好理解,在某段時(shí)間內(nèi),有越來(lái)越多的人群去搜索一個(gè)事件,導(dǎo)致該事件的搜索量激增,那也可以發(fā)現(xiàn)這個(gè)事件。

然而,很可惜,上面的兩點(diǎn)我們都做不到。一個(gè)是我們沒有用戶的社交屬性,不具備新聞的傳播路徑,二是我們?nèi)狈τ脩舻闹鲃?dòng)行為,雖然說(shuō)有搜索接口,但是真正去搜索的用戶是非常少量的。所以用上面的方法是不靠譜的。

當(dāng)然,分析上面的本質(zhì),都是源于用戶的反饋,能夠較好的去發(fā)現(xiàn)。我們?cè)?jīng)嘗試使用自己的數(shù)據(jù)去做這樣的嘗試,使用用戶信息去監(jiān)測(cè)有激增行為的新聞,再對(duì)這些新聞進(jìn)行歸類,找到可能的熱點(diǎn),然而這在技術(shù)上有很大的挑戰(zhàn),再一個(gè)是喪失了新聞的時(shí)效特征,尤其對(duì)于熱點(diǎn)來(lái)說(shuō),一分一秒都是要爭(zhēng)取的。這樣的一輪計(jì)算下來(lái),很可能是熱點(diǎn)已經(jīng)傳播的十分廣泛,其實(shí)對(duì)于我們新聞客戶端來(lái)說(shuō),這時(shí)候再發(fā)現(xiàn)熱點(diǎn)已經(jīng)沒有什么價(jià)值,流量都已經(jīng)完成分發(fā)。

我們是如何解決熱點(diǎn)事件問(wèn)題?

1.獲取熱點(diǎn)事件

既然我們不能主動(dòng)的提取熱點(diǎn)事件,那就想辦法去直接獲取熱點(diǎn)事件。第一點(diǎn),就想到了不勞而獲。既然基于搜索或者傳播能夠比較及時(shí)的獲取熱點(diǎn)事件,那我們就發(fā)揚(yáng)一下拿來(lái)主義好了。網(wǎng)上其實(shí)有很多提供這種實(shí)時(shí)熱點(diǎn)事件的地方,比如百度風(fēng)云榜,微博熱搜,搜狗熱搜等等,還有很多,等你自己去發(fā)現(xiàn)把。

  • a.抓取
    定時(shí)去抓取這些詞匯,這個(gè)應(yīng)該不難了,只有非常有限的內(nèi)容,只需要每隔一段事件去獲取一下,跟上次的數(shù)據(jù)做一些對(duì)比,就能很快知道有哪些事件詞或句子。這個(gè)方法簡(jiǎn)單易行,獲取的熱點(diǎn)數(shù)量多,但是可能效果就差一點(diǎn),而且仍然會(huì)有一定的時(shí)延。
  • b.運(yùn)營(yíng)
    需要有新聞敏感度的運(yùn)營(yíng)人員去手工添加,這個(gè)方法獲取的熱點(diǎn)數(shù)目較少,但是延遲幾乎可以忽略。
    這里,也會(huì)為熱點(diǎn)事件構(gòu)造一些屬性,比如熱點(diǎn)等級(jí),熱點(diǎn)時(shí)效,熱點(diǎn)分類等等。


    微博熱搜榜
百度風(fēng)云榜
搜狗熱搜

2.為文章打上熱點(diǎn)事件標(biāo)簽

有了不斷更新的事件庫(kù),還需要為每個(gè)新聞進(jìn)行標(biāo)注,它屬不屬于熱點(diǎn)新聞,屬于哪個(gè)熱點(diǎn)的新聞。
如果熱點(diǎn)詞過(guò)長(zhǎng),首先需要對(duì)它進(jìn)行分詞。否則就按整個(gè)詞去匹配。這時(shí)候就需要根據(jù)業(yè)務(wù)去構(gòu)建一套匹配的邏輯,或者算法,來(lái)衡量一個(gè)熱點(diǎn)事件與文章的匹配程度。當(dāng)達(dá)到一定的閾值或者某些規(guī)則,就可以認(rèn)為這兩個(gè)是匹配的。

3.構(gòu)建熱點(diǎn)事件模型庫(kù),提升匹配度

由于上述直接獲取的熱點(diǎn)詞有比較大的局限性,比如對(duì)于同一事件,不同的人表達(dá)方法是不一樣的,單純使用一個(gè)熱點(diǎn)詞的泛化能力較弱。所以有了一些對(duì)應(yīng)的文章,那可以著手來(lái)構(gòu)建熱點(diǎn)事件模型了。這里簡(jiǎn)單來(lái)說(shuō)一下,假如有事件A,已知跟A匹配的文章1,2,3。從1,2,3中提取最重要的前n個(gè)關(guān)鍵詞,去匯集成A的模型,可以使用簡(jiǎn)單的連乘來(lái)設(shè)為匹配度,這樣做的目的是去擴(kuò)充相關(guān)內(nèi)容,讓更多接近的文章能夠獲得熱點(diǎn)事件標(biāo)簽。

4.把熱點(diǎn)事件文章分發(fā)給用戶

有了熱點(diǎn)事件,和對(duì)應(yīng)的文章,下一步就是在推薦層面增加對(duì)熱點(diǎn)事件的召回概率。基于之前所說(shuō)的假設(shè),熱點(diǎn)本身就是一個(gè)興趣,那么一個(gè)熱點(diǎn)事件的熱度等級(jí)會(huì)影響分發(fā)面積。同時(shí),熱點(diǎn)事件和分類的交叉特征會(huì)影響一個(gè)用戶是否會(huì)收到熱點(diǎn)的情況。

5.用戶的反饋和用戶畫像調(diào)整

當(dāng)帶有熱點(diǎn)事件的新聞被分發(fā)出去,用戶會(huì)點(diǎn)擊,打開觀看,或者直接掠過(guò)。此時(shí)可以針對(duì)用戶的行為進(jìn)行分析,如果用戶從來(lái)不看熱點(diǎn)新聞,那他的畫像關(guān)于熱點(diǎn)的特征將很低。根據(jù)給他曝光的熱點(diǎn)新聞和他的打開情況,會(huì)有計(jì)算他對(duì)于熱點(diǎn)事件的關(guān)注度。同時(shí),會(huì)記錄他喜歡哪些熱點(diǎn)事件,在后續(xù)的熱點(diǎn)分發(fā)時(shí),還可以去計(jì)算新熱點(diǎn)事件和舊熱點(diǎn)的協(xié)同情況,用以更精準(zhǔn)的分發(fā)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,646評(píng)論 6 533
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,595評(píng)論 3 418
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,560評(píng)論 0 376
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,035評(píng)論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,814評(píng)論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,224評(píng)論 1 324
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,301評(píng)論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,444評(píng)論 0 288
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,988評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,804評(píng)論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,998評(píng)論 1 370
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,544評(píng)論 5 360
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,237評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,665評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,927評(píng)論 1 287
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,706評(píng)論 3 393
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,993評(píng)論 2 374

推薦閱讀更多精彩內(nèi)容