推薦系統(tǒng)遇上深度學習(六十八)-建模多任務學習中任務相關(guān)性的模型MMoE

本文介紹的論文題目是:《Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts》
論文下載地址為:https://dl.acm.org/citation.cfm?id=3220007

多任務學習最近越來越受歡迎,咱們前面也介紹過幾篇阿里多任務學習的模型,不過多任務學習的效果受不同任務之間的相關(guān)性影響較大,因此本文基于Mixture-of-Experts (MoE)模型,提出了一種顯式建模任務相關(guān)性的模型Multi-gate Mixture-of-Experts (MMoE) ,一起來學習一下。

1、背景

近年來,深度神經(jīng)網(wǎng)絡的應用越來越廣,如推薦系統(tǒng)。推薦系統(tǒng)通常需要同時優(yōu)化多個目標,如電影推薦中不僅需要預測用戶是否會購買,還需要預測用戶對于電影的評分,在比如電商領(lǐng)域同時需要預測物品的點擊率CTR和轉(zhuǎn)化率CVR。因此,多任務學習模型成為研究領(lǐng)域的一大熱點。

許多多任務學習模型取得了不錯的效果,但是實踐中多任務學習模型并不總比單任務模型效果更突出。這主要是因為不同任務之間的相關(guān)性低(如數(shù)據(jù)的分布不同等等)導致的。

是不是真的如上述所說,任務之間的相關(guān)性會影響多任務學習的效果呢,咱們先在第二節(jié)中做一個實驗。

2、任務相關(guān)性實驗

2.1 一般的多任務學習模型框架

一般的多任務學習模型框架如下:

對于不同的任務,底層的參數(shù)和網(wǎng)絡結(jié)構(gòu)是共享的,然后上層經(jīng)過不同的神經(jīng)網(wǎng)絡得到對應任務的輸出。 假設底層輸出是f(x),那么第k個任務的輸出yk為:

其中hk是第k個任務上層神經(jīng)網(wǎng)絡的參數(shù)。

2.2 任務相關(guān)性實驗

接下來,我們通過一個實驗來探討任務相關(guān)性和多任務學習效果的關(guān)系。

假設模型中包含兩個回歸任務,而數(shù)據(jù)通過采樣生成,并且規(guī)定輸入相同,輸出label不同。那么任務的相關(guān)性就使用label之間的皮爾遜相關(guān)系數(shù)來表示,相關(guān)系數(shù)越大,表示任務之間越相關(guān),數(shù)據(jù)生成的過程如下:

首先,生成了兩個垂直的單位向量u1和u2,并根據(jù)兩個單位向量生成了模型的系數(shù)w1和w2,如上圖中的第二步。w1和w2之間的cosine距離即為p,大伙可以根據(jù)cosine的計算公式得到。

隨后基于正態(tài)分布的到輸入數(shù)據(jù)x,而y根據(jù)下面的兩個式子的到:

注意,這里x和y之間并非線性的關(guān)系,因為模型的第二步是多個sin函數(shù),因此label之間的皮爾遜相關(guān)系數(shù)和參數(shù)w1和w2之間的cosine距離并不相等,但是呈現(xiàn)出一個正相關(guān)的關(guān)系,如下圖:

因此,本文中使用參數(shù)的cosine距離來近似表示任務之間的相關(guān)性。

2.3 實驗結(jié)果

基于上述數(shù)據(jù)生成過程以及任務相關(guān)性的表示方法,分別測試任務相關(guān)性在0.5、0.9和1時的多任務學習模型的效果,如下圖:

可以看到的是,隨著任務相關(guān)性的提升,模型的loss越小,效果越好,從而印證了前面的猜想。

3、MMoE模型

3.1 MoE模型

先來看一下Mixture-of-Experts (MoE)模型(文中后面稱作 One-gate Mixture-of-Experts (OMoE)),如下圖所示:

可以看到,相較于一般的多任務學習框架,共享的底層分為了多個expert,同時設置了一個Gate,使不同的數(shù)據(jù)可以多樣化的使用共享層。此時共享層的輸出可以表示為:

其中fi代表第i個expert的輸出,gi代表第第i個expert對應的權(quán)重,是基于輸入數(shù)據(jù)得到的,計算公式為g(x) = softmax(Wgx)。

3.2 MMoE模型

相較于MoE模型,Multi-gate Mixture-of-Experts (MMoE)模型為每一個task設置了一個gate,使不同的任務和不同的數(shù)據(jù)可以多樣化的使用共享層,模型結(jié)構(gòu)如下:

此時每個任務的共享層的輸出不同,第k個任務的共享層輸出計算公式如下:

隨后每個任務對應的共享層輸出,經(jīng)過多層全連接神經(jīng)網(wǎng)絡得到每個任務的輸出:

從直觀上考慮,如果兩個任務并不十分相關(guān),那么經(jīng)過Gate之后,二者得到的權(quán)重系數(shù)會差別比較大,從而可以利用部分expert網(wǎng)絡輸出的信息,近似于多個單任務學習模型。如果兩個任務緊密相關(guān),那么經(jīng)過Gate得到的權(quán)重分布應該相差不多,類似于一般的多任務學習框架。

4、實驗結(jié)果

先回顧上面介紹的三種多任務學習的架構(gòu):

實驗分為三部分:人工合成數(shù)據(jù)集(即本文第二部分所介紹的人工生成的數(shù)據(jù)集)、UCI census-income dataset和Large-scale Content Recommendation

4.1 人工合成數(shù)據(jù)集-實驗結(jié)果

4.2 UCI census-income dataset-實驗結(jié)果

這塊文中介紹了幾種多任務學習的模式,這里就不過多介紹了。

4.3 Large-scale Content Recommendation-實驗結(jié)果

這篇論文的介紹就到這里啦,這一篇是在我閱讀youtube多任務學習論文中發(fā)現(xiàn)的,所以下一篇會介紹youtube今年的論文《Recommending What Video to Watch Next: A Multitask Ranking System》,期待一下吧。

可能我的理解還有不到位的地方,歡迎大家一起討論對這篇文章的理解~

關(guān)注小編的公眾號“小小挖掘機”,后臺回復“進群”,一起來交流學習推薦系統(tǒng)吧!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,739評論 6 534
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,634評論 3 419
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,653評論 0 377
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,063評論 1 314
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,835評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,235評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,315評論 3 442
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,459評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,000評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 40,819評論 3 355
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,004評論 1 370
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,560評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 44,257評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,676評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,937評論 1 288
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,717評論 3 393
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,003評論 2 374

推薦閱讀更多精彩內(nèi)容