推薦系統遇上深度學習(一三八)-[阿里]廣告點擊率預估中的外部性建模

今天給大家分享的是阿里在KDD2022上中稿的論文。過往的廣告點擊率預估主要考慮廣告本身的特征,而忽略了相鄰展示的其他商家對其的影響,因此本文的出發點主要是廣告點擊率預估中的外部性建模。同時,針對點擊率預估時由于廣告展示位置不確定所帶來的外部性多樣和不確定的問題,設計了針對性的解決方案,一起來看一下。

1、背景

阿里搜索廣告場景下,自然結果和廣告結果混合展示。兩部分展示的item分別由自然系統(organic search system,OS)和廣告系統(search advertising system,AS)確定。OS的主要目標是優化用戶體驗,而AS的主要目標則是最大化平臺收入以及商家ROI。在阿里搜索場景下,自然排序結果首先由OS給出,然后AS再將廣告結果插入到固定的槽位中。

因此,我們可以得到兩點信息,一方面,OS和AS是串行調用的,AS進行預估時,是可以拿到準確的自然結果排序信息,另一方面,廣告是固定位插入的,而非像之前介紹的美團的CrossDQN是浮動位插入的。廣告系統AS整體架構如下圖所示:

可以看到,AS包含三個階段,分別是召回、預估和拍賣,本文重點關注預估部分。過往的點擊率預估模型,大都只關注目標item本身的特征,而忽略了其他同時展示的item對其的影響,這種影響我們將其稱為外部性(Externalities)。同時,即使是相同的相鄰展示商品,由于不同用戶關注的側重點不同,這種外部性影響也是不同的,例如價格之間的明顯差距更容易引起價格敏感用戶的關注。因此,本文研究的重點是CTR預估中個性化的外部性影響建模。

然而,外部性建模面臨以下兩方面的挑戰:
1)一方面,目標的廣告可能會被插入到任一廣告位置,插入到不同位置時,其相鄰商品是不同的,即外部性是多樣的。直接預估所有的可能情況對于系統的負載有巨大的影響,因此需要一種更高效的方式去建模;
2)另一方面,盡管自然結果的排序可以提前得知,但是廣告的排序是未確定的,如果忽略廣告結果,會導致外部性影響考慮不完整,因此需要對廣告最終的展示順序做一定的模擬用于計算更準確的外部性信息。

為了解決以上兩方面的挑戰,論文在CTR預估模型中,設計了外部性計算模塊,稱為EXternality TRansformer(簡稱EXTR),一起來看一下。

2、EXTR介紹

EXTR的整體結構如下圖所示:

可以看到,EXTR主要包含兩部分,上下文交互模塊Context Interaction Module和外部性提取模塊Externality Extraction Module。其中,上下文交互模塊主要用來對外部item的相互影響進行提取,外部性抽取模塊則用于同時建模廣告在不同位置時的外部性影響。

2.1 上下文交互模塊

上下文交互模塊主要用來對外部item的相互影響進行提取,外部item包括所有的自然結果以及除待預估的目標廣告以外其他所有的廣告結果。考慮到用戶自上往下的順序瀏覽習慣,建模順序信息是必要的。因此論文采用Transformer的結構,同時輸入信息中包括商家本身的信息以及ranking encoding。

由于自然結果的順序已知,其ranking encoding也是確定的,但廣告結果的順序并不知道,因此論文進一步提出了Potential Allocation Generator (PAG)來對目標廣告以外的其他廣告的ranking encodings進行預估,其結構如下:

從圖中可以看出,廣告的ranking encoding是自然結果ranking encodings的加權和:

權重通過如下公式計算得出:

其中,N是自然結果的數量。為了提升權重計算的準確度,論文引入了如下的權重監督信號:

其中k是真實展示結果中,廣告j前面的自然結果的數量,如果廣告j實際沒有曝光,則K=N+1。可以看到,如果自然結果的順序和廣告j越靠近,則監督信號的值越大,越遠則值越小,并通過KL散度來計算對應的輔助損失:

2.2 外部性提取模塊

外部性提取模塊目標是同時建模目標廣告在不同的廣告插入位置時的外部性情況,同樣使用Transformer進行建模,但使用的是target-attention的方式。結構如下圖所示:

為了目標廣告建模所有位置下的外部性情況,transformer的Q為目標廣告特征向量和slot encoding的拼接,K和V則是上下文交互模塊對應的輸出:

而在Attention權重計算上,引入用戶特征,充分考慮用戶對于不同屬性的偏好程度:

經過外部性提取模塊,便得到目標廣告插入到不同槽位時對應的外部性信息。最后經過ctr預估部分,得到每個位置下的點擊率預估值。

3、實驗結果

好了,最后來看一下實驗部分,EXTR取得了比所有BaseLine更好的效果(但沒有對比美團的深度位置交互網絡DPIN):

4、總結

外部性建模也逐漸吸引了越來越多的關注,如阿里的RACP,京東的CIM,美團的DPIN(這里的DPIN指Deep Page-level Interest Network,并非上文說的深度位置建模的DPIN)等。在精排階段,由于無法獲取準確的上下文信息,往往需要對外部性進行一定的模擬,本文的方法也是對上下文模擬提供了一定的借鑒思路。但論文的場景過于理想化了,如自然結果順序已知,廣告位按照固定位插入等等。一方面,出于耗時的考慮,自然結果和廣告結果的處理往往是并行的兩套系統,串行對于耗時的要求更為嚴格,另一方面固定位廣告插入并非全局最優,浮動位的方案成為當前研究的主要趨勢。因此在實際應用中,可以借鑒本文設計更加適合自身的解決方案。

好了,本文就介紹到這里,感興趣的同學可以閱讀原文~

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容