《現代推薦算法》神經協同過濾之GMF算法

關注公眾號 長歌大腿,發送“機器學習”關鍵字,可獲取包含機器學習(包含深度學習),統計概率,優化算法等系列文本與視頻經典資料,如《ESL》《PRML》《MLAPP》等。
《現代推薦算法》神經協同過濾之GMF算法

神經協同過濾簡介

前面的文章介紹了協同過濾算法,主要分為基于用戶的協同過濾算法與基于物品的協同過濾算法,同時指出,矩陣分解也屬于廣義的協同過濾算法。
那么之前的文章介紹的SVD,SVD++等等矩陣分解算法都是在傳統矩陣分解上面進行的改進。隨著神經網絡的興起,神經網絡應用到協同過濾算法上,有研究者(何教授)提出了神經協同過濾算法,并將其分為GMF,MLP,NeuMF三種具體的網絡結構。我們在本篇文章中介紹其中的GMF模型。

廣義矩陣分解算法(GMF)

GMF是廣義矩陣分解的簡寫(generalized matrix factorization model) ,它模型具體描述為用戶隱空間向量與物品隱空間向量的點積,然后進行加權和輸出。如果我們令用戶隱空間向量p_{u}P^{T}v_{u}^{U} 物品隱空間向量 q_{i}Q^{T}v_{i}^{I}. GMF 由下面這個數學式給出
\hat{y_{u,i}}=a_{out}(h^{T}(p_{u}\odot q_{i}))
在公式里 \odot 是點積, a_{out}h 是輸出層激活函數與加權和輸出的權重。在GMF模型中,模型用sigmoid 方程 \sigma(x) = 1/(1+e^{-x}) 作為激活函數 a_{out} ,通過訓練數據優化對數損失(交叉熵)學習權重 h .

代碼實現

我們采用pytorch計算框架來示例GMF的網絡結構部分。GMF網絡類如下所示,

class GMF(nn.Module):
    def __init__(self,user_num, item_num, factor_num):
        super(GMF,self).__init__()
        self.embed_user_GMF = nn.Embedding(user_num,factor_num)
        self.embed_item_GMF = nn.Embedding(item_num,factor_num)
        self.predict_layer = nn.Linear(factor_num,1)
        self._init_weight_()

    def _init_weight_(self):
        nn.init.normal_(self.embed_item_GMF.weight,std=0.01)
        nn.init.normal_(self.embed_user_GMF.weight,std=0.01)

    def forward(self,user,item):
        embed_user_GMF = self.embed_user_GMF(user)
        embed_item_GMF = self.embed_item_GMF(item)
        output_GMF = embed_user_GMF*embed_item_GMF
        prediction = self.predict_layer(output_GMF)
        return prediction.view(-1)

先根據嵌入層維度等信息初始化網絡,同時初始化權重為方差為0.01的正態分布(非必要)。
網絡傳播層如代碼所示,輸入為用戶與物品的ID,然后經過嵌入編碼,再進行點積,最后通過一個全連接線性層加權輸出。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容