IP屬地:陜西
淺析DeepSeek多頭潛在注意力機制(MLA) 背景:DeepSeek在無損模型效果的同時大幅降低了大模型的訓練以及推理成本,引起業界廣范關注...
提前給大家預告一篇position bias在建模中的處理方式。
開篇之前,我們首先回顧一下背景:part1 在19年已經寫了,最近打開博客發現part2遲遲沒有寫,時隔這么久,臨近十一終于有時間把第二部分完成...
背景:大家在使用tensorflow 訓練model 的時候,如何更好更快的加載數據,tensorflow官方給出了tf record這種格式,...
背景:在個性化推薦系統中,新用戶的快速興趣探索,是推薦系統能否真正抓住用戶的真正喜好,并達到留存的關鍵因素。如何快速興趣探索,首先要選取一種合適...
上文主要介紹了deep walk原論文是如何從原始語料獲得graph,以及如何從graph,隨機游走出item序列。繼而通過word2vec或得...
背景:眾所周知,在個性化推薦系統,后端算法核心邏輯,分為召回,排序以及strategy調整,用戶訪問系統時,受限于排序模型的耗時等因素,不可能將...
背景:上文講到離線model已經訓練好了。接下來就是最重要的部分,在線應用部分拿效果。在個性化推薦算法recall的整體架構中,有比較簡單的寫k...
part2背景:眾所周知,數據是最終效果的天花板,而不同model在同一份數據上只不過是代表了不同逼近天花板的程度,有鑒于此,本小節也分兩大塊展...