7M推薦系統 - S2 內部推薦和排序架構

1 召回算法和業界最佳實踐進階

各種Embedding方法
各種k-means方法kdtree和kball樹

2 用戶建模(召回、排序都會用到)

預測用戶下一個瀏覽或者購買的類目,性別預測,年齡預測等。

3 用戶特征和Item特征的常用方法

Wrappers:一個一個試
Embedded:加入正則
Filters:feature-label相關性

  • 連續型特征離散二值化
    離散化:等寬分桶(按值分),均勻分桶(按樣本數分),k-means
    二值化:要么該特征one-hot,或者three-hot
  • 過程
    特征預排序通過信息增益IG,添加特征,細篩選特征
  • 泛化和自解釋
    泛化是歷史記錄沒有的
    自解釋是有歷史記錄的
  • 四種類型
    數值
    類別
    時間
    文本

4 主流技術方向思考及相應model的改進方案

講了一遍冷啟動

講了這三個算法

推薦流程概念 33:40

  • 核心指標
    GMV:一定時間內的商品成交總額
    QPS
    RT:系統響應 < 0.1s
    優化排序:讓模型參數減少,層數減少,但是效果會降低,是tradeoff
    推薦和搜索有什么關系?
    1.推薦做的好,搜索的流量下降
    2.搜索這個工具是必要的
    推薦做的好 -> 用戶粘性,用戶留存 -> DAU GMV
    (短視頻/電影)推薦系統和電商推薦系統相比,區別是什么?
    視頻推薦多看重時長,電商推薦看是否購買
    量級的不同,存儲方式,計算量,算法都不同
  • 核心業務
    首猜:首頁猜你喜歡
    詳情頁(相關推薦,播放頁,關燈頁)
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 更多京東618技術揭秘請見《決戰618:探秘京東技術取勝之道》一書。 在電商領域,推薦的價值在于挖掘用戶潛在購買需...
    碼農小光閱讀 373評論 0 2
  • 姓名:米芃 學號:16040520018 [嵌牛導讀]在電商領域,推薦的價值在于挖掘用戶潛在購買需求,縮短用戶到商...
    南城城南閱讀 2,821評論 0 10
  • 百花開,紅塵醉,風月迷;夢初醒,花已落,伊人淚,紅顏瘦。春江水,幾多愁?一朝相逢,一夕離散,再回首,花非花,夢非夢...
    牟若水閱讀 374評論 4 8
  • 戰斗結束,魔戒歡喜的吞噬了六個靈魂,不過還有個靈魂卻消失了。 是那個釘錘武士的。 方華有些奇怪的走到釘錘武...
    龍騎魔將閱讀 432評論 5 0
  • 你有沒有到過色彩對比十分強烈卻帶不來絲毫快樂的地方? 慘白的花束和黯黑的棺木。蒼白的臉色和烏黑的禮服。空白的思緒和...
    達摩倒翁閱讀 314評論 2 1