1 召回算法和業界最佳實踐進階
各種Embedding方法
各種k-means方法kdtree和kball樹
2 用戶建模(召回、排序都會用到)
預測用戶下一個瀏覽或者購買的類目,性別預測,年齡預測等。
3 用戶特征和Item特征的常用方法
Wrappers:一個一個試
Embedded:加入正則
Filters:feature-label相關性
- 連續型特征離散二值化
離散化:等寬分桶(按值分),均勻分桶(按樣本數分),k-means
二值化:要么該特征one-hot,或者three-hot - 過程
特征預排序通過信息增益IG,添加特征,細篩選特征 - 泛化和自解釋
泛化是歷史記錄沒有的
自解釋是有歷史記錄的 - 四種類型
數值
類別
時間
文本
4 主流技術方向思考及相應model的改進方案
講了一遍冷啟動
講了這三個算法
推薦流程概念 33:40
- 核心指標
GMV:一定時間內的商品成交總額
QPS
RT:系統響應 < 0.1s
優化排序:讓模型參數減少,層數減少,但是效果會降低,是tradeoff
推薦和搜索有什么關系?
1.推薦做的好,搜索的流量下降
2.搜索這個工具是必要的
推薦做的好 -> 用戶粘性,用戶留存 -> DAU GMV
(短視頻/電影)推薦系統和電商推薦系統相比,區別是什么?
視頻推薦多看重時長,電商推薦看是否購買
量級的不同,存儲方式,計算量,算法都不同 - 核心業務
首猜:首頁猜你喜歡
詳情頁(相關推薦,播放頁,關燈頁)