2016-05-24~28:資料+推薦

  1. Scikit Flow介紹和源碼分析

  2. EM算法原理和應(yīng)用

  3. 商品搜索引擎---推薦系統(tǒng)設(shè)計(jì)

  4. 模式識(shí)別筆記

  5. 博客-論文,caffe

  6. 語(yǔ)義分析方法


推薦系統(tǒng)讀書筆記

協(xié)同過濾推薦

1. 基于用戶的最近鄰?fù)扑]

輸入:用戶-物品的評(píng)分矩陣,待預(yù)測(cè)用戶
思路:

  • 找到與目標(biāo)用戶過去有相似偏好的用戶組,作為近鄰用戶。
  • 對(duì)每一個(gè)目標(biāo)用戶沒有打分的物品,利用鄰近用戶的打分做預(yù)測(cè)

前提假設(shè):

  • 用戶過去偏好相似,這用戶將來偏好相似
  • 用戶偏好不隨時(shí)間改變

例子

Pearson方法計(jì)算用戶相似度
通過最近鄰用戶預(yù)測(cè)物品評(píng)分
小結(jié)
  • Pearson相關(guān)系數(shù)取值是-1~1的,1代表強(qiáng)正相關(guān),-1代表強(qiáng)負(fù)相關(guān)。
  • Pearson考慮了不同用戶不同的評(píng)分范圍,因?yàn)槊看斡?jì)算的都是與平均數(shù)的差值。
  • 沒有考慮到,用戶間對(duì)于冷門物品的共同偏好,相比于熱門物品來說,價(jià)值更大,但是目前沒有考慮到
  • 還有其他衡量用戶相似度的方法:改進(jìn)余弦相似度,Spearman秩相關(guān)系數(shù),均方差
  • 近鄰用戶選擇,上文為方便說明只選了1個(gè),可以選擇K個(gè)最近鄰,實(shí)踐中20~50的效果不錯(cuò)

2. 基于物品的最近鄰?fù)扑]

輸入:用戶-物品的評(píng)分矩陣,待預(yù)測(cè)用戶
思路:

  • 找到目標(biāo)用戶對(duì)于待預(yù)測(cè)物品的相似物品的評(píng)分。
  • 根據(jù)相似物品的評(píng)分按照權(quán)重計(jì)算得到的平均值進(jìn)行計(jì)算
余弦夾角計(jì)算相似度
改進(jìn)的余弦夾角

協(xié)同過濾的其它話題

  1. 評(píng)分
  • 顯式評(píng)分需要用戶額外付出,用戶會(huì)因?yàn)榈貌坏饺魏魏锰幎艞壴u(píng)價(jià),因此需要收集隱式評(píng)分,例如買了一個(gè)商品,在某商品詳情頁(yè)停留很久,都可以作為正向意圖
  • 推薦系統(tǒng)冷啟動(dòng),可以利用用戶附加信息對(duì)用戶進(jìn)行分類,例如年齡,性別,教育程度等。
  • 數(shù)據(jù)稀疏問題,利用假設(shè)用戶偏向有傳遞性,由此增強(qiáng)額外信息矩陣。例如User1 -> Item1 -> User2 -> Item2推薦路徑長(zhǎng)度是3,可以拓展為5或其他更長(zhǎng)情況
  1. 基于模型的推薦
  • 推薦系統(tǒng)使用矩陣因子分解的方法,從評(píng)分模式中抽取一組潛在的因子,通過這些因子向量來描述用戶和物品
  • SVD將高度相關(guān)且一起出現(xiàn)的詞語(yǔ)作為單獨(dú)因子,把大的矩陣向量差分成更小階的近似矩陣
  • PCA主成分分析對(duì)評(píng)分?jǐn)?shù)據(jù)預(yù)處理,過濾出數(shù)據(jù)中最重要的方面來解釋大多數(shù)變量,經(jīng)過PCA處理后的數(shù)據(jù),原始評(píng)分?jǐn)?shù)據(jù)被投射到最相關(guān)的主特征向量上
  1. 關(guān)聯(lián)規(guī)則挖掘
  • 關(guān)聯(lián)規(guī)則應(yīng)用到推薦就是自動(dòng)發(fā)現(xiàn)規(guī)則。
  • 關(guān)聯(lián)規(guī)則的衡量標(biāo)準(zhǔn)是支持度和可信度
  • 所有的正向評(píng)分都記做一次購(gòu)買行為
  • 得到的規(guī)則是:喜歡物品1的同時(shí)喜歡物品5
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

推薦閱讀更多精彩內(nèi)容

  • 基于模型的協(xié)同過濾算法 基于模型的協(xié)同過濾算法是源自于推薦過程可以被視為分類或預(yù)測(cè)問題的這一思想,它將評(píng)分矩陣作為...
    T_129e閱讀 1,104評(píng)論 0 0
  • 1.基于內(nèi)容的推薦系統(tǒng): 推薦系統(tǒng)以個(gè)性化的方式指引用戶在眾多選擇中找到感興趣的東西。基于內(nèi)容的推薦系統(tǒng)會(huì)發(fā)掘用戶...
    T_129e閱讀 459評(píng)論 0 1
  • 1 推薦系統(tǒng)基礎(chǔ)## 1.1 個(gè)性化推薦概述### 1.1.1 推薦系統(tǒng)概述 首先,需要申明一點(diǎn)的就是推薦系統(tǒng)!=...
    城市中迷途小書童閱讀 1,387評(píng)論 1 23
  • 個(gè)性化推薦系統(tǒng)可以理解成一個(gè)“為目標(biāo)用戶找到目標(biāo)物品”的系統(tǒng),整個(gè)過程大致可以分為幾個(gè)步驟,確定目標(biāo)用戶-召回目標(biāo)...
    蕭飯飯閱讀 3,528評(píng)論 1 15
  • 原來愛一個(gè)人,真的會(huì)變得很盲目吧。 我們都曾盲目的愛過一個(gè)人吧,不計(jì)后果,也不在乎有沒有人支持,把未來都?jí)涸诹四莻€(gè)...
    毛毛笨蛋閱讀 284評(píng)論 0 4