2016-05-24~28:資料+推薦

  1. Scikit Flow介紹和源碼分析

  2. EM算法原理和應(yīng)用

  3. 商品搜索引擎---推薦系統(tǒng)設(shè)計(jì)

  4. 模式識(shí)別筆記

  5. 博客-論文,caffe

  6. 語(yǔ)義分析方法


推薦系統(tǒng)讀書筆記

協(xié)同過(guò)濾推薦

1. 基于用戶的最近鄰?fù)扑]

輸入:用戶-物品的評(píng)分矩陣,待預(yù)測(cè)用戶
思路:

  • 找到與目標(biāo)用戶過(guò)去有相似偏好的用戶組,作為近鄰用戶。
  • 對(duì)每一個(gè)目標(biāo)用戶沒(méi)有打分的物品,利用鄰近用戶的打分做預(yù)測(cè)

前提假設(shè):

  • 用戶過(guò)去偏好相似,這用戶將來(lái)偏好相似
  • 用戶偏好不隨時(shí)間改變

例子

Pearson方法計(jì)算用戶相似度
通過(guò)最近鄰用戶預(yù)測(cè)物品評(píng)分
小結(jié)
  • Pearson相關(guān)系數(shù)取值是-1~1的,1代表強(qiáng)正相關(guān),-1代表強(qiáng)負(fù)相關(guān)。
  • Pearson考慮了不同用戶不同的評(píng)分范圍,因?yàn)槊看斡?jì)算的都是與平均數(shù)的差值。
  • 沒(méi)有考慮到,用戶間對(duì)于冷門物品的共同偏好,相比于熱門物品來(lái)說(shuō),價(jià)值更大,但是目前沒(méi)有考慮到
  • 還有其他衡量用戶相似度的方法:改進(jìn)余弦相似度,Spearman秩相關(guān)系數(shù),均方差
  • 近鄰用戶選擇,上文為方便說(shuō)明只選了1個(gè),可以選擇K個(gè)最近鄰,實(shí)踐中20~50的效果不錯(cuò)

2. 基于物品的最近鄰?fù)扑]

輸入:用戶-物品的評(píng)分矩陣,待預(yù)測(cè)用戶
思路:

  • 找到目標(biāo)用戶對(duì)于待預(yù)測(cè)物品的相似物品的評(píng)分。
  • 根據(jù)相似物品的評(píng)分按照權(quán)重計(jì)算得到的平均值進(jìn)行計(jì)算
余弦?jiàn)A角計(jì)算相似度
改進(jìn)的余弦?jiàn)A角

協(xié)同過(guò)濾的其它話題

  1. 評(píng)分
  • 顯式評(píng)分需要用戶額外付出,用戶會(huì)因?yàn)榈貌坏饺魏魏锰幎艞壴u(píng)價(jià),因此需要收集隱式評(píng)分,例如買了一個(gè)商品,在某商品詳情頁(yè)停留很久,都可以作為正向意圖
  • 推薦系統(tǒng)冷啟動(dòng),可以利用用戶附加信息對(duì)用戶進(jìn)行分類,例如年齡,性別,教育程度等。
  • 數(shù)據(jù)稀疏問(wèn)題,利用假設(shè)用戶偏向有傳遞性,由此增強(qiáng)額外信息矩陣。例如User1 -> Item1 -> User2 -> Item2推薦路徑長(zhǎng)度是3,可以拓展為5或其他更長(zhǎng)情況
  1. 基于模型的推薦
  • 推薦系統(tǒng)使用矩陣因子分解的方法,從評(píng)分模式中抽取一組潛在的因子,通過(guò)這些因子向量來(lái)描述用戶和物品
  • SVD將高度相關(guān)且一起出現(xiàn)的詞語(yǔ)作為單獨(dú)因子,把大的矩陣向量差分成更小階的近似矩陣
  • PCA主成分分析對(duì)評(píng)分?jǐn)?shù)據(jù)預(yù)處理,過(guò)濾出數(shù)據(jù)中最重要的方面來(lái)解釋大多數(shù)變量,經(jīng)過(guò)PCA處理后的數(shù)據(jù),原始評(píng)分?jǐn)?shù)據(jù)被投射到最相關(guān)的主特征向量上
  1. 關(guān)聯(lián)規(guī)則挖掘
  • 關(guān)聯(lián)規(guī)則應(yīng)用到推薦就是自動(dòng)發(fā)現(xiàn)規(guī)則。
  • 關(guān)聯(lián)規(guī)則的衡量標(biāo)準(zhǔn)是支持度和可信度
  • 所有的正向評(píng)分都記做一次購(gòu)買行為
  • 得到的規(guī)則是:喜歡物品1的同時(shí)喜歡物品5
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 228,316評(píng)論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,481評(píng)論 3 415
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 176,241評(píng)論 0 374
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,939評(píng)論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,697評(píng)論 6 409
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,182評(píng)論 1 324
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,247評(píng)論 3 441
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,406評(píng)論 0 288
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,933評(píng)論 1 334
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,772評(píng)論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,973評(píng)論 1 369
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,516評(píng)論 5 359
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,209評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,638評(píng)論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,866評(píng)論 1 285
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,644評(píng)論 3 391
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,953評(píng)論 2 373

推薦閱讀更多精彩內(nèi)容

  • 基于模型的協(xié)同過(guò)濾算法 基于模型的協(xié)同過(guò)濾算法是源自于推薦過(guò)程可以被視為分類或預(yù)測(cè)問(wèn)題的這一思想,它將評(píng)分矩陣作為...
    T_129e閱讀 1,099評(píng)論 0 0
  • 1.基于內(nèi)容的推薦系統(tǒng): 推薦系統(tǒng)以個(gè)性化的方式指引用戶在眾多選擇中找到感興趣的東西。基于內(nèi)容的推薦系統(tǒng)會(huì)發(fā)掘用戶...
    T_129e閱讀 457評(píng)論 0 1
  • 1 推薦系統(tǒng)基礎(chǔ)## 1.1 個(gè)性化推薦概述### 1.1.1 推薦系統(tǒng)概述 首先,需要申明一點(diǎn)的就是推薦系統(tǒng)!=...
    城市中迷途小書童閱讀 1,382評(píng)論 1 23
  • 個(gè)性化推薦系統(tǒng)可以理解成一個(gè)“為目標(biāo)用戶找到目標(biāo)物品”的系統(tǒng),整個(gè)過(guò)程大致可以分為幾個(gè)步驟,確定目標(biāo)用戶-召回目標(biāo)...
    蕭飯飯閱讀 3,507評(píng)論 1 15
  • 原來(lái)愛(ài)一個(gè)人,真的會(huì)變得很盲目吧。 我們都曾盲目的愛(ài)過(guò)一個(gè)人吧,不計(jì)后果,也不在乎有沒(méi)有人支持,把未來(lái)都?jí)涸诹四莻€(gè)...
    毛毛笨蛋閱讀 270評(píng)論 0 4