簡介
關于協同過濾的例子就是看電影,有時候不知道哪一部電影是我們喜歡的或者評分比較高的,那么我們通常的做法就是問問周圍的朋友,看看有什么好的電影推薦。在問的時候,都習慣于問跟自己口味差不多的朋友,這就是協同過濾的核心思想。
定義
- 百度百科
協同過濾簡單來說是利用某興趣相投、擁有共同經驗之群體的喜好來推薦用戶感興趣的信息,個人通過合作的機制給予信息相當程度的回應(如評分)并記錄下來以達到過濾的目的進而幫助別人篩選信息,回應不一定局限于特別感興趣的,特別不感興趣信息的紀錄也相當重要。協同過濾又可分為評比(rating)或者群體過濾(social filtering)。協同過濾以其出色的速度和健壯性,在全球互聯網領域炙手可熱
- 維基百科
協同過濾是通過將過濾操作在一大群人中擴散,用于過濾大量信息的一種機制。與主流媒體都有一個或少數幾個編輯設定一些指導原則不同的是,協同過濾的社會化網絡可以有無窮多的編輯,并隨著參與者人數的增多而變地更好。協同過濾基于群體智慧和多數原則的兩個基本原則之上。
核心
- 收集用戶偏好
- 找到相似的用戶或者物品
- 計算并推薦
算法細分
以用戶為基礎(User-based)的協同過濾
1.收集用戶信息
2.最近鄰搜索(Nearest neighbor search, NNS)
3.產生推薦結果基于物品的協同過濾算法
跟上述的基于用戶的協同過濾算法類似,但它從物品本身,而不是用戶角度。
比如喜歡物品A的用戶都喜 歡物品C,那么可以知道物品A與物品C的相似度很高,而用戶C喜歡物品A,那么可以推斷出用戶C也可能喜歡物品C以項目為基礎(Item-based)的協同過濾
1.收集用戶信息
2.針對項目的最近鄰搜索
3.產生推薦結果以模型為基礎(Model- based)的協同過濾
以模型為基礎的協同過濾(Model-based Collaborative Filtering)是先用歷史數據得到一個模型,再用此模型進行預測。以模型為基礎的協同過濾廣泛使用的技術包括Latent Semantic Indexing、Bayesian Networks…等,根據對一個樣本的分析得到模型。
國內案例
豆瓣是國內做的比較成功的社交網站,它以圖書,電影,音樂和同城活動為中心,形成一個多元化的社交網絡平臺,自然推薦的功能是必不可少的,當你在豆瓣電影中將一些你看過的或是感興趣的電影加入你看過和想看的列表里,并為它們做相應的評分,這時豆瓣的推薦引擎已經拿到你的一些偏好信息豆瓣的推薦是通過 “豆瓣猜”,為了讓用戶清楚這些推薦是如何來的,豆瓣還給出了“豆瓣猜”的一個簡要的介紹
你的個人推薦是根據你的收藏和評價自動得出的,每個人的推薦清單都不同。你的收藏和評價越多,豆瓣給你的推薦會越準確和豐富。每天推薦的內容可能會有變化。隨著豆瓣的發展,給你推薦的內容也會越來越準。
所以我們通過豆瓣得知,豆瓣猜是基于社會化的協同過濾的推薦。豆瓣的用戶越多,用戶的反饋越多,那么推薦的效果也就會越準確。
國內案例
AMAZON書店提供先進的個性化推薦功能,能為不同興趣偏好的用戶自動推薦盡量符合其興趣需要的書籍。 AMAZON使用推薦軟件對讀者曾經購買過的書以及該讀者對其他書的評價進行分析后,將向讀者推薦他可能喜歡的新書,只要鼠標點一下,就可以買到該書;AMAZON能對顧客購買過的東西進行自動分析,然后因人而異的提出合適的建議。 讀者的信息將被再次保存,這樣顧客下次來時就能更容易的買到想要的書。此外,完善的售后服務也是AMAZON的優勢,讀者可以在拿到書籍的30天內,將完好無損的書和音樂光盤退回AMAZON,AMAZON將原價退款。當然AMAZON的成功還不止于此,如果一位顧客在AMAZON購買一本書,下次他再次訪問時,映入眼簾的首先是這位顧客的名字和歡迎的字樣。
AMAZON對于用戶的協同過濾就是通過用戶曾經購買過的書和讀者對其他的書進行分析,最后給用戶推薦出用戶可能會喜歡的新書。購買數越多,AMAZON的個性化推薦功能也越多。
雙手奉上:關于協同過濾
上面文字均參考與百度百科。