> 結論:
協同過濾是電子商務推薦系統的一種主要算法。它能夠過濾機器難以自動內容分析的信息,共用其他人的經驗,推薦新信息,有效性高。但新用戶問題系統開始時推薦質量較差,新項目問題質量取決于歷史數據集,具有稀疏性和系統延伸性問題。以記憶為基礎的協同過濾技術經過發展演變成以模型為基礎。如今在信息過濾和信息系統中迅速成為一項很受歡迎的技術。
> 定義
定義介紹
- 百度:協同過濾是利用某興趣相投、擁有共同經驗群之群體的喜好來推薦用戶感興趣的信息,個人通過合作的機制給予信息相當程度的回應并記錄下來以達到過濾的目的進而幫助別人篩選信息,回應不一定局限于特別感興趣的,特別不感興趣信息的記錄也相當重要。
- 必應:是推薦系統中應用最為廣泛的技術之一,它基于一組興趣相同的用戶進行推薦。為用戶找到他真正感興趣的內容的好方法是,首先找他與他興趣相似的用戶,然后將這些用戶感興趣的內容推薦給此客戶。
- 知乎:協同過濾(Collaborative Filtering)作為推薦算法中最經典的類型,包括在線的協同和離線的過濾兩部分。所謂在線協同,就是通過在線數據找到用戶可能喜歡的物品,而離線過濾,則是過濾掉一些不值得推薦的數據,比比如推薦值評分低的數據,或者雖然推薦值高但是用戶已經購買的數據
小結
- 我認為百度的定義較好。
- 雖然百度對協同過濾的定義相對于必應和知乎的有點長,但它更詳細地說明了什么是協同過濾以及它的運作方式。而必應以及知乎的解答都是簡單地概括為推薦用戶其感興趣的內容,并沒有談及協作這方面的內容。而百度不僅扣中興趣還點到協同,然后相對于另外兩個,更利于人們對它的理解。
> 案例
- 國外案例
事例:在亞馬遜網絡書店中,顧客選擇一本自己感興趣的書籍,馬上會在底下看到一行“Customer Who Bought This Iten Also Bought"。
為何值得知道:亞馬遜網絡書店是最著名的電子商務推薦系統,亞馬遜也是全球最大的電子商務公司之一,其歷史比我們所熟知的BAT還要早。“根據顧客的興趣進行推薦服務”是以用戶的角度來推薦的協同過濾系統。由于亞馬遜網絡書店在推薦這一服務上為人津津樂道,各網絡書店也跟進了做這樣的推薦服務。雖然商業氣息濃厚但帶給了使用者很大的方便。還有一點,它不僅僅是用于電子商務方面,在我們經常使用的視頻網站上也有應用,目的是利用人們對于在智能手機、平板電腦和互聯網電視上觀看電視節目的興趣,以擴大自身在流媒體播放服務這一領域中的占有率。
為何符合定義:協同過濾 是由兩個方面組成的 一個是在線協同 一個是離線過濾。亞馬遜網絡書店是在“對同樣一本書有興趣的讀者們興趣的某種程度上相近”的假設前提下提供的這樣的推薦。“興趣在某種程度上相近的讀者”則表現出了“在線協同”,“提供書籍推薦服務”則表現出了離線過濾。亞馬遜網絡書店能對顧客買過的東西進行自動分析,然后因人而異的提出合適的建議。這就是以用戶為基礎的協同過濾。
- 國內案例
事例:豆瓣(douban)是一個社區網站。網站由楊勃(網名“阿北”)[1] 創立于2005年3月6日。該網站以書影音起家,提供關于書籍、電影、音樂等作品的信息,無論描述還是評論都由用戶提供(User-generated content,UGC),是Web 2.0網站中具有特色的一個網站。網站還提供書影音推薦、線下同城活動、小組話題交流等多種服務功能,它更像一個集品味系統(讀書、電影、音樂)、表達系統(我讀、我看、我聽)和交流系統(同城、小組、友鄰)于一體的創新網絡服務,一直致力于幫助都市人群發現生活中有用的事物。
為什么值得我們知道:
豆瓣是國內做的比較成功的社交網站,它以圖書,電影,音樂和同城活動為中心,形成一個多元化的社交網絡平臺。豆瓣是基于社會化的協同過濾的推薦,這樣用戶越多,用戶的反饋越多,推薦的效果會越來越準確,讓用戶更好的發現自己的潛在興趣和需求。為何符合定義:
協同過濾包涵兩個方面在線協同和離線過濾。豆瓣通過每個用戶的收藏和評分來達到推薦的目的,這是在線協同的體現。對于離線過濾,豆瓣就是將用戶評價差的產品進行過濾,來為用戶提供更好的推薦服務。豆瓣正是通過兩者的結合來很好的完成了協同過濾。
>總結
協同過濾作為一種經典的推薦算法種類,在各界應用廣泛,它的優點很多,模型通用性強,不需要太多對應數據領域的專業知識,工程實現簡單,效果也不錯。這些都是它流行的原因。當然,協同過濾也有些難以避免的難題,比如令人頭疼的“冷啟動”問題,我們沒有新用戶任何數據的時候,無法較好的為新用戶推薦物品。同時也沒有考慮情景的差異,比如根據用戶所在的場景和用戶當前的情緒。當然,也無法得到一些小眾的獨特喜好