協(xié)同過濾的不足
協(xié)同過濾雖然可以幫助用戶找出合適的推薦列表,在實(shí)踐中得到廣泛的應(yīng)用,但是也存在著以下一些問題:
1. 冷啟動(dòng)問題
冷啟動(dòng)問題具體可以分為兩類。第一類指的是,當(dāng)系統(tǒng)建立之初,還未收集足夠的用戶信息,協(xié)同過濾算法不能為指定用戶找到合適的鄰居,從而無法向用戶提供推薦預(yù)測。第二類指的是,對于新注冊的用戶或者新加入的商品,由于系統(tǒng)里沒有他們的歷史數(shù)據(jù)信息,所以協(xié)同過濾算法也無法為用戶預(yù)測推薦。
2. 稀疏性問題
稀疏性問題指的是在實(shí)際情況下,用戶很少會(huì)對每個(gè)內(nèi)容項(xiàng)進(jìn)行評(píng)分,所以真實(shí)的用戶-內(nèi)容項(xiàng)的相似矩陣是稀疏的(即矩陣中的很多元素都為0,表示用戶對該內(nèi)容未進(jìn)行評(píng)分),從而降低了計(jì)算效率,而且少部分人的錯(cuò)誤偏好會(huì)降低推薦的準(zhǔn)確性。
3. 最初評(píng)價(jià)問題
最初評(píng)價(jià)問題指的是,對于一些從未被評(píng)過分的內(nèi)容,比如新加進(jìn)的內(nèi)容或者是比較小眾的內(nèi)容,它們是不可能會(huì)被推薦給用戶的,而用戶可能會(huì)對一些冷門內(nèi)容也感興趣。
4. 擴(kuò)展性不足問題
隨著推薦系統(tǒng)的擴(kuò)展,用戶和內(nèi)容數(shù)量的增加,計(jì)算用戶或者內(nèi)容項(xiàng)間的相似度時(shí),計(jì)算復(fù)雜度會(huì)大大增加,從而導(dǎo)致系統(tǒng)的性能降低。
5. 流行性偏向問題
系統(tǒng)會(huì)更偏向于為用戶推薦比較流行的內(nèi)容,因?yàn)樵u(píng)分覆蓋面廣。但對于有著獨(dú)特口味的用戶來說,推薦系統(tǒng)不能提供很好的推薦。
為了克服以上的缺點(diǎn),現(xiàn)今的推薦系統(tǒng)一般會(huì)采取混合的推薦機(jī)制來進(jìn)行互補(bǔ),而不是單單只采用某一種推薦策略。現(xiàn)在運(yùn)用最廣的推薦機(jī)制混合方法有以下幾種:
1. 加權(quán)混合
先用不同的推薦機(jī)制對用戶進(jìn)行推薦預(yù)測,然后再將它們的結(jié)果按照一定的權(quán)重加權(quán)求和得出最終的推薦預(yù)測,具體的權(quán)值設(shè)置需要根據(jù)實(shí)際情況決定。
2. 轉(zhuǎn)換混合
在不同的狀態(tài)和條件下,轉(zhuǎn)換選擇最為合適的推薦機(jī)制對其進(jìn)行預(yù)測。因?yàn)榛诓煌那闆r,推薦機(jī)制的選擇上可能會(huì)有很大的不同,為了充分利用各種推薦機(jī)制的優(yōu)點(diǎn),我們可以選擇轉(zhuǎn)換混合的方式對用戶進(jìn)行推薦預(yù)測。
3. 分區(qū)混合
同時(shí)采用多種不同的推薦機(jī)制,并將產(chǎn)生出的不同結(jié)果分成不同的區(qū)域推薦給用戶。分區(qū)混合的方法可以為用戶提供更為全面的推薦結(jié)果。
4. 分層混合
和分區(qū)混合一樣,分層混合也是采用多種不同的推薦機(jī)制,但不同的是它是將一個(gè)推薦機(jī)制的結(jié)果作為下一個(gè)的輸入,這樣層層作用下去,最終得到一個(gè)推薦預(yù)測。分層混合的優(yōu)點(diǎn)在于可以綜合不同推薦機(jī)制的優(yōu)缺點(diǎn),從提高推薦準(zhǔn)確度。
總結(jié)
在這個(gè)數(shù)據(jù)爆炸的時(shí)代,對于電子商務(wù),社交網(wǎng)絡(luò)或是個(gè)性化應(yīng)用來說,如何能讓用戶更快速地定位自己想要的信息,如何讓用戶發(fā)掘出自己潛在的興趣愛好,這是最為關(guān)鍵的。龐大的市場需求推動(dòng)了推薦系統(tǒng)的發(fā)展,現(xiàn)如今,推薦系統(tǒng)已慢慢走向成熟。很多用戶驚嘆于推薦系統(tǒng)的能力,因?yàn)樗粌H能找到與你喜好相似的內(nèi)容,而且還能發(fā)掘出你潛在的喜好,可以這么說,推薦系統(tǒng)可能比你還更了解你自己的需求。推薦系統(tǒng)的發(fā)展又反作用推動(dòng)了電子商務(wù)等應(yīng)用的發(fā)展,現(xiàn)今的淘寶,京東和豆瓣等網(wǎng)站用戶數(shù)量已突破千萬,更多的用戶享受到推薦引擎的美妙之處。
而這篇文章揭示了推薦引擎的背后原理,詳細(xì)地介紹了推薦引擎最核心的協(xié)同過濾算法。原來推薦引擎并沒有你想象中的那么復(fù)雜,它只是先記錄下所有用戶的行為信息,然后基于協(xié)同過濾的算法,利用這海量的信息,找出與你有著相似喜好的用戶,最后把他們的喜好商品推薦給你。也就是說,協(xié)同過濾算法是借助他人的經(jīng)驗(yàn)幫你找到你自己潛在的興趣愛好,而實(shí)現(xiàn)這些的前提是需要具有大量的用戶行為數(shù)據(jù),而大數(shù)據(jù)時(shí)代正好可以滿足這一前提條件。
當(dāng)然協(xié)同過濾算法還沒有走向真正的成熟,還存在大大小小的問題。但只要推薦系統(tǒng)能夠根據(jù)不同的實(shí)際情況,選擇不同種類的協(xié)同過濾方法或者將它們結(jié)合起來,就能得到一個(gè)令人較為滿意的推薦結(jié)果。
參考文獻(xiàn)
https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html
https://zh.wikipedia.org/zh-hans/%E6%8E%A8%E8%96%A6%E7%B3%BB%E7%B5%B1
https://zh.m.wikipedia.org/zh-cn/%E5%8D%94%E5%90%8C%E9%81%8E%E6%BF%BE
http://blog.csdn.net/zhangyuming010/article/details/38636931