個性化資源推送的方法(日常總結01)

開學到現在,可以說我還沒有從假期的狀態中恢復過來,計劃好的每天要看兩篇文獻卻遲遲沒有付諸行動,直到今天(不好意思中)。所以一直很佩服那些自制力強的人。

細讀了兩篇,只有以下一篇讓我收獲最多,因此對此進行總結,并非個人想法。

[1]荊永君,李兆君,李 昕.基礎教育資源網中個性化資源推薦服務研究[J].中國電化教育,2009,(8)102-105.

該文章建立用戶興趣模型和資源描述模型,通過將兩種模型進行匹配,從而向用戶推薦所需要的資源。

一、建模

1.用戶興趣模型

信息來源通過在線興趣調查和行為跟蹤(使用、搜索和定制資源等行為)。對收集到的信息采用關鍵詞向量空間來表示擁護興趣模型。由于對某一關鍵詞所表示的內容不同知識背景的用戶會有不用的理解。所以模型中引入學科、學段作為知識背景限制。在關鍵詞向量空間中引入基于時態變化的興趣權重,來表示用戶興趣的衰減與更新。根據艾賓浩斯的遺忘曲線,對于興趣權重,采用基于時間窗原理進行用戶興趣的衰減和更新。即:在時間窗Δt內,如果關鍵詞kn每出現一次,則關鍵詞kn的興趣權重增加單位a;否則興趣權重衰減單位b。如某學科教師用戶興趣模型為:

{語文,小學一年,{(唐詩,0.9),(李白,0.9),(靜夜思,5.95),(領讀,1.9),(司馬光,2),(歷史典故,2)}}

2.資源描述模型

在描述資源模型時,下面兩方面因素是應該考慮的:(1)資源的適用對象和所屬學科。因為同樣的關于“三角形”的資源,五年級介紹的是認識三角形的邊、角及面積計算,而在七年級介紹的是三角形的三線及內、外角和的定理。(2)描述資源內容特征的屬性。其中,關鍵詞是最能體現資源內容特征的屬性。一個資源一般由多個關鍵詞項(5—10個)組成,權重則表示關鍵詞對描述資源內容的重要程度。所以,系統中的資源描述采用和用戶興趣模型類似的表示方法,每個資源由學科、學段為知識背景的關鍵詞向量空間表示,資源描述信息(所屬學科、學段、關鍵詞列表以及關鍵詞的權重值),都在資源設計階段由資源創意人員給出。如:一個七年級數學關于多邊形內角和的課件,其資源描述模型為:{數學,初中七年,{(多邊形,0.4),(內角和,0.4),(探究,0.2)}}

二、模型


個性化服務可以通過基于內容和基于協作的信息過濾技術來實現。基于內容的過濾技術是通過比較資源與用戶興趣模型來推薦資源,其優點是簡單、有效,缺點是只能發現與用戶已有興趣相似的資源,不能為用戶發現新的感興趣資源。基于協作的過濾技術是比較用戶興趣模型,根據用戶的相似性來推薦資源。其優點是有可能為用戶推薦出新的感興趣資源,缺點是用戶過少或過多時該方法性能很低。為了提高個性化推薦服務的性能,本文討論的資源推薦方法,將基于內容基于協作結合起來,實現混合推薦。

在模型中,用戶信息收集模塊是個性化服務系統的基礎模塊,負責收集用戶興趣信息,一方面通過在線興趣調查獲得用戶主動描述出來的顯式興趣信息,如媒體類型偏好,興趣主題描述等;另一方面通過行為跟蹤收集用戶在資源使用過程中的隱式興趣信息。行為跟蹤主要包括:(1)用戶的資源使用信息。(2)用戶的資源搜索信息。(3)用戶的資源定制信息。

用戶建模模塊根據收集到的用戶興趣信息,進行去噪、加權、構建或更新用戶興趣模型,通過聚類分析等數據挖掘技術,形成用戶興趣小組存入用戶興趣小組信息庫。通過混合推薦技術,形成顯性和潛在興趣資源組成的用戶個性化資源列 表 提 供 給 用戶。資源列表呈現方式根據用戶的選擇可以采用網頁或e-Mail的方式推送給用戶。模型中虛線表示用戶的反饋信息。

三、個性化資源推薦的實現方法

在個性化服務模型中基于內容過濾的處理是通過比較資源與用戶興趣模型來推薦資源,其關鍵步驟是資源和用戶興趣相似度的計算。對于向量空間模型來說,通常采用的方法有歐氏距離、余弦距離和內積。

用戶興趣關鍵詞向量和資源描述關鍵詞向量的距離越大表明它們的相似度也就越大,反之則越小。實現流程為:首先提取用戶興趣,然后選取與用戶具有相同背景(學科、學段)的資源,分別計算資源與用戶興趣的歐氏距離存入資源與興趣距離列表中并按照相似度大小降序排列,最后按照TOPn原則從距離列表中,選擇前n個相關度較高的資源推薦給用戶。

基于協作過濾技術的關鍵是建立用戶興趣小組,在用戶興趣小組聚類時,以相同背景為前提,對同一學科和學段的所有用戶興趣關鍵詞采用成熟的聚類算法(如蟻群聚類)進行聚類,從而形成用戶興趣小組。

用戶興趣小組建立后,便可以根據用戶興趣小組來推薦資源。在選擇資源時,對每個資源計算它和興趣小組的相似度,將相似度高并且不在用戶已推薦資源列表中的資源作為該用戶潛在感興趣的資源推薦給用戶。為用戶興趣小組進行個性化資源選擇的處理方法和基于內容過濾的資源選擇方法相同。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容