文章目錄
- 目錄
- 1.什么是冷啟動問題?
- 1.1冷啟動問題
- 1.2 冷啟動問題的分類
- 1. 用戶冷啟動
- 2 物品冷啟動
- 3 系統冷啟動
- 2.如何解決冷啟動問題?
- 2.1利用用戶注冊信息
- 2.2選擇合適的物品啟動用戶的興趣
- 2.3利用物品的內容信息
- 2.4 發揮專家的作用
目錄
1.什么是冷啟動問題?
1.1冷啟動問題
對于一個新用戶,新物品或者新系統,在沒有大量的用戶歷史數據的情況下,如何
如果在一開始的階段就希望有個性化推薦應用的網站讓用戶對推薦結果滿意從而愿意使用推薦系統
1.2 冷啟動問題的分類
1. 用戶冷啟動
- 新用戶無行為數據,無法根據新用戶的歷史行為預測其興趣的問題
2 物品冷啟動
- 新的物品入庫的時候推薦給對該物品感興趣的用戶的問題
3 系統冷啟動
一個新開發的網站(無用戶、無用戶行為,只有物品信息) 的情況下設計個性化推薦系統
解決的方法如下:
1.提供非個性化的推薦,簡單例子為熱門排行,等到用戶數據收集到一定的時候,再切換為個性化推薦
2.利用用戶注冊時提供的年齡、性別等數據做粗粒度的個性化
3.利用用戶的社交賬號登陸,導入用戶在社交網站上的好友信息,然后推薦給用戶推薦其好友喜歡的物品
4.要求用戶在登錄時對一些物品進行反饋,搜集用戶的興趣信息,然后給用戶推薦和物品相似的物品
5.對于新加入的物品,可以利用內容信息,將它們推薦給喜歡過和它們相似的物品的用戶
6.在系統冷啟動時,可以引入專家的知識,通過一定的高效的方式迅速建立起物品的相關度表。
2.如何解決冷啟動問題?
2.1利用用戶注冊信息
2.2選擇合適的物品啟動用戶的興趣
2.3利用物品的內容信息
基于物品的內容信息主要介紹了兩種主要的推薦算法:UserCF和ItemCF
- UserCF針對物品冷啟動問題并不敏感:UserCF在給用戶進行推薦時,會首先找到和用戶興趣 相似的一群用戶,然后給用戶推薦這一群用戶喜歡的物品。在很多網站中,推薦列表并不是給用 戶展示內容的唯一列表,那么當一個新物品加入時,總會有用戶從某些途徑看到這些物品,對這 些物品產生反饋。那么,當一個用戶對某個物品產生反饋后,和他歷史興趣相似的其他用戶的推 薦列表中就有可能出現這一物品,從而更多的人就會對這個物品產生反饋,導致更多的人的推薦 列表中會出現這一物品,因此該物品就能不斷地擴散開來,從而逐步展示到對它感興趣用戶的推 薦列表中
- ItemCF針對物品冷啟動問題算一個嚴重的問題:因為ItemCF算法的原理是給用戶 推薦和他之前喜歡的物品相似的物品。ItemCF算法會每隔一段時間利用用戶行為計算物品相似度 表(一般一天計算一次),在線服務時ItemCF算法會將之前計算好的物品相關度矩陣放在內存中。 因此,當新物品加入時,內存中的物品相關表中不會存在這個物品,從而ItemCF算法無法推薦新 的物品。解決這一問題的辦法是頻繁更新物品相似度表,但基于用戶行為計算物品相似度是非常 耗時的事情,主要原因是用戶行為日志非常龐大。而且,新物品如果不展示給用戶,用戶就無法 對它產生行為,通過行為日志計算是計算不出包含新物品的相關矩陣的。為此,我們只能利用物 品的內容信息計算物品相關表,并且頻繁地更新相關表(比如半小時計算一次)