概述
任何機器學習算法都是以數據為基礎的,推薦系統也不例外,甚至比一般的文本分類、語音識別、圖像識別等領域需要的數據更多;
推薦系統往往需要的是源源不斷的數據來促進推薦效果向著更好的方向前進。
那麼對於新用戶或者極不活躍的用戶來說,數據豐富程度會比較匱乏,推薦模型效果也往往表現的會很差,這個問題如何解決呢?
方案一:看作MBA問題
一個賭徒,要去搖老虎機,走進賭場一看,一排老虎機,外表一模一樣,但是每個老虎機吐錢的概率可不一樣,他不知道每個老虎機吐錢的概率分布是什麼,那麼想最大化收益該怎麼整?
這就是多臂賭博機問題 (Multi-armed bandit problem, K-armed bandit problem, MAB),簡稱 MAB 問題。
實際上所有的選擇 - 反饋問題都可以看作是MBA問題,推薦系統恰好就是為用戶選擇感興趣的物品。
MBA問題如何解決呢?
一般可以採樣Bandit算法來解決,Bandit算法並不是一個具體的算法,而是一種算法思想;
Bandit 算法的套路就是:小心翼翼地試,越確定某個選擇好,就多選擇它,越確定某個選擇差,就越來越少選擇它。
常見的Bandi算法主要有:湯普森採樣算法、UCB算法、LinUCB算法等
方案二:構建排行榜系統
排行榜可以作為解決新用戶冷啟動問題的推薦策略。這個不難理解,當一個新用戶剛註冊時,可以把最近產品中熱門的物品推薦給他。
這裡多多少少也是用到了協同過濾的思想;
常見的排行榜算法
統計某項指標,按照指標排序;比如:統計點讚數考慮時間加權因素的指標計算;距離現在越久遠的點讚對現在的熱度影響就越小多種計算指標加權計算,比如:點讚數、點讚率等考慮行為質量,比如:評論的長度、觀看的時長等關於推薦系統的冷啟動問題,還有其他方案嗎?歡迎留言評論