推薦系統遇上深度學習(三十三)--Neural Attentive Item Similarity Model

2021-12-10 小小挖掘機

收錄於話題 #推薦系統遇上深度學習 95個內容

在介紹本篇之前，先說一下上一篇中的錯誤，在第三十一篇中，我們介紹了自注意力機制在推薦系統中的應用，文章使用的是表示學習的思路。最後的預測評分越低，代表用戶i和物品j越相近，但是之前的文章中沒有仔細思考這一點，所以可能誤導了大家。不過該文章已經重新推送，原文已經刪除。大家可以先回顧一下上一篇文章：推薦系統遇上深度學習(三十一)--使用自注意力機制進行物品推薦

好了，回歸本文！

論文名稱：《NAIS: Neural Attentive Item Similarity Model for Recommendation》
論文地址：https://arxiv.org/pdf/1809.07053.pdf

基於物品的協同過濾ItemCF是推薦領域常用的方法，其關鍵是評估item之間的相似性。本文將要介紹Neural Attentive Item Similarity Model(簡稱NASI)來解決ItemCF問題。該模型將注意力機制和神經網絡相結合，提升了模型的預測準確性。接下來，我們將從基本的ItemCF問題入手，一步步得出NASI模型。

1、ItemCF問題簡介1.1 標準ItemCF問題

為了預測用戶u對於物品i的評分，ItemCF的最基本思想是計算物品i與用戶u之前交互過的所有物品的相似性，預測評分計算公式如下：

其中，Ru+是用戶所有交互過的物品，ruj是用戶u對物品j的反饋，sij是物品i和物品j的相似性。其中，ruj可以是顯式的評分，如0-5評分，也可以是隱式的反饋，如點擊為1，未點擊為0。

物品之間的相似性，直觀的方法是根據用戶-物品交互矩陣，將物品i所在的列作為其向量表示，進一步使用餘弦相似度等度量方式計算物品之間的相似性。但是這種方法缺乏針對推薦的優化，類似於一種靜態方法，物品的向量不是通過優化得到的。因此性能並不是那麼優秀。所以接下來我們將介紹Learning-based Methods，這些方法可以自適應地從數據中學習item相似度，從而提高itemCF的準確性。

1.2 Learning-based Methods for Item-based CF

Learning-based Methods通過優化一個目標函數，來學習item之間的相似性，如SLIM(short for sparse Linear Method)方法中，目標函數設定為：

上面的目標函數中，S代表物品的相似度矩陣。而預測評分的計算仍然基於1.1中的方法。假設物品個數為I，那麼模型需要優化的參數有I * I個。上面的式子同時使用L1正則和L2正則，防止了過擬合，增加了模型的稀疏性。但也存在一定的缺點，當物品集數量很大時，參數太多難以優化，同時，模型只能學習同時被打過分的物品之間的兩兩的相似性。

為了解決這個問題，我們又有了FISM(short for factored item similarity model)方法，其用低維度嵌入向量表示每一個物品。對於每一個物品，都有兩個嵌入向量p和q，當物品是預測的物品時，使用p，當物品是交互歷史中的物品時，使用q，此時用戶評分計算方式如下：

FISM只考慮隱式反饋。對於上面的預測模型，可以通過優化推薦的標準損失（對數損失或者平方損失）來學習物品的嵌入向量表示p和q。

雖然FISM方法取得了不錯的性能，但我們認為，當獲得用戶的表示時，它對用戶的所有歷史項目的平等處理會限制其表示能力。因此，我們將注意力機制加入其中，用於區分歷史item的重要性，提出了NASI模型。

2、NASI模型介紹

這裡，我們仍然只考慮隱式反饋，模型設計過程如下：

2.1 第一版

在第一版的設計中，我們認為每個物品有一個固定的注意力權重aj，因此評分預測計算如下：

很顯然，這是不合理的，我們沒有考慮目標物品對於歷史物品的影響。於是我們有了第二版設計。

2.2 第二版

在第二版的設計中，我們使用aij來表示歷史物品j和目標物品i的權重，評分計算如下：

這樣顯然也是有缺陷的，當訓練集中物品i和物品j沒有同時出現過時，aij是無從學習的。於是我們有了第三版設計。

2.3 第三版

第三版設計中，我們使用嵌入向量計算出權重，即：

f通常用一個神經網絡來表示，主流的計算方法有以下兩種：

通過f計算出的權重，我們還需要通過softmax進行歸一化，因此，評分預測的計算如下：

這麼做看似是完美了，但是在實際的實驗中，卻沒有取得理想的效果。這個問題主要來自softmax，在傳統的注意力機制使用的場景中，如CV、NLP中，注意力機制的長度變化不是很大(這裡的長度指圖像中的區域個數，句子中單詞的個數等等)，但是在推薦領域中，用戶的歷史交互長度可能變化很大。在MovieLens和Pinnterest數據中，用戶歷史長度的分布如下圖所示：

可以看到，對於兩個真實數據集，用戶的歷史長度變化很大，具體而言，用戶歷史長度的均值和方差分別為（166，37145）,（27，572）。在MovieLens數據集中，所有用戶的平均長度為166，最大長度為2313。也就是說，最活躍用戶的平均注意力權重是1/2313，比平均用戶（即，1/166）少大約14倍。如此大的注意權重差異將導致優化模型的item嵌入是個問題。（可以簡單的想，同樣的物品i和物品j，在活躍用戶和非活躍用戶中得到的aij差異會非常大）

為了解決用戶歷史長度不同的問題，我們便有了最終版的NAIS模型。

2.4 最終版

在最終版的模型中，我們對活躍用戶的注意力權重進行一定的懲罰，如下：

而模型的損失函數使用對數損失+L2正則：

模型的框架圖如下：

好了，模型介紹就到這裡了，關於模型中的一些細節，大家可以閱讀原論文。

3、NASI代碼實現

作者給出了Python2版本的代碼：https://github.com/AaronHeee/Neural-Attentive-Item-Similarity-Model

這個代碼在Python3中是無法運行的，主要是Python3中range函數得到的不是list，需要使用list()函數進行轉換，Python3版本的代碼地址：https://github.com/princewen/tensorflow_practice/tree/master/recommendation/Basic-NAIS-Demo

相關焦點

深度學習在推薦系統上的應用

確實深度學習很火，近期深度學習的戰火燒到推薦系統，其強大的表徵能力和低準入門檻，已經成為各大高校和中國人改網絡發paper的紅利時代。可是我還沒能發上那麼幾篇，之前面試大廠的AI labs被總監虐，感覺工作之後被壓榨太多，快幹了。推薦系統為什麼引入深度學習？
推薦系統遇上深度學習(十二)--推薦系統中的EE問題及基本Bandit算法

收錄於話題 #推薦系統遇上深度學習，只需要一行代碼就能在選擇合適的老虎機。
推薦系統遇上深度學習(三十八)--CFGAN:一種基於GAN的協同過濾推薦框架

對比我們之前看到的IRGAN和GraphGAN的效果，CFGAN相較於IRGAN準確率提升了72.6%，較GraphGAN提升了104.3%。3.3 與目前主流推薦方法的比較這裡選取的推薦方法有ItemPop、BPR、FISM、CDAE、IRGAN和GraphGAN。而CFGAN選擇iCFGAN−ZP方式。
【論文推薦】最新5篇推薦系統相關論文—文檔向量矩陣分解、異構網絡融合、樹結構深度模型、深度強化學習、負二項矩陣分解

【導讀】專知內容組整理了最近五篇推薦系統（Recommender System）相關文章，為大家進行介紹，歡迎查看!1. Initially, a neural language processing model and more specifically the paragraph vector model is used to encode textual user reviews of variable length into feature vectors of fixed length.
萬物皆Embedding,從經典的word2vec到深度學習基本操作item2vec

（https://zhuanlan.zhihu.com/wangzhenotes）的第四篇文章，之前我們一起討論了阿里的DIN，YouTube的深度學習推薦系統，本來今天想再分享另一篇科技巨頭的業界前沿文章，Airbnb的Embedding方法但因為文章中涉及word2vec的技術細節，為了保證一些初學者的知識是自洽的，我還是想在此之前詳細介紹一下深度學習的基本操作
推薦系統遇上深度學習(二十)--貝葉斯個性化排序(BPR)算法原理及實戰

它在學習和預測過程中都將排序列表作為一個樣本。排序的組結構被保持。= tf.get_variable("item_emb_w", [item_count + 1, hidden_dim], initializer=tf.random_normal_initializer(0, 0.1))u_emb = tf.nn.embedding_lookup(user_emb_w, u)
推薦系統遇上深度學習(十七)--探秘阿里之MLR算法淺析及實現

(learning_rate).minimize(cost)隨後，我們就可以進行試驗了。參考文獻1、https://mp.weixin.qq.com/s?___biz=MzIzOTU0NTQ0MA==&mid=2247485097&idx=1&sn=6dbc197e67e8a2ba3ee78786b13d894d&scene=21#wechat_redirect2、Learning Piece-wise Linear Modelsfrom Large Scale Data for Ad Click Prediction
重讀Youtube深度學習推薦系統論文,字字珠璣,驚為神文

AI 前線導讀：2016 年，Youtube 發布了一篇深度推薦系統論文《Deep Neural Networks for YouTube Recommendations》，按照今天的標準來看，已經沒有什麼新穎的地方。
重讀 Youtube 深度學習推薦系統論文,字字珠璣,驚為神文

這裡是王喆的機器學習筆記，每隔一到兩周我會站在算法工程師的角度講解一些計算廣告、推薦系統相關的文章。
推薦系統遇上深度學習(八)--AFM模型理論和實踐

推薦系統遇上深度學習系列：推薦系統遇上深度學習(一)--FM模型理論和實踐推薦系統遇上深度學習(二)--FFM
【論文推薦】最新5篇度量學習(Metric Learning)相關論文—人臉驗證、BIER、自適應圖卷積、注意力機制、單次學習

【導讀】專知內容組整理了最近五篇度量學習（Metric Learning）相關文章，為大家進行介紹，歡迎查看!1. >Deep Metric Learning with BIER: Boosting Independent Embeddings Robustly（深度度量學習
【論文推薦】最新五篇命名實體識別(NER)相關論文—對抗學習、語料庫、深度多任務學習、先驗知識、跨語言語義

Entity Recognition with Deep Multi-Task Learning（基於深度多任務學習的跨類型生物醫學命名實體識別Results: We propose a multi-task learning framework for BioNER that is based on neural network models to save human efforts.
深度學習基礎 | 從Language Model到RNN

n-gram model 是不使用深度學習的方法，直接利用「條件概率」來預測下一個單詞是什麼。對於這種情況，可以回退到二元組，比如"student open".這叫做backoff1.2 neural language model想要求"the students opened their"的下一個詞出現的概率，首先將這四個詞分別embedding，之後過兩層全連接，再過一層softmax，得到詞彙表中每個詞的概率分布。
【全面】人工智慧技術棧與學習路線:機器學習深度學習視覺 NLP 推薦系統

一些必備算法：廣度優先搜索深度優先搜索背包問題動態規劃蟻群問題等三人工智慧基礎原理這門課，你將學習：知識系統：分為確定性只是系統和不確定性知識系統你將學習基礎的知識表示和推理方式智能搜索技術：你將學習啟發式搜索算法例如A*算法和博弈樹以及遺傳算法
Tensroflow練習,包括強化學習、推薦系統、nlp等

4、推薦系統推薦系統遇上深度學習(一)--FM模型理論和實踐推薦系統遇上深度學習(二)--FFM模型理論和實踐推薦系統遇上深度學習(三)--DeepFM模型理論和實踐推薦系統遇上深度學習(四)--多值離散特徵的embedding解決方案推薦系統遇上深度學習(五)--Deep&Cross Network模型理論和實踐推薦系統遇上深度學習
論文推薦 | 深度學習應用於交通流預測後的奇妙效應(2020-09-22)

交通流預測一直是熱點研究問題，尤其是隨著深度學習技術的發展。本文推薦了 3 篇基於深度學習方法預測交通流的論文，不僅梳理和翻譯了論文的題錄信息、摘要，而且提供了必要的拓展學習資源。此外，論文中可利用的數據也單獨列出，以供大家學習使用。1.
深度學習推薦系統中各類流行的Embedding方法 (下)

形式上來說，Embedding就是用一個低維的向量表示一個物體，可以是一個詞，一個商品，或是一個電影。作為深度學習的「基本核心操作」，Embedding技術已經在深度學習推薦系統中被廣泛應用，在Youtube、Airbnb等各類推薦系統中都有涉及。更多Embedding技術，可以參考往期文章：深度學習推薦系統中各類流行的Embedding方法 (上)。
推薦系統遇上深度學習(六)--PNN模型理論和實踐

作者：石曉文中國人民大學信息學院在讀研究生個人公眾號：小小挖掘機（ID:wAIsjwj）
用DNN構建推薦系統-Deep Neural Networks for YouTube Recommendations論文精讀

之所以要在推薦系統中應用DNN解決問題，一個重要原因是google內部在機器學習問題上的通用solution的趨勢正轉移到Deep learning，系統實際部署在基於tensorflow的Google Brain上。一、系統概覽在工業界工作的同學對下圖的系統劃分並不陌生。
Mercari數據集——機器學習&深度學習視角

-0-41117-35th assert len(y_true) == len(y_pred) score = np.sqrt(np.mean(np.power(np.log1p(y_pred) - np.log1p(y_true), 2))) return score3.機器學習和深度學習在我們的問題中的應用在這個人工智慧（AI）時代，當我們想到AI的時候，有兩個流行詞分別是機器學習和深度學習

推薦系統遇上深度學習(三十三)--Neural Attentive Item Similarity Model

相關焦點

深度學習在推薦系統上的應用

推薦系統遇上深度學習(十二)--推薦系統中的EE問題及基本Bandit算法

推薦系統遇上深度學習(三十八)--CFGAN:一種基於GAN的協同過濾推薦框架

【論文推薦】最新5篇推薦系統相關論文—文檔向量矩陣分解、異構網絡融合、樹結構深度模型、深度強化學習、負二項矩陣分解

萬物皆Embedding,從經典的word2vec到深度學習基本操作item2vec

推薦系統遇上深度學習(二十)--貝葉斯個性化排序(BPR)算法原理及實戰

推薦系統遇上深度學習(十七)--探秘阿里之MLR算法淺析及實現

重讀Youtube深度學習推薦系統論文,字字珠璣,驚為神文

重讀 Youtube 深度學習推薦系統論文,字字珠璣,驚為神文

推薦系統遇上深度學習(八)--AFM模型理論和實踐

【論文推薦】最新5篇度量學習(Metric Learning)相關論文—人臉驗證、BIER、自適應圖卷積、注意力機制、單次學習

【論文推薦】最新五篇命名實體識別(NER)相關論文—對抗學習、語料庫、深度多任務學習、先驗知識、跨語言語義

深度學習基礎 | 從Language Model到RNN

【全面】人工智慧技術棧與學習路線:機器學習 深度學習 視覺 NLP 推薦系統

Tensroflow練習,包括強化學習、推薦系統、nlp等

論文推薦 | 深度學習應用於交通流預測後的奇妙效應(2020-09-22)

深度學習推薦系統中各類流行的Embedding方法 (下)

推薦系統遇上深度學習(六)--PNN模型理論和實踐

用DNN構建推薦系統-Deep Neural Networks for YouTube Recommendations論文精讀

Mercari數據集——機器學習&深度學習視角

【全面】人工智慧技術棧與學習路線:機器學習深度學習視覺 NLP 推薦系統