天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020

2020-12-07 CIO時代網

天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020

天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020

2020-12-02 10:05:29  來源:DOIT搶沙發

2020-12-02 10:05:29  來源:DOIT

摘要:

在我們瀏覽各大網站和APP時,受推薦系統影響,大量相似產品反覆出現的情況屢見不鮮,這不僅會產生視覺疲勞,而且很難讓我們做出理性的判斷和購買決策。

關鍵詞: 天衍實驗室
      在我們瀏覽各大網站和APP時,受推薦系統影響,大量相似產品反覆出現的情況屢見不鮮,這不僅會產生視覺疲勞,而且很難讓我們做出理性的判斷和購買決策。究其原因,主要是目前主流的推薦系統採用的都是大數據模型篩查方式,會產生較大的路徑依賴。

對此,騰訊天衍實驗室近期另闢蹊徑推出推薦系統糾偏方法,與傳統方法相比,該方法無需執行隨機流量實驗以進行無偏估計,大大減小了無偏推薦算法的訓練成本,降低了系統的路徑依賴。目前,騰訊已經就研究成果發表論文《Information-theoretic counterfactual learning from missing-not-at-random feedback》,且成功入選NeurIPS-2020。

傳統推薦系統易導致路徑依賴 致使推薦質量下降

作為現代網際網路領域的重點研究方向,推薦系統具有相當高的商業價值。推薦系統模型需要在大量的候選項目中(通常為廣告、商品、短視頻等)尋找到用戶所喜愛的,從而提高曝光率或者點擊廣告收入。

傳統推薦系統研究一般著眼於設計更好的特徵交叉方法以提高CTR預估的準確性,從而給出更好的排序結果,提高廣告收入。通常,用戶看到的物品是推薦系統挑選出來的,它們在系統中產生了存儲記錄,推薦模型在該記錄上進行離線更新。然而已有的研究顯示,這種推薦方式會產生路徑依賴,即模型會在得到曝光的項目上嚴重高估其對每個用戶的偏好程度,而會在未得到曝光的項目中低估其對每個用戶的偏好程度。長此以往,推薦結果的多樣性將會急劇降低,從而危害推薦的質量和用戶留存度。

如下圖所示,橙色表示來源於MNAR數據的用戶評分分布,藍色表示MAR的評分。可以看到,MNAR上用戶的評分要大大偏高,多集中在5分,而MAR的數據較為平均的分布在1到5分之間。隨著時間推進,MNAR的評分分布會越來越集中,加大和MAR評分的差距。

圖1隨機缺失數據和非隨機缺失數據上用戶反饋的偏差

為了解決這個問題,傳統方法多基於inverse propensity score (IPS)來對在MNAR數據上進行模型訓練的目標函數進行加權糾偏。這類方法需要相當數量的隨機試驗 (Randomized Controlled Trials, RCTs),即隨機地將項目推薦給用戶以獲得反饋,從而得到一個無偏的點擊率的估計。而另外,IPS方法需要收集一定數量的RCTs,即對用戶展示相當數量的隨機項目來收集反饋,從經濟效益上來說,會造成大量的收入上的損失。而且,這種施加權重的方法也使得訓練的方差增大,有時候反而會對結果造成副影響。

借鑑信息理論構建模型 推薦系統糾偏方法呈現創新優勢

騰訊天衍實驗室借鑑了資訊理論中的理論來構建模型。模型的原始輸入會先經過一個編碼器 (Encoder)得到表示 (Representation),隨後經過解碼器 (Decoder)將表示解碼成為最終的預測結果。此後,目標函數分為兩部分:輸入和表示之間的互信息,表示和輸入目標之間的互信息。在優化這個目標函數時,騰訊天衍實驗室團隊採用了儘可能攜帶更多的目標信息和壓縮輸入信息的方法。

圖2信息瓶頸的流程和定義形式

首先把原始的輸入 (在此處是user-item對)分為事實域 (factual)和反事實域 (counterfactual)。當在counterfactual中發現無法得到用戶對項目的反饋,無法對模型進行監督學習時,選擇將該問題用信息瓶頸建模,由此得到一個無需反饋也可以在counterfactual上進行學習的目標函數。

圖3基於信息瓶頸理論的反事實學習框架流程圖

factual和counterfactual的事件分別是和,相對應的表示為和。在此基礎上將原有的互信息項拆分,並引入一個超參數,可以得到一個新的考慮counterfactual的信息瓶頸:

這一新的瓶頸將原有的項拆分成了兩個域的對比項加上factual的信息項。源於上式中的互信息項無法直接優化,在將其經過進一步拆解變為可優化的形式後,最終的目標函數形式為:

這一目標函數具有很廣泛的適用範圍,領域內絕大部分的模型均可以適用該目標函數來進行模型糾偏而無需對現有模型結構進行修改,比如MF模型等。

為驗證其應用潛力,騰訊天衍實驗室使用領域內的benchmark Yahoo R3!和 Coat公開數據集進行測試,使用MNAR的數據作為訓練數據,使用MAR作為測試數據,從而能有效反映不同方法對於推薦模型的糾偏效果,最終實驗結果如下表所示。

表格1實驗結果(AUC和MSE指標)

表格2實驗結果 (nDCG指標)

在模型的魯棒性測試中,該方法表現出較強的穩健性。對超參數變化敏感性不強,非常適用於實際場景的部署。相比於傳統推薦系統,這種基於信息理論的推薦系統糾偏方法呈現出幾大創新點:其一,基於資訊理論和反事實理論學習方法,無需執行線上隨機流量試驗,節省了大量訓練成本;其二,模型參數魯棒性較好,適合工業場景實際部署;其三,目標函數具有很廣泛的適用範圍,領域內絕大部分的模型均可以適用該目標函數來進行模型糾偏,而無需對現有模型結構進行修改,兼容性較強。

商業應用無處不在 推薦系統糾偏方法重拾內容多樣性

放眼當下,推薦系統的商業應用無處不在,不少主流APP都應用到了推薦系統。例如,旅遊出行類中,攜程、去哪兒等會推薦機票、酒店等;外賣平臺類中,餓了麼、美團等會推薦飯店;電商購物類中,京東、淘寶、亞馬遜等會推薦「可能喜歡」的物品;新聞資訊類中,今日頭條、騰訊新聞等會推送用戶感興趣的新聞….幾乎所有APP或網站都在應用推薦系統。

騰訊天衍實驗室作為騰訊布局醫療領域背後的技術提供者,主要專注於醫療健康領域的AI算法研究及落地,並且不斷研究與拓展AI醫療技術發展的邊界。目前,騰訊天衍實驗室主要將算法能力輸出到微信支付九宮格的騰訊健康小程序、QQ瀏覽器、微信搜一搜等。例如在疫情期間,天衍實驗室運用AI大數據技術,通過騰訊健康疫情問答推薦版塊,為用戶帶來關於疫情的多方面的內容和諮詢服務,而不僅僅關注用戶個人和集體偏好,基於信息理論模型,快速進行模型訓練對推薦系統進行糾偏,極大的節省了時間和經濟成本。

同時,在騰訊覓影的AI導輔診平臺上,日常的醫療資訊推薦上也應用了該方法為用戶推薦相關內容,大大提升了推薦內容的多樣性和公平性,同時也增強了用戶體驗。比如對於患有糖尿病的患者,其日常關注的內容可能都與糖尿病相關,如果不對推薦系統進行糾偏,系統會越來越傾向於推薦糖尿病相關內容給到用戶,而經過系統糾偏之後,還會給患者推薦一些運動、睡眠等其他健康知識,幫助用戶更加全面的了解自身健康。可以見得,推薦系統糾偏方法具有非常廣泛的應用價值,未來,騰訊天衍實驗室還將繼續擴大其應用範圍,以期為用戶提供更優質的服務。

第三十屆CIO班招生 法國布雷斯特商學院碩士班招生 北達軟EXIN網絡空間與IT安全基礎認證培訓 北達軟EXIN DevOps Professional認證培訓

責編:chenjian

相關焦點

  • 天衍實驗室「糾偏方法」論文入選NeurIPS-2020,幫助用戶躲避海量...
    對此,騰訊天衍實驗室近期另闢蹊徑推出推薦系統糾偏方法,與傳統方法相比,該方法無需執行隨機流量實驗以進行無偏估計,大大減小了無偏推薦算法的訓練成本,降低了系統的路徑依賴。目前,騰訊已經就研究成果發表論文《Information-theoretic counterfactual learning from missing-not-at-random feedback》,且成功入選NeurIPS-2020。
  • 總被系統推薦雷同信息?騰訊天衍實驗室糾偏算法攻克難題
    對此,騰訊天衍實驗室近期另闢蹊徑推出推薦系統糾偏方法,與傳統方法相比,該方法無需執行隨機流量實驗以進行無偏估計,大大減小了無偏推薦算法的訓練成本,降低了系統的路徑依賴。目前,騰訊已經就研究成果發表論文《Information-theoretic counterfactual learning from missing-not-at-random feedback》,且成功入選NeurIPS-2020。
  • MICCAI 2020論文收錄結果揭曉,騰訊天衍實驗室14篇論文入選
    近日,第 23 屆醫學圖像計算和計算機輔助介入國際會議 MICCAI 2020 論文錄用結果揭曉,專注醫療人工智慧與大數據技術研究的騰訊天衍實驗室入選論文 14 篇。騰訊天衍實驗室作為騰訊覓影幕後的算法技術供應團隊之一,主要研究多種機器學習方法在醫學影像臨床中的應用。
  • 騰訊天衍實驗室14篇論文獲MICCAI 2020收錄
    近日,第23屆醫學圖像計算和計算機輔助介入國際會議MICCAI 2020論文錄用結果揭曉,專注醫療人工智慧與大數據技術研究的騰訊天衍實驗室,共計入選14篇論文,較去年入選4篇大幅增加,研究方向涵蓋醫學影像中的分類、分割、檢測、領域自適應等應用場景,實現醫療影像人工智慧技術的全面突破。
  • 騰訊天衍實驗室鄭冶楓:AI抗疫的核心技術復盤
    鄭冶楓表示,騰訊健康小程序抗疫專區上線的15個工具中,天衍實驗室參與了5項,包括疫情知識問答、患者同小區、發熱自查、發熱門診、口罩攻略。在疫情問答中,天衍實驗室利用自研LTD-BERT模型識別用戶意圖,把推理速度提高了40倍,滿足上線大流量需求,理解用戶意圖以後做問答匹配,精準地給用戶提供疫情信息。
  • 百度多篇論文入選NeurIPS 2020,機器學習領先算法、理論「強輸出」
    近日,NeurIPS 2020(Neural Information Processing Systems Annual Meeting,神經信息處理系統年會)落下帷幕,作為人工智慧和機器學習領域的國際頂級會議,NeurIPS
  • GPT-3獲NeurIPS最佳論文獎,華人學者獲經典論文獎
    本文進一步將分析擴展到獲得Nyström方法的保證。關於NeurIPS 2020今年NeurIPS共收到9454篇論文投稿,1900篇被接收,論文接收率僅為20.09%。在今年投稿的機構學校中,谷歌以169篇入選位居第一,清華大學和北京大學分別有63篇、37篇被接收。
  • 深度圖高斯過程 | NeurIPS 2020論文分享第一期
    高斯過程是概率機器學習中的核心方法,憑藉其良好的解析性質和出色的不確定性建模能力,被廣泛應用於各類機器學習問題。採用深度學習層次化建模範式的「深度高斯過程」則進一步增強了其建模能力,拓寬了其應用範圍。然而,絕大多數現有方法不能很好的擴展到圖結構數據。
  • 騰訊天衍實驗室聯合微眾銀行研發醫療聯邦學習,讓腦卒中預測準確率...
    智東西4月20日消息,近日,騰訊天衍實驗室與微眾銀行共同研究表明,將聯邦學習與醫療深度融合對落地疾病預測領域有重大幫助。目前其已搭建基於聯邦學習技術的大數據集中與挖掘平臺,從落地案例來看,可將腦卒中預測準確率提升至80%。
  • 直播預告丨騰訊天衍實驗室主任鄭冶楓:AI助力全民抗疫經典案例分享
    3月27日,雷鋒網邀請到騰訊天衍實驗室主任鄭冶楓,為我們分享騰訊天衍實驗室以人工智慧技術為工具,助力全民抗疫的經典案例,包括疫情趨勢預測、肺炎智能問答、發熱AI自查、患者蹤跡查詢、CT新冠AI輔助診斷等。後續雷鋒網公開課將繼續帶來一系列AI醫療課程分享,邀請一線醫療科技企業的資深高管做客,進行更深入的案例詳解和技術乾貨。如何聽課?
  • 西電本科生在國際頂級會議NeurIPS2020發表論文
    近日,國際人工智慧頂級會議NeurIPS2020(Conference and Workshop on Neural Information Processing Systems,神經信息處理系統大會)官方發布了接受論文列表。
  • 創新工場「數據下毒」論文入選NeurIPS 2019,AI安全問題需要引起...
    創新工場 AI 工程院為此專門成立了 AI 安全實驗室,針對人工智慧系統的安全性,進行了深入對評估和研究。馮霽: 目前防護的技術還處於較為初期的情況,類似於網絡安全,不存在一個包治百病的「疫苗」,對於人工智慧企業,我們建議需要建立專門的安全團隊,對自家的系統進行全方位的保護。問:目前有沒有利用這個方法實際去挖掘無人駕駛系統等領域的漏洞(類似科恩實驗室成功攻擊特斯拉系統那樣)?
  • 杭州灣智慧谷北大信研究院情感智慧機器人實驗室學術論文入選IROS
    浙江省北大信息技術高等研究院情感智慧機器人實驗室撰寫的學術論文「Making Robots Draw A Vivid Portrait In Two Minutes」,被2020年的IEEE\RSJ智慧機器人與系統國際會議IROS
  • 17篇論文,詳解圖的機器學習趨勢 | NeurIPS 2019
    前一篇論文主要研究了節點分類和連接預測任務,相比於歐氏空間中的方法大大降低了錯誤率,在Gromov雙曲性分數較低(圖和樹結構的相似度)的數據集上表現尤其好。後一篇論文關注的重點是圖分類任務。作者還用最大最小熵方法來優化模型,這招很聰明(但是很少見到有人用)。但缺點就是拓展性不好,作者只在很小的數據集上做了實驗,然後他表示後續研究要解決的一大挑戰就是拓展性問題。
  • 刷新濾波器剪枝的SOTA效果,騰訊優圖論文入選NeurIPS2020
    本文轉自【TechWeb】;近日,騰訊優圖實驗室在模型壓縮任務中獲得創新性突破,提出的基於濾波器骨架的逐條剪枝算法(Stripe-Wise Pruning,SWP),刷新了濾波器剪枝的SOTA效果。相關論文(Pruning Filter in Filter)已被機器學習領域的國際頂級會議Conference on Neural Information Processing Systems(NeurIPS 2020)收錄。神經網絡的具有結構和參數這兩個屬性,這兩個屬性都具有重要意義。本文指出神經網絡的濾波器除了通常使用的參數屬性以外,還有一種形狀屬性。
  • 糾偏系統如何測化學反應速率的速度?
    糾偏系統這個行業也是日漸壯大,這都要得益於糾偏系統的應用範圍及它的產品特性。易於理解和操作自動設置 - 自動配置控制器,優化性能直觀的菜單布局 - 減少操作的混亂和潛在的停機時間高動態響應。那麼絕大部分糾偏系統的優點已經被各大廠家挖掘得差不多了,那麼又有客戶想用糾偏系統來測試化學反應速率的速度。了解化學變化時快時慢,有機化學上放反應速率來考量化學變化的速度。
  • ACM MM 2020|Rokid人機互動系統論文入選Oral Paper
    近日,Rokid 視覺算法團隊提出的基於 Rokid Glass 的新型人機互動系統論文 ARSketch 入選了 ACM Multimedia 2020(以下簡稱為 ACM MM),並被選作口頭報告(Oral Presentation),此類論文僅佔總投稿數的 8.9%。
  • NeurIPS 2019 程序委員會主席發聲明:19 篇論文因一稿多投被拒收!
    正如我們在徵文啟事(https://neurips.cc/Conferences/2019/CallForPapers?source=post_page)中所討論的,NeurIPS 會與其它會議協作,從而甄別出一稿兩投現象。這些會議在主題領域和審稿期間上都與 NeurIPS 有所重疊。我們希望 NeurIPS 會議的內容是原創且新穎的。
  • 阿里巴巴18篇論文入選機器學習頂會KDD 2020
    5月25日,國際機器學習頂會KDD 2020公布了論文入選結果,阿里巴巴18篇論文入選,是近幾年KDD會議論文入選數量最多的科技公司之一。據介紹,18篇論文中,涵蓋阿里巴巴在認知智能、曝光偏差、圖表示學習等前沿AI領域的研究突破。
  • 《天衍錄》全新五大戰場,星域戰火再次燃起!
    《天衍錄》全新五大戰場,星域戰火再次燃起!《天衍錄》新資料片「星域激戰」震撼來襲, 12月15日新服【雙魚座】將為玩家們帶來最激烈暢爽的戰鬥體驗,明天即開啟預創建!本次「星域激戰」資料片中囊括了從激戰到日常的全方位玩法更新,不但推出了全新的五大戰場和策略型副本,更將日常活動進行了全面革新,各種高收益玩法層出不窮!此外更有海量福利回饋玩家,為你開啟星域的狂歡盛會!