天衍實驗室「糾偏方法」論文入選NeurIPS-2020,幫助用戶躲避海量...

2020-12-03 愛雲資訊

在我們瀏覽各大網站和APP時,受推薦系統影響,大量相似產品反覆出現的情況屢見不鮮,這不僅會產生視覺疲勞,而且很難讓我們做出理性的判斷和購買決策。究其原因,主要是目前主流的推薦系統採用的都是大數據模型篩查方式,會產生較大的路徑依賴。

對此,騰訊天衍實驗室近期另闢蹊徑推出推薦系統糾偏方法,與傳統方法相比,該方法無需執行隨機流量實驗以進行無偏估計,大大減小了無偏推薦算法的訓練成本,降低了系統的路徑依賴。目前,騰訊已經就研究成果發表論文《Information-theoretic counterfactual learning from missing-not-at-random feedback》,且成功入選NeurIPS-2020。

傳統推薦系統易導致路徑依賴 致使推薦質量下降

作為現代網際網路領域的重點研究方向,推薦系統具有相當高的商業價值。推薦系統模型需要在大量的候選項目中(通常為廣告、商品、短視頻等)尋找到用戶所喜愛的,從而提高曝光率或者點擊廣告收入。

傳統推薦系統研究一般著眼於設計更好的特徵交叉方法以提高CTR預估的準確性,從而給出更好的排序結果,提高廣告收入。通常,用戶看到的物品是推薦系統挑選出來的,它們在系統中產生了存儲記錄,推薦模型在該記錄上進行離線更新。然而已有的研究顯示,這種推薦方式會產生路徑依賴,即模型會在得到曝光的項目上嚴重高估其對每個用戶的偏好程度,而會在未得到曝光的項目中低估其對每個用戶的偏好程度。長此以往,推薦結果的多樣性將會急劇降低,從而危害推薦的質量和用戶留存度。

如下圖所示,橙色表示來源於MNAR數據的用戶評分分布,藍色表示MAR的評分。可以看到,MNAR上用戶的評分要大大偏高,多集中在5分,而MAR的數據較為平均的分布在1到5分之間。隨著時間推進,MNAR的評分分布會越來越集中,加大和MAR評分的差距。

圖 1 隨機缺失數據和非隨機缺失數據上用戶反饋的偏差

為了解決這個問題,傳統方法多基於inverse propensity score (IPS) 來對在MNAR數據上進行模型訓練的目標函數進行加權糾偏。這類方法需要相當數量的隨機試驗 (Randomized Controlled Trials, RCTs),即隨機地將項目推薦給用戶以獲得反饋,從而得到一個無偏的點擊率的估計。而另外,IPS方法需要收集一定數量的RCTs,即對用戶展示相當數量的隨機項目來收集反饋,從經濟效益上來說,會造成大量的收入上的損失。而且,這種施加權重的方法也使得訓練的方差增大,有時候反而會對結果造成副影響。

借鑑信息理論構建模型 推薦系統糾偏方法呈現創新優勢

騰訊天衍實驗室借鑑了資訊理論中的理論來構建模型。模型的原始輸入會先經過一個編碼器 (Encoder) 得到表示 (Representation),隨後經過解碼器 (Decoder) 將表示解碼成為最終的預測結果。此後,目標函數分為兩部分:輸入和表示之間的互信息,表示和輸入目標之間的互信息。在優化這個目標函數時,騰訊天衍實驗室團隊採用了儘可能攜帶更多的目標信息和壓縮輸入信息的方法。

圖 2 信息瓶頸的流程和定義形式

首先把原始的輸入 (在此處是user-item對) 分為事實域 (factual) 和反事實域 (counterfactual) 。當在counterfactual中發現無法得到用戶對項目的反饋,無法對模型進行監督學習時,選擇將該問題用信息瓶頸建模,由此得到一個無需反饋也可以在counterfactual上進行學習的目標函數。

圖 3 基於信息瓶頸理論的反事實學習框架流程圖

factual和counterfactual的事件分別是和,相對應的表示為和。在此基礎上將原有的互信息項拆分,並引入一個超參數,可以得到一個新的考慮counterfactual的信息瓶頸:

這一新的瓶頸將原有的項拆分成了兩個域的對比項加上factual的信息項。源於上式中的互信息項無法直接優化,在將其經過進一步拆解變為可優化的形式後,最終的目標函數形式為:

這一目標函數具有很廣泛的適用範圍,領域內絕大部分的模型均可以適用該目標函數來進行模型糾偏而無需對現有模型結構進行修改,比如MF模型等。

為驗證其應用潛力,騰訊天衍實驗室使用領域內的benchmark Yahoo R3! 和 Coat 公開數據集進行測試,使用MNAR的數據作為訓練數據,使用MAR作為測試數據,從而能有效反映不同方法對於推薦模型的糾偏效果,最終實驗結果如下表所示。

表格 1 實驗結果(AUC和MSE指標)

表格 2 實驗結果 (nDCG指標)

在模型的魯棒性測試中,該方法表現出較強的穩健性。對超參數變化敏感性不強,非常適用於實際場景的部署。相比於傳統推薦系統,這種基於信息理論的推薦系統糾偏方法呈現出幾大創新點:其一,基於資訊理論和反事實理論學習方法,無需執行線上隨機流量試驗,節省了大量訓練成本;其二,模型參數魯棒性較好,適合工業場景實際部署;其三,目標函數具有很廣泛的適用範圍,領域內絕大部分的模型均可以適用該目標函數來進行模型糾偏,而無需對現有模型結構進行修改,兼容性較強。

商業應用無處不在 推薦系統糾偏方法重拾內容多樣性

放眼當下,推薦系統的商業應用無處不在,不少主流APP都應用到了推薦系統。例如,旅遊出行類中,攜程、去哪兒等會推薦機票、酒店等;外賣平臺類中,餓了麼、美團等會推薦飯店;電商購物類中,京東、淘寶、亞馬遜等會推薦「可能喜歡」的物品;新聞資訊類中,今日頭條、騰訊新聞等會推送用戶感興趣的新聞....幾乎所有APP或網站都在應用推薦系統。

騰訊天衍實驗室作為騰訊布局醫療領域背後的技術提供者,主要專注於醫療健康領域的AI算法研究及落地,並且不斷研究與拓展AI醫療技術發展的邊界。目前,騰訊天衍實驗室主要將算法能力輸出到微信支付九宮格的騰訊健康小程序、QQ瀏覽器、微信搜一搜等。例如在疫情期間,天衍實驗室運用AI大數據技術,通過騰訊健康疫情問答推薦版塊,為用戶帶來關於疫情的多方面的內容和諮詢服務,而不僅僅關注用戶個人和集體偏好,基於信息理論模型,快速進行模型訓練對推薦系統進行糾偏,極大的節省了時間和經濟成本。

同時,在騰訊覓影的AI導輔診平臺上,日常的醫療資訊推薦上也應用了該方法為用戶推薦相關內容,大大提升了推薦內容的多樣性和公平性,同時也增強了用戶體驗。比如對於患有糖尿病的患者,其日常關注的內容可能都與糖尿病相關,如果不對推薦系統進行糾偏,系統會越來越傾向於推薦糖尿病相關內容給到用戶,而經過系統糾偏之後,還會給患者推薦一些運動、睡眠等其他健康知識,幫助用戶更加全面的了解自身健康。可以見得,推薦系統糾偏方法具有非常廣泛的應用價值,未來,騰訊天衍實驗室還將繼續擴大其應用範圍,以期為用戶提供更優質的服務。

相關焦點

  • 天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020
    天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020 天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020 2020-12-02 10:05:29  來源:DOIT
  • 騰訊天衍實驗室糾偏算法攻克難題
    對此,騰訊天衍實驗室近期另闢蹊徑推出推薦系統糾偏方法,與傳統方法相比,該方法無需執行隨機流量實驗以進行無偏估計,大大減小了無偏推薦算法的訓練成本,降低了系統的路徑依賴。目前,騰訊已經就研究成果發表論文《Information-theoretic counterfactual learning from missing-not-at-random feedback》,且成功入選NeurIPS-2020。
  • MICCAI 2020論文收錄結果揭曉,騰訊天衍實驗室14篇論文入選
    近日,第 23 屆醫學圖像計算和計算機輔助介入國際會議 MICCAI 2020 論文錄用結果揭曉,專注醫療人工智慧與大數據技術研究的騰訊天衍實驗室入選論文 14 篇。騰訊天衍實驗室作為騰訊覓影幕後的算法技術供應團隊之一,主要研究多種機器學習方法在醫學影像臨床中的應用。
  • 騰訊天衍實驗室14篇論文獲MICCAI 2020收錄
    近日,第23屆醫學圖像計算和計算機輔助介入國際會議MICCAI 2020論文錄用結果揭曉,專注醫療人工智慧與大數據技術研究的騰訊天衍實驗室,共計入選14篇論文,較去年入選4篇大幅增加,研究方向涵蓋醫學影像中的分類、分割、檢測、領域自適應等應用場景,實現醫療影像人工智慧技術的全面突破。
  • 騰訊天衍實驗室鄭冶楓:AI抗疫的核心技術復盤
    鄭冶楓表示,騰訊健康小程序抗疫專區上線的15個工具中,天衍實驗室參與了5項,包括疫情知識問答、患者同小區、發熱自查、發熱門診、口罩攻略。在疫情問答中,天衍實驗室利用自研LTD-BERT模型識別用戶意圖,把推理速度提高了40倍,滿足上線大流量需求,理解用戶意圖以後做問答匹配,精準地給用戶提供疫情信息。
  • 深度圖高斯過程 | NeurIPS 2020論文分享第一期
    高斯過程是概率機器學習中的核心方法,憑藉其良好的解析性質和出色的不確定性建模能力,被廣泛應用於各類機器學習問題。採用深度學習層次化建模範式的「深度高斯過程」則進一步增強了其建模能力,拓寬了其應用範圍。然而,絕大多數現有方法不能很好的擴展到圖結構數據。
  • GPT-3獲NeurIPS最佳論文獎,華人學者獲經典論文獎
    本文進一步將分析擴展到獲得Nyström方法的保證。關於NeurIPS 2020今年NeurIPS共收到9454篇論文投稿,1900篇被接收,論文接收率僅為20.09%。在今年投稿的機構學校中,谷歌以169篇入選位居第一,清華大學和北京大學分別有63篇、37篇被接收。
  • 百度多篇論文入選NeurIPS 2020,機器學習領先算法、理論「強輸出」
    (百度研究院多篇論文入選NeurIPS 2020)  首先,論文《Thunder: a Fast Coordinate Selection Solver for Sparse Learning目前,已在一系列大數據集上的實驗結果證明了方法的有效性。如下圖所示,在Finance數據集上,百度提出的新方法比現有最佳方法在效率優化上有巨大的提升。
  • 騰訊天衍實驗室聯合微眾銀行研發醫療聯邦學習,讓腦卒中預測準確率...
    智東西4月20日消息,近日,騰訊天衍實驗室與微眾銀行共同研究表明,將聯邦學習與醫療深度融合對落地疾病預測領域有重大幫助。目前其已搭建基於聯邦學習技術的大數據集中與挖掘平臺,從落地案例來看,可將腦卒中預測準確率提升至80%。
  • 宇宙星域浩瀚激戰,《天衍錄》新服今日開啟
    只要登錄《天衍錄》新服【水瓶座】暢玩遊戲,即可有機會搶到豪華版iPhone X,頂配手機抱回家!還可抽取頂級筆記本電腦和高端遊戲設備!零門檻高概率,你心動了嗎!暢遊星域必得海量超值道具,絕版時裝助你酷爆全場!拒絕孤單!更有坐騎萌寵與你一同激情酣戰星域!
  • 《天衍錄》全新五大戰場,星域戰火再次燃起!
    《天衍錄》全新五大戰場,星域戰火再次燃起!《天衍錄》新資料片「星域激戰」震撼來襲, 12月15日新服【雙魚座】將為玩家們帶來最激烈暢爽的戰鬥體驗,明天即開啟預創建!本次「星域激戰」資料片中囊括了從激戰到日常的全方位玩法更新,不但推出了全新的五大戰場和策略型副本,更將日常活動進行了全面革新,各種高收益玩法層出不窮!此外更有海量福利回饋玩家,為你開啟星域的狂歡盛會!
  • 直播預告丨騰訊天衍實驗室主任鄭冶楓:AI助力全民抗疫經典案例分享
    3月27日,雷鋒網邀請到騰訊天衍實驗室主任鄭冶楓,為我們分享騰訊天衍實驗室以人工智慧技術為工具,助力全民抗疫的經典案例,包括疫情趨勢預測、肺炎智能問答、發熱AI自查、患者蹤跡查詢、CT新冠AI輔助診斷等。後續雷鋒網公開課將繼續帶來一系列AI醫療課程分享,邀請一線醫療科技企業的資深高管做客,進行更深入的案例詳解和技術乾貨。如何聽課?
  • 17篇論文,詳解圖的機器學習趨勢 | NeurIPS 2019
    前一篇論文主要研究了節點分類和連接預測任務,相比於歐氏空間中的方法大大降低了錯誤率,在Gromov雙曲性分數較低(圖和樹結構的相似度)的數據集上表現尤其好。後一篇論文關注的重點是圖分類任務。作者還用最大最小熵方法來優化模型,這招很聰明(但是很少見到有人用)。但缺點就是拓展性不好,作者只在很小的數據集上做了實驗,然後他表示後續研究要解決的一大挑戰就是拓展性問題。
  • 西電本科生在國際頂級會議NeurIPS2020發表論文
    通信工程學院2016級本科生夏曉波作為第一作者撰寫的論文「Parts-dependent Label Noise: Towards Instance-dependent Label Noise」被該會議全文錄用,併入選Spotlight,將在大會上作口頭報告。
  • 數字新基建:用AI幫助人們整理海量的論文
    卡內基梅隆大學軟體研究所的投資者,企業家、兼職教授Ganesh Mani和艾倫AI研究所的博士後研究員湯姆·霍普(Tom Hope)認為,科學界論文數量井噴,僅僅依靠研究者本身的精力很難完全跟上相關領域的發展,需要有新方法來幫助人們對這些信息進行篩選,潛在的解決方案包括將人類專業知識與AI相結合的一種方法
  • 創新工場「數據下毒」論文入選NeurIPS 2019,AI安全問題需要引起...
    問:目前有沒有利用這個方法實際去挖掘無人駕駛系統等領域的漏洞(類似科恩實驗室成功攻擊特斯拉系統那樣)?王詠剛:這個不算很難,其實有不少技術強的研究機構或實驗室都可以做出類似的結果。創新工場 2019 年廣泛開展科研合作,與其他國際科研機構合作的論文在多項國際頂級會議中嶄露頭角,除上述介紹的「數據下毒」論文入選 NeurlPS 之外,還有 8 篇收錄至五大學術頂會。
  • 騰訊英語君INTERSPEECH 2020展鋒芒,5篇英語口語評測成果論文入選
    近日,被譽為全球最具影響力的語音行業會議的INTERSPEECH揭曉收錄論文名單,騰訊英語君共有5篇口語測評論文入選,涵蓋準確度模型、韻律聲學探測、ASR文本後處理、共振峰預測等技術優化,名列國內企業前茅。
  • 阿里巴巴18篇論文入選機器學習頂會KDD 2020
    5月25日,國際機器學習頂會KDD 2020公布了論文入選結果,阿里巴巴18篇論文入選,是近幾年KDD會議論文入選數量最多的科技公司之一。據介紹,18篇論文中,涵蓋阿里巴巴在認知智能、曝光偏差、圖表示學習等前沿AI領域的研究突破。
  • 刷新濾波器剪枝的SOTA效果,騰訊優圖論文入選NeurIPS2020
    本文轉自【TechWeb】;近日,騰訊優圖實驗室在模型壓縮任務中獲得創新性突破,提出的基於濾波器骨架的逐條剪枝算法(Stripe-Wise Pruning,SWP),刷新了濾波器剪枝的SOTA效果。相關論文(Pruning Filter in Filter)已被機器學習領域的國際頂級會議Conference on Neural Information Processing Systems(NeurIPS 2020)收錄。神經網絡的具有結構和參數這兩個屬性,這兩個屬性都具有重要意義。本文指出神經網絡的濾波器除了通常使用的參數屬性以外,還有一種形狀屬性。
  • CVPR 2020商湯斬獲3冠!62篇論文入選,算法工廠憑什麼領跑行業?
    魚羊 發自 凹非寺量子位 報導 | 公眾號 QbitAI「視覺實力秀」,CVPR 2020 正在線上舉辦中。本屆 CVPR 號稱十年來最難的一屆,共接收 6656 篇論文,中選 1470 篇,錄用率僅為 22%,為十年來最低的一次。不過,中國軍團依然表現亮眼。學術界清華領銜,商湯則以62 篇論文入選的成績,領跑產業界。