總被系統推薦雷同信息?騰訊天衍實驗室糾偏算法攻克難題

2020-12-05 比特網

在我們瀏覽各大網站和APP時,受推薦系統影響,大量相似產品反覆出現的情況屢見不鮮,這不僅會產生視覺疲勞,而且很難讓我們做出理性的判斷和購買決策。究其原因,主要是目前主流的推薦系統採用的都是大數據模型篩查方式,會產生較大的路徑依賴。


對此,騰訊天衍實驗室近期另闢蹊徑推出推薦系統糾偏方法,與傳統方法相比,該方法無需執行隨機流量實驗以進行無偏估計,大大減小了無偏推薦算法的訓練成本,降低了系統的路徑依賴。目前,騰訊已經就研究成果發表論文《Information-theoretic counterfactual learning from missing-not-at-random feedback》,且成功入選NeurIPS-2020。


傳統推薦系統易導致路徑依賴 致使推薦質量下降


作為現代網際網路領域的重點研究方向,推薦系統具有相當高的商業價值。推薦系統模型需要在大量的候選項目中(通常為廣告、商品、短視頻等)尋找到用戶所喜愛的,從而提高曝光率或者點擊廣告收入。


傳統推薦系統研究一般著眼於設計更好的特徵交叉方法以提高CTR預估的準確性,從而給出更好的排序結果,提高廣告收入。通常,用戶看到的物品是推薦系統挑選出來的,它們在系統中產生了存儲記錄,推薦模型在該記錄上進行離線更新。然而已有的研究顯示,這種推薦方式會產生路徑依賴,即模型會在得到曝光的項目上嚴重高估其對每個用戶的偏好程度,而會在未得到曝光的項目中低估其對每個用戶的偏好程度。長此以往,推薦結果的多樣性將會急劇降低,從而危害推薦的質量和用戶留存度。


如下圖所示,橙色表示來源於MNAR數據的用戶評分分布,藍色表示MAR的評分。可以看到,MNAR上用戶的評分要大大偏高,多集中在5分,而MAR的數據較為平均的分布在1到5分之間。隨著時間推進,MNAR的評分分布會越來越集中,加大和MAR評分的差距。


圖 1 隨機缺失數據和非隨機缺失數據上用戶反饋的偏差


為了解決這個問題,傳統方法多基於inverse propensity score (IPS) 來對在MNAR數據上進行模型訓練的目標函數進行加權糾偏。這類方法需要相當數量的隨機試驗 (Randomized Controlled Trials, RCTs),即隨機地將項目推薦給用戶以獲得反饋,從而得到一個無偏的點擊率的估計。而另外,IPS方法需要收集一定數量的RCTs,即對用戶展示相當數量的隨機項目來收集反饋,從經濟效益上來說,會造成大量的收入上的損失。而且,這種施加權重的方法也使得訓練的方差增大,有時候反而會對結果造成副影響。


借鑑信息理論構建模型 推薦系統糾偏方法呈現創新優勢


騰訊天衍實驗室借鑑了資訊理論中的理論來構建模型。模型的原始輸入會先經過一個編碼器 (Encoder) 得到表示 (Representation),隨後經過解碼器 (Decoder) 將表示解碼成為最終的預測結果。此後,目標函數分為兩部分:輸入和表示之間的互信息,表示和輸入目標之間的互信息。在優化這個目標函數時,騰訊天衍實驗室團隊採用了儘可能攜帶更多的目標信息和壓縮輸入信息的方法。


圖 2 信息瓶頸的流程和定義形式


首先把原始的輸入 (在此處是user-item對) 分為事實域 (factual) 和反事實域 (counterfactual) 。當在counterfactual中發現無法得到用戶對項目的反饋,無法對模型進行監督學習時,選擇將該問題用信息瓶頸建模,由此得到一個無需反饋也可以在counterfactual上進行學習的目標函數。


圖 3 基於信息瓶頸理論的反事實學習框架流程圖


factual和counterfactual的事件分別是和,相對應的表示為和。在此基礎上將原有的互信息項拆分,並引入一個超參數,可以得到一個新的考慮counterfactual的信息瓶頸:



這一新的瓶頸將原有的項拆分成了兩個域的對比項加上factual的信息項。源於上式中的互信息項無法直接優化,在將其經過進一步拆解變為可優化的形式後,最終的目標函數形式為:



這一目標函數具有很廣泛的適用範圍,領域內絕大部分的模型均可以適用該目標函數來進行模型糾偏而無需對現有模型結構進行修改,比如MF模型等。


為驗證其應用潛力,騰訊天衍實驗室使用領域內的benchmark Yahoo R3! 和 Coat 公開數據集進行測試,使用MNAR的數據作為訓練數據,使用MAR作為測試數據,從而能有效反映不同方法對於推薦模型的糾偏效果,最終實驗結果如下表所示。


表格 1 實驗結果(AUC和MSE指標)


表格 2 實驗結果 (nDCG指標)


在模型的魯棒性測試中,該方法表現出較強的穩健性。對超參數變化敏感性不強,非常適用於實際場景的部署。相比於傳統推薦系統,這種基於信息理論的推薦系統糾偏方法呈現出幾大創新點:其一,基於資訊理論和反事實理論學習方法,無需執行線上隨機流量試驗,節省了大量訓練成本;其二,模型參數魯棒性較好,適合工業場景實際部署;其三,目標函數具有很廣泛的適用範圍,領域內絕大部分的模型均可以適用該目標函數來進行模型糾偏,而無需對現有模型結構進行修改,兼容性較強。


商業應用無處不在 推薦系統糾偏方法重拾內容多樣性


放眼當下,推薦系統的商業應用無處不在,不少主流APP都應用到了推薦系統。例如,旅遊出行類中,攜程、去哪兒等會推薦機票、酒店等;外賣平臺類中,餓了麼、美團等會推薦飯店;電商購物類中,京東、淘寶、亞馬遜等會推薦「可能喜歡」的物品;新聞資訊類中,今日頭條、騰訊新聞等會推送用戶感興趣的新聞....幾乎所有APP或網站都在應用推薦系統。


騰訊天衍實驗室作為騰訊布局醫療領域背後的技術提供者,主要專注於醫療健康領域的AI算法研究及落地,並且不斷研究與拓展AI醫療技術發展的邊界。目前,騰訊天衍實驗室主要將算法能力輸出到微信支付九宮格的騰訊健康小程序、QQ瀏覽器、微信搜一搜等。例如在疫情期間,天衍實驗室運用AI大數據技術,通過騰訊健康疫情問答推薦版塊,為用戶帶來關於疫情的多方面的內容和諮詢服務,而不僅僅關注用戶個人和集體偏好,基於信息理論模型,快速進行模型訓練對推薦系統進行糾偏,極大的節省了時間和經濟成本。


同時,在騰訊覓影的AI導輔診平臺上,日常的醫療資訊推薦上也應用了該方法為用戶推薦相關內容,大大提升了推薦內容的多樣性和公平性,同時也增強了用戶體驗。比如對於患有糖尿病的患者,其日常關注的內容可能都與糖尿病相關,如果不對推薦系統進行糾偏,系統會越來越傾向於推薦糖尿病相關內容給到用戶,而經過系統糾偏之後,還會給患者推薦一些運動、睡眠等其他健康知識,幫助用戶更加全面的了解自身健康。可以見得,推薦系統糾偏方法具有非常廣泛的應用價值,未來,騰訊天衍實驗室還將繼續擴大其應用範圍,以期為用戶提供更優質的服務。

類型:廣告

免責聲明:以上內容為本網站轉自其它媒體,相關信息僅為傳遞更多信息之目的,不代表本網觀點,亦不代表本網站贊同其觀點或證實其內容的真實性。

相關焦點

  • 天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020
    天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020 天衍實驗室推薦系統糾偏方法論文入選NeurIPS-2020 2020-12-02 10:05:29  來源:DOIT
  • 天衍實驗室「糾偏方法」論文入選NeurIPS-2020,幫助用戶躲避海量...
    對此,騰訊天衍實驗室近期另闢蹊徑推出推薦系統糾偏方法,與傳統方法相比,該方法無需執行隨機流量實驗以進行無偏估計,大大減小了無偏推薦算法的訓練成本,降低了系統的路徑依賴。借鑑信息理論構建模型 推薦系統糾偏方法呈現創新優勢騰訊天衍實驗室借鑑了資訊理論中的理論來構建模型。模型的原始輸入會先經過一個編碼器 (Encoder) 得到表示 (Representation),隨後經過解碼器 (Decoder) 將表示解碼成為最終的預測結果。
  • 騰訊天衍實驗室14篇論文獲MICCAI 2020收錄
    在此次入選MICCAI 2020的論文中,作為騰訊覓影幕後的算法技術供應團隊之一,騰訊天衍實驗室基於醫學影像臨床應用中的多種場景,對多種機器學習方法展開了創新性研究,有望加速AI在醫療健康領域的實踐進程。
  • 騰訊天衍實驗室鄭冶楓:AI抗疫的核心技術復盤
    近期,雷鋒網AI掘金志邀請騰訊天衍實驗室主任鄭冶楓,做客雷鋒網公開課,以「騰訊抗疫故事」為題,對騰訊兩個月相繼做出的健康小程序、新冠肺炎CT輔助診斷、肺炎疫情趨勢三個產品做出了技術分享。
  • MICCAI 2020論文收錄結果揭曉,騰訊天衍實驗室14篇論文入選
    近日,第 23 屆醫學圖像計算和計算機輔助介入國際會議 MICCAI 2020 論文錄用結果揭曉,專注醫療人工智慧與大數據技術研究的騰訊天衍實驗室入選論文 14 篇。騰訊天衍實驗室作為騰訊覓影幕後的算法技術供應團隊之一,主要研究多種機器學習方法在醫學影像臨床中的應用。
  • 騰訊天衍實驗室聯合微眾銀行研發醫療聯邦學習,讓腦卒中預測準確率...
    智東西4月20日消息,近日,騰訊天衍實驗室與微眾銀行共同研究表明,將聯邦學習與醫療深度融合對落地疾病預測領域有重大幫助。目前其已搭建基於聯邦學習技術的大數據集中與挖掘平臺,從落地案例來看,可將腦卒中預測準確率提升至80%。
  • 直播預告丨騰訊天衍實驗室主任鄭冶楓:AI助力全民抗疫經典案例分享
    《我們對騰訊「戰疫」實情一無所知》,講述了騰訊健康部分產品線的戰役實錄。而這兩個月以來,騰訊相繼推出「發熱門診地圖」、「在線問診」、「AI輔助診斷新冠肺炎解決方案」、「騰訊防疫健康碼」等多項抗疫工具。2月21日,搭載騰訊AI醫學影像和騰訊雲技術的「騰訊覓影」在湖北方艙醫院成功部署。除擁有3690張床位的武漢日海方艙醫院之外,首批設備也落地武漢協和西院和洪湖市人民醫院。而「騰訊覓影」可以在患者CT檢查後最快2秒就能完成AI模式識別,1分鐘內即可為醫生提供輔助診斷參考。
  • 徐健學:三十餘載初衷不移,矢志攻克算法難題
    徐健學:三十餘載初衷不移,矢志攻克算法難題 2020-11-02 12:09 來源:澎湃新聞·澎湃號·政務
  • 三維家與中國科大共建聯合實驗室 產學研一體攻克家居產業數位化難題
    其中,長期「靠天吃飯、靠地面人流吃飯」的家居行業更是深受其害。疫情之下,家居行業長期的粗放式發展、過度的線下賣場依賴帶來的經濟增長乏力等問題,也進一步暴露,而價值4.6萬億的家居行業,歷來也被看作數位化轉型最難攻堅的製造行業。
  • 騰訊安全雲鼎實驗室利用騰訊安全自主研發的系統到底是什麼
    在人工智慧、物聯網、雲計算、移動網際網路、大數據等信息科技的洪流湧動下,在全球傳統的pc企業和運營商乃至是像工業網際網路、智能製造等正在蓬勃發展的企業,都在尋求更加精準和智能的作業系統。anyway,開放公平、無障礙化、智能化的作業系統在當下已經不是夢。
  • 騰訊孫國政:大數據挖掘和推薦算法最新進展
    騰訊首席科學家孫國政做了主題為「超大規模用戶數據挖掘和推薦算法最新進展」的主題演講。我們下面有請騰訊首席科學家孫國政給我們介紹超大規模用戶數據挖掘和推薦算法最新進展。孫國政:大家好,我來自騰訊公司,我今天演講的題目是超大規模用戶數據挖掘和推薦算法最新進展,並且從KDD—CUP2012談起。剛才講到國際會議好多高手都參加,現在這個世界是一個網際網路時代,也可以說是一個大數據時代。
  • 量子算法(每日一學)
    美國阿貢國家實驗室證明一臺計算機原則上可以純粹的量子力學方式運行。    量子(quantum)的疊加性和相干性原理具有計算能力。經典比特是由宏觀體系的物理量表徵的。兩個經典比特只有4個二進位數(00、01、10、11)中的一個。而量子比特則有微觀體系表徵,如原子、核自旋或光子等,存在多個疊加態。
  • 深圳市商用密碼行業協會攜手騰訊安全 打造國內首家雲端密碼應用...
    騰訊作為大會協辦方,承辦了公有雲安全專場。期間,騰訊安全聯合深圳市商用密碼行業協會成立的「鼎雲密碼應用聯合實驗室」(以下簡稱「聯合實驗室」)正式揭牌。這是國內首家聚焦雲端密碼應用的聯合實驗室,致力於推動雲計算平臺密碼應用,促進密碼應用的合規、正確和有效。
  • 解讀騰訊優圖ICCV2017 12篇論文:全球首個AI卸妝效果的算法等
    今年,即將於2017年11月8日在北京國家會議中心舉辦的AI World 2017世界人工智慧大會上,我們請到了騰訊優圖實驗室傑出科學家賈佳亞教授發表演講。 想了解更多關於騰訊優圖和計算機視覺的前沿動態?點擊文末閱讀原文,馬上參會!
  • 奧林帕斯懸紅:攻克數據存儲世界級難題的詩與遠方
    在攻克數據存儲世界級難題上,華為是極為認真和有卓越追求的。 去年底,華為發布了針對數據存儲世界級難題的奧林帕斯懸紅,聚焦實現『自動駕駛的數據全生命周期治理』和構建『每比特極致性價比的數據存儲』,鼓勵全球科研工作者攻克數據基礎設施難題。
  • 糾偏系統如何測化學反應速率的速度?
    糾偏系統這個行業也是日漸壯大,這都要得益於糾偏系統的應用範圍及它的產品特性。易於理解和操作自動設置 - 自動配置控制器,優化性能直觀的菜單布局 - 減少操作的混亂和潛在的停機時間高動態響應。那麼絕大部分糾偏系統的優點已經被各大廠家挖掘得差不多了,那麼又有客戶想用糾偏系統來測試化學反應速率的速度。了解化學變化時快時慢,有機化學上放反應速率來考量化學變化的速度。
  • 對話優圖實驗室鄭冶楓:從西門子到騰訊,醫療AI如何突圍?
    當務之急是招人,先把團隊組建起來。騰訊的金字招牌在招攬人才方面很有優勢。鄭冶楓1月5日正式加入優圖實驗室,到6月份就組建起了一支十幾人的團隊,其中半數是海歸博士,畢業於英國諾丁漢大學的李悅翔也是其中一員。作為團隊重要成員,李悅翔為優圖實驗室的缺血性腦卒中輔助診斷系統和宮頸癌篩查系統等產品的研發做出了重要貢獻。在騰訊和西門子工作,對鄭冶楓是兩種截然不同的體驗。
  • 騰訊多媒體實驗室受邀參加Audiokinetic Wwise全球巡演會,展示遊戲...
    近日,騰訊多媒體實驗室受邀參加Audiokinetic Wwise全球巡演會。巡演會上,騰訊多媒體實驗室團隊展示了遊戲多媒體引擎(GME)聯合解決方案。該解決方案由騰訊雲GME團隊、騰訊多媒體實驗室和Audiokinetic聯合打造,面向遊戲開發者提供遊戲內語音通信服務,提供端到端、低延遲、高質量、高穩定、可彈性擴容、性價比高的遊戲語音通信服務,接入門檻低,可幫助遊戲開發者在多種遊戲場景下快速搭建實時語音服務,助力遊戲社交化。
  • 騰訊Robotics X 實驗室研究首次「開箱」
    這正對應了實驗室在移動技術方面鑽研的的兩個核心技術模塊:感知、運動規劃與控制;同時二者通過實驗室的另一核心技術模塊:整機系統設計與搭建,實現了系統性的集成融合。通過特徵點匹配的方式,對 Jamoca 自身的運動軌跡進行在線跟蹤,並將基於視覺的定位信息與基於運動學的裡程計信息和 IMU(Inertial measurement unit,慣性測量單元)數據進行融合,提高了定位追蹤的精度和頻率。同時利用算法識別和提取出臺階和梅花樁的表面區域範圍和中心點位置,將定位和識別的數據進行融合,從而重建出整個三維運動場景。