【KDD2020】 圖模型信息融合

2021-02-20 專知

論文解讀者:北郵 GAMMA Lab 碩士生  王貞儀1 引言

使用圖模型解決問題時,面對實際環境中來源多樣、形式複雜的數據,怎樣將多種信息進行合理融合是一個值得關注的問題。本文將介紹兩篇發表於KDD 2020的與圖模型信息融合相關的工作。

第一篇工作為《HGMF: Heterogeneous Graph-based Fusion for Multimodal Data with Incompleteness》,該工作主要是基於異質圖來解決多模態學習中在信息融合時會遇到的模態缺失問題。

第二篇工作為《Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion》,該工作通過引入兩個外部知識圖譜豐富會話的語義信息,並通過互信息最大化彌補知識圖譜間的語義鴻溝以提升會話推薦系統的表現。

2 HGMF: Heterogeneous Graph-based Fusion for Multimodal Data with Incompleteness

2.1 引言

多模態數據指的是從多種來源收集到的異構數據,例如人機互動場景中識別人類行為與情感時收集到的視覺、聲音、語言數據;進行生物醫學數據分析時收集的實驗、基因序列以及醫療記錄數據等。多模態數據能為實際問題提供相互補充的信息,對其進行學習具有很高的價值。多模態學習包含多模態數據融合、多模態情感分析以及圖像問答等多個分支,本文關注的是多模態數據的融合任務,即將高度交互的多種模態數據進行合理融合後用作下遊任務的決策。

然而,在實際的多模態數據收集過程中,由於傳感器故障、數據損壞以及人為失誤等多種原因,最終收集的數據常常存在不同程度的模態缺失。下圖展示了一個具有模態缺失問題的三模態數據集。

模態缺失導致多模態數據在融合過程中會遇到以下三個技術挑戰:

樣本具有不同程度的模態丟失,從而具有不一致的特徵空間以及維度有效的多模態融合需要同時學習模態內部特有以及多模態間的交互信息

總之,如何有效地將不完整並高度交互的多模態數據進行融合仍是一個極具挑戰性的問題。與已有的基於不完整數據的直接刪除或數據插補(data imputation)的解決方案不同的是,本文提出了一種通過構建異質圖並在異質圖嵌入的同時實現不完整多模態數據融合的方法。

2.2 模型

作者提出的Heterogeneous Graph-based Multimodal Fusion(HGMF)模型總覽如下:

首先,作者將具有不完整模態的數據點構建成為一張異質超點圖;接下來,作者通過一個基於圖神經網絡的學習框架,從高度交互的不完整多個模態中提取互補信息並將信息從不同子空間融合至一個統一的空間內。2.2.1 異質超點圖的構建

異質超點圖中的節點具有不同數量以及維度的特徵,被稱為超點;一條邊可同時連接超邊

本文中,作者定義不完整模式為模態的一種組合方式。對於一個具有模態缺失問題的

作者首先將數據集中的所有數據按照可用模態的不同組合方式分為

將所有塊分別構建得到的子圖統一到一個圖中,可以得到最終的異質超點圖。注意到,在這樣的一種構圖方法中,兩個數據點的部分公共模態特徵相近就可能被超邊連接,即缺失某種模態的數據點與含有該種模態的數據點可能被連接,從而在一定程度上減輕模態不完整的問題。

2.2.2 節點內編碼器

每個超節點內部本身就包含高度交互的多模態內容,作者對這部分內容進行了編碼。

作者首先使用CNN、Bi-LSTM或全連接網絡等DNN對單模態特徵進行嵌入,得到第

編碼器通過對節點內部模態內部以及模態間交互的捕捉,將原始的模態特徵集

2.2.3 多折雙層圖注意力

由於不同節點的模態組合不同,上步編碼之後得到的圖仍是異質的。為實現異質圖上的多模態信息融合,作者使用雙層圖注意力機制。首先聚合同種模式下鄰居的信息,接著聚合不同模式信息。

對於節點

在聚合完模式內部信息之後,下一步是學習不同模式之間的關係,使得有不同模態缺失情況的數據點可以彼此學習,彌補缺失信息。聚合一個數據點的不同模式表示採用類似的注意力機制:

堆疊多個以上雙層圖注意力層以實現異質多模態數據的層級交互與融合。

2.3 實驗

實驗包含3D物體識別以及情感識別兩個任務,前者使用雙模態數據集ModelNet40以及NTU進行,後者選擇三模態數據集IEMONAP進行。為了模擬實際應用中可能出現的模態缺失情況,作者設置了多模態不完整比例

HGMF以及其他baseline在不同多模態不完整比例下進行3D物體識別實驗的結果如下(CPL代表模態數據完整):

三粒度情感識別的實驗結果如下:

可以看到,HGMF在模態不完整比例較高時的表現與其他baseline相比得到了穩定提升,說明其確實具有緩解模態缺失問題的能力。

3 Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion

3.1 引言

會話推薦系統(Conversation Recommender System, CRS)作為一種通過與用戶的交互式對話生成高質量推薦商品的推薦系統,近年來越來越多地受到人們的關注。一個電影推薦場景下的CRS工作示例如下所示。

CRS需要推薦模塊和對話模塊的無縫整合。對話模塊負責理解用戶意圖,並生成恰當的回覆語句;而推薦模塊負責學習用戶偏好,並基於上下文內容為用戶推薦高質量商品。目前針對CRS的研究中主要存在以下兩個問題需要解決。

與傳統推薦系統能夠利用用戶的歷史交互序列或用戶屬性不同的是,CRS使用的對話數據缺少足夠的上下文內容幫助精確理解用戶偏好;對話以自然語言的形式展示,而實際的用戶偏好是反映在商品或實體上的。這兩類數據信號間存在天然的語義鴻溝。

為解決上述問題,本文提出了基於知識圖譜的語義融合模型KG-based Semantic Fusion(KGSF),通過引入面向詞語的知識圖譜ConceptNet和面向商品的知識圖譜DBPedia豐富對話信息,並通過互信息最大化消除兩個知識圖譜之間的語義鴻溝。基於對齊之後的語義表示,作者還設計了KG增強的推薦模塊用於生成精確推薦以及KG增強的對話模塊用於在回復文本中生成信息量豐富的關鍵詞或商品。

3.2 模型

3.2.1 編碼外部知識圖譜

本文使用GCN編碼ConceptNet,每次更新時執行以下聚合操作:

Item間的關係比詞語間要複雜的多,本文使用關注節點間關係的R-GCN來學習item的表示:

3.2.2 使用互信息最大化的知識圖譜融合

消除word與item在表示上的語義鴻溝的核心思想在於使對話中共現的word和item在知識圖譜中有相近的節點表示,這樣能夠統一兩個語義空間中的數據表示。本文使用互信息最大化的方法達到以上目的。

給定兩個變量

其中,

互信息的準確數值通常很難計算得到,通常轉化為計算其下界,通過抬高互信息下界值來間接使得互信息最大化:

其中,

由(4)式和(5)式,可以得到知識圖譜嵌入模塊的優化目標函數。

3.2.3 知識圖譜增強的推薦模塊

本文將對話經知識圖譜嵌入並使用自注意力機制後得到的詞向量

商品被推薦給用戶的概率為:

使用如下交叉熵損失函數學習參數:

其中,

3.2.4 知識圖譜增強的回覆生成模塊

本文沿用了Transformer的編碼器-解碼器架構,並對解碼器進行了改進,在自注意力子層之後,又使用了兩個融合知識圖譜的注意力層:

其中,

回復生成模塊的損失函數如下:

3.2.5 參數學習

參數學習的完整流程如下:

首先通過互信息最大化對兩個知識圖譜的嵌入圖神經網絡進行預訓練;接下來通過推薦item的交叉熵損失學習推薦模塊參數並同時微調圖神經網絡參數;最後是回復生成模塊參數的單獨學習。

3.3 實驗

本文在CRS數據集ReDial上分別進行推薦任務以及對話生成任務實驗,並對比了KGSF與其他baseline的表現。

3.3.1 推薦任務

可以看到,不論是在常規推薦場景下還是冷啟動(上下文未提及任何商品或屬性)場景下,KGSF都能取得最優表現。

MIM模塊在提升模型表現的同時,也能縮短模型的收斂時間。

3.3.2 對話生成任務

KGSF在對話生成任務上也能取得最優效果。

4 總結

本文介紹的第一篇工作研究如何將有模態缺失問題的多模態數據集構建成為異質圖並在圖上進行合理的多模態信息交互,達到相互補充與融合的效果;第二篇工作則在引入面向word以及面向item的兩個知識圖譜後,通過互信息最大化對齊這兩個知識圖譜在語義上的表示空間,從而提升會話推薦效果。

專知便捷查看

便捷下載,請關注專知公眾號(點擊上方藍色專知關注)

專知,專業可信的人工智慧知識分發,讓認知協作更快更好!歡迎註冊登錄專知www.zhuanzhi.ai,獲取5000+AI主題乾貨知識資料!歡迎微信掃一掃加入專知人工智慧知識星球群,獲取最新AI專業乾貨知識教程資料和與專家交流諮詢!點擊「閱讀原文」,了解使用專知,查看獲取5000+AI主題知識資源

相關焦點

  • KDD 2020阿里巴巴論文一分鐘秒讀
    2)接著給出了論文提出的方法及方法框架圖解大家是否意猶未盡想看更多呢,這裡還有阿里巴巴在 kdd 2020 發布的更多論文的「秒讀」供大家體驗!Coding for Graph Neural Network Pre-Training簡介:本文提出了一種基於圖的對比學習框架,對多個圖數據集的圖神經網絡進行預訓練。
  • KDD CUP 2020 大獎出爐,中國團隊包攬全部冠亞軍!
    其中,預處理構建了用於模型訓練的特徵,後處理對模型進行集成,模型應用了兩種類型的架構,分別是MCAN和VisualBERT。MCAN全稱Deep Modular Co-Attention Networks,模型由幾個級聯MCA層構成。在VisualBERT中,圖像塊和查詢中的單詞被組合作為Transformer的輸入。
  • [KDD Cup 2020(共6道題)]KDD Cup 2020(賽題更新)
    打開的訂單(旅行請求)和可用的驅動程序在窗口中成批處理,它們的狀態信息將傳遞給訂單調度算法。這個模塊將在整個模擬日中為每個調度窗口重複調用。評估模擬在多個「天」內運行,其中平均總司機收入(在評估中定義)被計算為算法的得分。
  • KDD 2020最佳論文揭曉!杜克大學陳怡然組獲最佳學生論文獎
    該框架的目標是學習一個特徵抽取器,它可以隱藏中間表徵中的隱私信息,同時最大限度地保留原始數據中嵌入的原始信息,供數據採集器完成未知的學習任務。研究人員設計了一種混合訓練方法來學習匿名中間表示:1 針對特徵隱藏隱私信息的對抗性訓練過程2 使用基於神經網絡的互信息估計器最大限度地保留原始信息通過對TIPRDC進行廣泛評估,並將其與使用兩個圖像數據集和一個文本數據集的現有方法進行了比較。
  • KDD 2020最佳學生論文:基於匿名中間表徵的任務獨立、尊重隱私的數據眾包框架——TIPRDC
    論文作者:Ang Li, Yixiao Duan, Huanrui Yang, Yiran Chen, Jianlei Yang論文連結:https://www.aminer.cn/pub/5f03f3b611dc83056223205b/conf=kdd2020直播回放:https://b23.tv/irlqA6近年來,各種信息洩露事件頻繁發生,引發廣泛社會關注。
  • KDD 2018精華大放送,不可錯過的知識發現與數據科學盛宴(附Papers&Tutorials下載)
    它將傳感器技術、先進的數據管理手段和分析模型結合起來,通過可視化的方法來呈現。城市計算將為城市帶來更高的效率、更好的環境和更舒適的生活質量。將機器學習算法與城市信息流結合起來改善並優化城市各方面的效率。Workshop On Mining And Learning From Time Series時序數據是一類廣泛存在於日常生活中的數據類型,在健康、交通、娛樂和金融方面都有著廣泛的應用。隨著物聯網技術的發展和行動裝置的增加,數據流成為了源源不斷的測量信息。
  • 【乾貨】2010-2017最全KDD CUP賽題回顧及數據集下載
    Challenge數據集的test部分被隱藏,參賽者需要開發一種學習模型,來準確預測這部分隱藏部分的成績。歌曲的屬性信息(專輯、歌手、曲風等)也同樣提供。accepted the most: towards measuring the impact of research institutions>>> 賽題介紹KDD Cup 2016將使用各類公開數據集,例如微軟學術圖譜(Microsoft Academic Graph, MAG),它將文獻的發表和引用信息組織成異構圖的形式
  • 谷歌的KDD 2017:九篇錄用+雙料博士論文獎,超百位員工參與
    KDD 2017 已於近日落下帷幕,作為數據科學這一研究課題使用局限圖原語(例如 ego-network 和截取的隨機散列)有效地利用每個頂點周圍的信息進行分類、聚類和異常檢測。值得一提的是,這項工作在 DeepWalk 中採用了神經網絡圖形嵌入的隨機遊走範式。
  • KDD 2020最佳論文揭曉!杜克大學陳怡然組獲最佳學生論文獎,清華入選論文實力霸榜
    該框架的目標是學習一個特徵抽取器,它可以隱藏中間表徵中的隱私信息,同時最大限度地保留原始數據中嵌入的原始信息,供數據採集器完成未知的學習任務。 研究人員設計了一種混合訓練方法來學習匿名中間表示:1 針對特徵隱藏隱私信息的對抗性訓練過程2 使用基於神經網絡的互信息估計器最大限度地保留原始信息 通過對TIPRDC進行廣泛評估,並將其與使用兩個圖像數據集和一個文本數據集的現有方法進行了比較。結果表明,TIPRDC大大優於其他現有的方法。
  • KDD 2020 全部大獎出爐!杜克大學陳怡然組獲最佳學生論文獎
    /kdd2020/accepted-papers/view/on-sampled-metrics-for-item-recommendation論文摘要:項目推薦的任務需要在給定上下文的情況下對大量的項目進行排序。
  • 中國企業包攬主辦權,獎金池 12 萬美金,KDD Cup 2020 開賽
    自動化機器學習賽道(AutoML 賽道) 「用於圖表示學習的 AutoML」(於 2020 年 3 月 30 日開放) 強化學習競賽賽道(RL 賽道) 「學習按需移動平臺上的調度和重定位」(2020 年 4 月 2 日開放)常規機器學習賽道(ML 賽道 1)
  • 視覺信息助力廣告點擊率預估--京東廣告團隊技術論文入圍KDD2020
    近日,來自京東廣告團隊的一篇論文《Category-Specific CNN for Visual-aware CTR Prediction at JD.com》,即《在京東,視覺助力點擊率預估——基於給定類目信息的卷積神經網絡》被KDD2020成功收錄。
  • 視覺信息助力廣告點擊率預估-京東廣告團隊技術論文入圍KDD2020
    近日,來自京東廣告團隊的一篇論文《Category-Specific CNN for Visual-aware CTR Prediction at JD.com》,即《在京東,視覺助力點擊率預估——基於給定類目信息的卷積神經網絡》被KDD2020成功收錄。
  • KDD 2018最佳論文解讀 | 圖神經網絡對抗攻擊
    本篇文章介紹KDD2018的最佳論文—圖神經網絡對抗攻擊,該論文針對圖節點分類任務進行對抗攻擊。論文題目:Adversarial Attacks on Neural Networks for Graph Data論文地址:http://cn.arxiv.org/pdf/1805.07984源碼地址:https://www.kdd.in.tum.de/nettack摘要
  • 圖系列 | KDD'18異質信息網絡嵌入學習—HEER模型結構,解決存在多決種關係的問題
    模型,是最近比較火的研究方向,尤其是在異質信息網絡(Heterogeneous Information Network)上的嵌入模型,因為結構更為複雜,信息更為豐富,所以能夠使用的特徵,以及可以研究的問題更多。
  • 【KDD2020】基於動態知識圖譜的多事件預測
    事件數據包含結構化數據,例如,時間、參與者、類型等,同時也包含很多非結構化數據,例如,文本信息(如下圖邊上的event summary),很少有研究進行異構數據融合以進行並發事件預測。大多數知識圖譜補全方法僅對關係數據的固有結構建模,而無法利用全局歷史數據來進行未來事件預測對事件建模的先前研究主要集中在使用預定義特徵或預訓練嵌入來預測將來的事件發生或計數。
  • 假期薦讀:一文看盡2019-2020各大頂會 Graph Neural Network 論文(附連結)
    作者還將用戶域中的社會效應擴展到項目域,從而可以利用相關項目中的信息進一步緩解數據稀疏問題。此外,考慮到兩個領域中不同的社會效應可以相互作用,共同影響用戶對物品的偏好,他們提出了一種新的基於策略的融合策略,該策略基於上下文多武裝匪徒來衡量不同社會效應之間的相互作用。在一個基準數據集和一個商業數據集上的實驗驗證了模型中關鍵組件的有效性。
  • 論文主題、引用量、中國機構 & 華人學者,KDD 2020 關鍵數據搶先看!
    今年的 KDD 大會原定於2020 年 8 月 23 日 ~27 日在美國美國加利福尼亞州聖地牙哥舉行。而由於疫情影響,本次大會將以線上形式舉行。前兩個月,KDD 2020 官方發布接收論文,共有1279篇論文提交到Research Track,共有216篇接受,接受率16.8%。
  • 高精度3d重建是一個雙機融合模型
    雷射雷達用於高精度的一維地圖,通過雷射雷達獲取地面點雲;毫米波雷達用於高精度的3d地圖,將車輛的雷射雷達數據經過衍射、slam等多種方法得到的地圖數據與點雲進行匹配,求得運動模型,計算運動軌跡,一般用於自動駕駛。
  • KDD 2019 投稿要求出爐:結果出爐前不得發表 arXiv ,鼓勵公開研究...
    基礎研究:模型和算法、漸近分析;模型選擇、降維、關係/結構化學習、矩陣和張量方法、概率和統計方法;深度學習;流形學習、分類、聚類、回歸、半監督和無監督學習;個性化、安全和隱私和可視化等。:2019 年 2 月 3 日投稿接收通知:2019 年 4 月 28 日論文定稿提交:2019 年 5 月 17 日更多詳盡的 KDD 2019 徵稿要求,可自行參閱:徵稿要求https://www.kdd.org