AttnPath | 將圖注意力機制融入基於深度強化學習的知識圖譜推理中

2021-03-01 人工智慧前沿講習

論文原文:Incorporating Graph Attention Mechanism into Knowledge Graph Reasoning Based on Deep Reinforcement Learning

出版:EMNLP 2019

關鍵詞:基於路徑的知識圖譜推理,深度強化學習,圖注意力機制,LSTM,知識圖譜補全


知識圖譜(KG)推理旨在找到關係的推理路徑,以解決 KG中的不完整性問題。許多以前的基於路徑的方法(例如PRA和DeepPath)都缺少記憶組件,或者陷入了訓練過程中。因此,它們的表現總是依賴於良好的訓練。

在本文中,我們提出了一個基於 AttnPath 的基於深度強化學習的模型,該模型將 LSTM 和圖注意力機製作為記憶組件。我們定義兩個指標,平均選擇率(MSR)和平均替換率(MRR),以定量地衡量學習查詢關係的難度,並在強化學習的框架下利用它們來微調模型。同時,提出了一種新的強化學習機制,即通過強制智能體每走一步來避免智能體不斷停滯在同一實體節點上。基於此操作,所提出的模型不僅可以擺脫預訓練過程,而且與其他模型相比也能達到最新的性能。

我們在具有不同任務的 FB15K-237 和 NELL995 數據集上測試了我們的模型。大量的實驗表明,我們的模型在許多當前最先進的方法中均有效且具有競爭力,並且在實踐中也表現良好。

主要有三種方式執行知識圖譜推理,基於規則、基於嵌入和基於路徑的方法。同時,知識圖譜推理提供了一種視角:將深度強化學習帶入到預測缺失連結到任務中。

例如 DeepPath,一個基於路徑的方法,它是第一個將深度強化學習集成到知識圖譜推理任務中的工作。相比於 PRA,它仍然有一些缺陷:- 缺乏記憶組件,導致需要預訓練。預訓練要求提供許多已知的或存在的路徑用於模型訓練。這種暴力操作可能使模型在用於預訓練的路徑上過擬合。- 訓練過程中為知識圖譜中不同的關係設置同樣的超參數是不合理的,它忽略了實體之間連接的多樣性。- 當智能體選擇無效的路徑時,它將停止並重新選擇,可能導致不斷選擇無效的路徑並最終卡在一個結點上。

因此,在該文中,作者提出一種新的深度強化學習模型和一個算法,試圖解決上述問題。該方法屬於基於路徑的框架中。該文的貢獻主要是:

提出一種模型 AttnPath,集成 LSTM 和圖注意力作為記憶組件,並不再需要預訓練。

定義了兩個度量標準(MSR和MRR),以定量地度量學習關係的可替換路徑的難度。該度量用於微調模型。

提出了一種新的強化學習機制,通過強制智能體每走一步來避免智能體不斷停滯在同一實體節點上。


3.1 知識圖譜推理的強化學習框架

因為使用強化學習作為序列決策模型的訓練算法,作者首先介紹知識圖譜推理中的強化學習框架的基本元素。包括環境、狀態、行為和獎勵。

環境:在該任務中,環境指的是整個知識圖譜,排除查詢關係和逆關係。環境在整個訓練過程中保持不變。 狀態:智能體的狀態由三部分拼接而成,嵌入部分、LSTM 部分、圖注意力部分。不同於 DeepPath 使用 TransE 作為知識圖譜嵌入模型,AttnPath 使用 TransD 模型。狀態的嵌入部分可描述為:

狀態的 LSTM 部分和圖注意力部分在後文描述。

行為:對於知識圖譜推理任務,一個行為指的是一個智能體選擇關係路徑前進。基於深度強化學習的框架,它根據模型提供的概率選擇關係。行為可能是有效的或無效的。有效的行為表示有輸出關係是與當前實體相連的關係,而無效的關係表示該實體沒有對應的關係。

獎勵:獎勵是根據行為是否有效、或者一系列行為是否能在有限步驟內導向正確的尾實體,而給予智能體的反饋。

對於無效的行為,獎勵是 -1. 對於不引向真實實體的行為,作者選擇 ConvE 的輸出作為獎勵。因為 ConvE 輸出概率,在 (0, 1) 之間,作者使用對數操作將獎勵的擴大並提升可辨別性。

對於引向真實實體的行為,即成功的事件,獎勵是全局準確性、路徑高效性、路徑多樣性的加權和。按照慣例,將全局準確性設置為 1,並且路徑效率是路徑長度的倒數,因為我們鼓勵智能體儘可能少地走步。路徑多樣性定義為:

其中 |F| 是找到的路徑的數量,p 是路徑的嵌入,簡單地定義為路徑中所有關係嵌入的和。

上面的定義保證了有效動作的獎勵總是大於無效動作的獎勵,而成功的事件的獎勵總是大於不成功的事件的獎勵。

3.2 LSTM 和圖注意力作為記憶組件

在模型中,作者使用三層 LSTM,使智能體能記憶並從記憶中學習之前執行過的行為。將第 t 步的隱藏狀態是記為 h_t,初始隱藏狀態為 h0,我們可得:

這就是狀態的 LSTM 部分。

通常而言,一個實體有多個方面,例如表示一個人的實體可能有職業和家庭成員兩種角色。對於不同的查詢關係,較好的方式是讓智能體關注於與查詢關係更加相關的關係與鄰居。

因此,作者引入了圖注意力機制。GAT 是在實體結點的自注意力。圖注意力機制部分的描述如下:

智能體選擇一個動作並獲得獎勵。在成功到達尾部實體或未達到指定的次數後,整個事件的獎勵將用於更新所有參數。使用 REINFORCE 算法完成優化,並使用以下隨機梯度更新θ:

上面圖 1 展示了強化學習框架,相比於 DeepPath 的關鍵創新是集成了 LSTM 和圖注意力機制。讀到這裡,請再讀一遍該論文原文的標題。

3.3 平均選擇/替換率

對於不同的查詢關係,需要為每個查詢模型訓練不同的模型。實際上,每種關係的難度值都完全不同。某些關係可能具有更多的替換關係,這表明智能體可以輕鬆選擇從頭部實體到尾部的替換路徑。因此,我們在這裡發明了兩個指標,均值選擇率(MSR)和均值替換率(MRR),以定量地衡量每個關係的難度值。

較低的 MSR 表示更難學習給定的關係,因為與該關係相連的實體可能有更多的語義層面。

較高的 MRR 表示關係可能有更多的替代關係,所以它更容易學習因為智能體可以直接選擇替代關係來到達終點。

該模型中使用了三種方法來防止過擬合:L2 正則化、dropout、行為 dropout。但是,對於易於學習的關係(較高的MSR和MRR),我們希望施加更多的正規化以鼓勵智能體找到更多不同的路徑,而又不會過分適應即時的成功。另外,對於較難學習的關係(MSR和MRR較低),我們最好將重點放在尋找路徑的成功率上,因此應減少正則化。

為簡單起見,我們使用指數計算關係r的難度係數。它定義為 exp(MSR(r) + MRR(r)),並分別乘以三種正則化方法的基本速率。正則化方法的基本速率基於 KG,在同一 KG 中的所有關係之間共享。

3.4 整體訓練算法

基於提出的模型,我們提出了一種新的訓練算法,如算法 1 所示。

作者對算法的貢獻之一是,當智能體選擇無效路徑時,模型不僅會對其進行懲罰,還會強制其選擇有效關係以向前邁進。來自神經網絡的概率在所有有效關係中均被歸一化,這反過來又影響了強制行為的概率。

初始化之後,第6行根據網絡的輸出對動作進行採樣。當智能體選擇無效動作時,將執行第7到10行,而第9到10行則迫使智能體向前移動。當智能體選擇有效動作時,將執行第12行。第19、22和25行使用獎勵-1,Rtotal和Rshaping分別更新無效動作,成功事件中的有效動作和不成功事件中的有效動作的參數。

作者使用關係預測和連結預測兩個任務對該模型做實驗,並比較了和 DeepPath 的表現差距。

在本文中,作者提出了 AttnPath,這是一種基於 DRL 的 KG 推理任務模型,該模型將 LSTM 和圖注意力機製作為記憶組件,以減輕模型的預訓練。

作者還發明了兩個指標 MSR 和 MRR 來衡量關係的學習難度,並將其用於更好地微調訓練超參數。

作者改進了訓練過程,以防止智能體陷入毫無意義的狀態。

定性實驗和定量分析表明,作者的方法明顯優於DeepPath和基於嵌入的方法,證明了其有效性。

在未來,作者有興趣於使用多任務學習,使模型能同時學習多個查詢關係。作者也感興趣於研究如何使用 GAT、MSR 和 MRR 於其他 KG 相關的任務,例如 KG 的表示、關係聚類和 KBQA。

地址:https://www.zhihu.com/people/dai-tu-zhe

相關焦點

  • 「人工智慧師資班」(Python機器學習,圖像識別與深度學習,深度學習與NLP,知識圖譜,強化學習)
    本次培訓分為Python機器學習,圖像識別與深度學習,深度學習與NLP,知識圖譜和強化學習五大專題。本次培訓由權威專家主講,提供實驗環境及實驗數據,並提供配套資料,通過剖析工程案例展現機器學習、深度學習落地全過程。培訓暫定2021年1月5日開始,每個專題6天左右,一共28天,直播集訓。本次培訓由淺入深,面向0基礎、不懂機器學習、不具備任何Python基礎的老師和同學。
  • 知識圖譜的皇冠:知識圖譜推理的前世今生
    常見的歸納推理方法有基於圖結構的推理、基於規則學習的推理、基於表示學習的推理。下面我們分別展開討論。 二、基於描述邏輯的推理 描述邏輯(Description Logic),簡稱DL,是一種用於知識表示的邏輯語言,和知識推理的形式化工具。
  • 知識圖譜推理問答:如何讓機器像人類一樣學會推理
    AI TIME PhD 知識圖譜專題第三期,清華大學計算機系、知識工程實驗室的博士四年級研究生史佳欣,將結合知識圖譜推理問答的數據集,為大家梳理主流的研究方法,分析各種方法的優缺點,並對將來的研究工作作出展望。
  • 從知識圖譜到認知圖譜:歷史、發展與展望
    4、深度學習時代的知識圖譜深度學習時代的知識圖譜擁有大量的實體和關係,然而大量不同的關係上很難定義邏輯規則,在知識圖譜上「推理」也轉入黑盒模型預測的範式。知識圖譜另一個重要的方向是複雜問題推理。知識圖譜往往是不完備的,複雜問題往往在圖譜中沒有明顯答案,甚至沒有對應的關係。但是,通過多步推理,我們仍有可能從圖譜中獲得對應的答案。這個方向較為著名的工作有Xiong等人[21]的Deeppath(見圖6),使用強化學習的方法探索知識圖譜中的推理路徑。
  • 基於空間認知的知識表示和推理探討
    1977年,ACM圖靈獎獲得者愛德華·費根鮑姆(Edward Feigenbaum)在第五屆國際人工智慧會議上提出,將知識融入計算機系統的知識工程研究領域,去解決只有領域專家才能解決的複雜問題,建立了智能系統就是「知識庫+推理引擎」的智能系統框架。基於符號知識表示和推理的各類專家系統在醫療診斷、地質勘探等領域的應用,將人工智慧研究推向高潮。
  • 圖深度學習入門教程(六)——注意力機制與圖注意力
    摘要:深度學習還沒學完,怎麼圖深度學習又來了?別怕,這裡有份系統教程,可以將0基礎的你直接送到圖深度學習。
  • 知識圖譜前沿跟進,看這篇就夠了,Philip S. Yu 團隊發布權威綜述...
    Han 等人基於互注意力機制提出了一種聯合學習框架,這種互注意力機制被用於知識圖譜和文本之間的數據融合,該框架同時解決了根據文本進行知識圖譜補全和關係抽取的問題。此外,還有一些任務也與知識補全有關(例如,三元組分類和關係分類)。在本節中,我們將完整地回顧知識補全、實體發現和關係抽取三步知識獲取技術。
  • ACL 2019 知識圖譜的全方位總結
    演講中,他強調了將知識圖譜、推理和背景納入對話系統的重要性。我想補充的一點是,知識圖譜也將同時提高agent對話的可解釋性。圖1:ACL主席周明演講中提到知識圖譜的重要性2、在NLP forConversational AI 研討會[1]中討論了更多此類細節問題。
  • 「直男變暖男」——當推薦系統遇上知識圖譜
    而知識推理,從知識庫中已有的實體關係數據出發,進行計算機推理,建立實體鏈的新關聯,從而拓展和豐富知識網絡。主要用於知識補全、關係預測、知識問答等,它是基於符號驗算的推理+基於數值計算的推理。知識圖譜的應用場景有很多:結合場景、數據、技術,我們可以在搜索、推薦、問答、解釋、決策中使用到它。
  • 技術動態 | ACL 2019 知識圖譜的全方位總結
    演講中,他強調了將知識圖譜、推理和背景納入對話系統的重要性。我想補充的一點是,知識圖譜也將同時提高agent對話的可解釋性。圖1:ACL主席周明演講中提到知識圖譜的重要性2、在NLP forConversational AI 研討會[1]中討論了更多此類細節問題。
  • 綜述|計算機視覺中的注意力機制
    一、注意力機制(attention mechanism)attention機制可以它認為是一種資源分配的機制,可以理解為對於原本平均分配的資源根據attention對象的重要程度重新分配資源,重要的單位就多分一點,不重要或者不好的單位就少分一點,在深度神經網絡的結構設計中,attention所要分配的資源基本上就是權重了
  • 伯克利&清華從GPT等預訓練語言模型中無監督構建出知識圖譜!
    AI科技評論為此聯繫到了本文的一作王晨光博士和二作劉瀟同學來對本文做了親自介紹,並在之後對他們進行了十五個深度問答。1背景介紹無論對人類智能還是機器智能而言,知識圖譜(Knowledge Graphs)都是不可或缺的資源。大量研究工作表明,將人類知識融入人工智慧應用可以大大提升算法在執行複雜任務時的表現,例如推理與語言理解。
  • 一文全覽,ICLR 2020 上的知識圖譜研究
    註:文中涉及論文,可關注「AI科技評論」微信公眾號,並後臺回復「知識圖譜@ICLR2020」打包下載。一、在複雜QA中利用知識圖譜進行神經推理今年ICLR2020中,在複雜QA和推理任務中看到越來越多的研究和數據集,very good。
  • 基於注意力機制改進U-Net的醫學圖像分割算法
    近年來,由於深度學習方法的迅速發展,基於深度學習的圖像分割算法在醫學圖像分割領域取得了顯著的成就。其中依賴於編碼器-解碼器體系結構的U-Net被研究人員廣泛使用。但是U-Net網絡在下採樣的過程中卷積、池化都是局部算子,要獲取全局信息就需要深度編碼器,這樣會引入大量的訓練參數,並且丟失更多圖像的空間信息。而在上採樣過程中使用反卷積、反池化很難進行空間信息的恢復。
  • Attention 掃盲:注意力機制及其 PyTorch 應用實現
    點上方藍字計算機視覺聯盟獲取更多乾貨地址:https://www.zhihu.com/people/lucas_zhang深度學習
  • 基於知識圖譜的人機對話系統|公開課筆記
    同樣也有很多方法,最簡單的基於規則、基於模板,複雜點的基於翻譯模型、基於深度學習模型等。目前學術界比較多的是基於機器學習的知識庫的問答方法,這裡面它的基本思想是把問題建模成一個 embedding,然後對知識圖譜也做 embedding,變成一個個向量,這個問答就轉換成了一個相似度匹配的問題,把知識庫裡的子圖的向量跟問題對應子圖進行相似度匹配。
  • 論文小綜 | 知識圖譜表示學習中的零樣本實體研究
    表示學習算法將知識圖譜中的實體和關係都映射到低維向量空間,獲取實體和關係的向量表示,同時保留圖譜中的結構信息和語義信息。然而,現有的表示學習算法只能對出現在訓練集中的實體及關係進行表示,對於測試時新出現的實體/關係,模型可能需要重新進行訓練。但知識圖譜的增長是快速的,隨時都會有一些新增的實體/關係,每次都重新訓練顯然是不現實的。
  • 在剛剛結束的ACL 2019上,知識圖譜領域都發生了哪些大事?
    作為目前最為火熱的先驗知識組織、表徵技術,知識圖譜的相關工作在本屆 ACL 上可謂萬眾矚目。本文將介紹本屆 ACL 收錄的一些知識圖譜方向的優秀工作,希望對讀者們有所啟發。大家好,ACL 2019 剛剛結束,我在風景如畫的佛羅倫斯參加了為期一周的講座,教程和研討會!在本文中,我將回顧一下知識圖譜如何步步為營地融入 NLP 研究社區。
  • 深入理解圖注意力機制(Graph Attention Network)
    >圖神經網絡已經成為深度學習領域最熾手可熱的方向之一。作為一種代表性的圖卷積網絡,Graph Attention Network (GAT) 引入了注意力機制來實現更好的鄰居聚合。通過學習鄰居的權重,GAT 可以實現對鄰居的加權聚合。因此,GAT 不僅對於噪音鄰居較為魯棒,注意力機制也賦予了模型一定的可解釋性。下圖概述了 Graph Attention Network 主要做的事情。
  • 論文淺嘗 - ICML2020 | 基於子圖推理的歸納式關係預測
    論文來源:ICML 2020Introduction當前在知識圖譜上(KnowledgeGraph,KG)進行關係預測的很多方法都依靠在對知識圖譜中的實體和關係都學習一個潛在的表示(Latent Representation)也就是嵌入(Embedding)。