【新智元導讀】Alphabet的子公司DeepMind一直是AI開發的基石。您可能還記得DeepMind的AlphaGo在與世界冠軍Lee Sedol的圍棋比賽中獲勝。這些AI都在人工神經網絡上運行,模仿大腦的連接主義系統。今天我們來看DeemMind推出的另一個模擬人腦推理的新模型。
人工智慧是否能夠捕捉到推理的本質,也就是說,分布在多個事實或記憶中的元素之間的距離關係? Alphabet 的子公司 DeepMind 在 arXiv. org 上發表了一項研究,試圖找出答案。
單一經驗的靈活重組來實現推斷
該研究提出了一種能夠進行長距離推理的架構——MEMO。 研究人員表示,MEMO 的兩個新穎組件——第一個組件將事實和存儲在外部存儲器中的記憶分離,第二個組件採用了一種檢索系統,在決定一個答案之前允許不同數量的「記憶跳數」,使它能夠解決新穎的推理任務。
在我們的日常生活中,我們需要做出一些判斷,這些判斷需要將那些不是一次經歷的事實聯繫起來,而且是在不同時間點的經歷中獲得的。
想像一下,你帶著你的女兒去一個編程夏令營,遇到了另一個和一個女人在一起的小女孩,你可以推斷出那個女人是小女孩的母親。幾周後,你在你家附近的咖啡店裡看到了同一個小女孩,這次是和一個男人在一起。根據這兩個分開的情節,你可以推斷出女人和男人之間有關係。這種單一經驗的靈活重組以新穎的方式來推斷未觀察到的關係被稱為推理,並由海馬體支持。
有趣的是,已經證明海馬體通過一種叫做模式分離的過程來獨立地存儲記憶。海馬區記憶保持分離的原因是為了儘量減少經驗之間的幹擾,這使得我們能夠以「情景性」記憶的形式回憶特定的事件。
很明顯,這種分離與上面提到的海馬體在概括過程中的作用相衝突,也就是說,分離的記憶如何才能連結在一起?有趣的是,最近的一項研究表明,分離經驗的整合是通過一種循環機制,在檢索點處允許多種模式獨立地進行編碼交互,因此支持推理。我們依靠這些發現,來研究如何改進我們的神經網絡模型以增強神經網絡中的推理。
那麼DeepMind是如何來實現這一機制的,我們來看論文中的具體描述。
引入注意力機制,使用多頭來處理記憶跟隨
首先是輸入,我們重點關注EMN的多層綁定權重變體,因為它與我們的體系結構最為相似。與EMN輸入不同,我們並沒有使用手工編碼的位置嵌入,而是將每個句子中的單詞Xi和它們在輸入中的獨熱編碼(嵌入為Ci)組合起來:
通過線性投影傳遞這個向量,然後通過一種注意力機制,可以靈活地捕捉輸入語句的任何部分。MEMO使用多頭(heads)來處理記憶跟隨,每個頭對相同的公共輸入Ci有不同的觀測。令H表示頭的總數,H索引特定的頭,對於每個H∈{1,…, H}, 參考EMN方法我們有:
W (h) k 、 W(h) v 和 W (h)q 為鍵(key)、值(value)和查詢(query)的嵌入矩陣。輸出為三個d維向量。將每項分隔到不同內存中,可以讓我們在執行內存查找時了解如何對每項進行加權。
其次,注意力機制。與EMN不同的是,本文的注意力機制由於輸出是多頭的緣故,這裡的注意力機制也同樣為多頭。另外,我們還採用了DropOut 和 LayerNorm的方法來提高泛化和學習動力。加入注意力機制的模型表達式變為如下:
最後,停止策略。在前面的部分中,我們描述了MEMO如何針對一個輸入查詢,輸出多個潛在的答案,以及如何學習一個有效的答案所需要的計算步驟。
為了做出這個決定,我們在每一步都收集了一些信息,並使用它來創建觀察點。然後,通過門控循環單元(GRU)處理該觀測結果,後跟一個 MLP(定義了一個二進位策略和近似價值函數V (St,θ))。
該網絡的輸入St由當前時間步長Wt與前一個時間步長Wt1的注意權值之間的Bhattacharyya距離構成(Wt和Wt1均在softmax之後),同時以迄今為止所採取的一系列步驟的數量作為一個獨熱向量t。
我們構建St背後的想法是,如果注意力集中在同一記憶的槽位上進行太多連續的步驟,則沒有理由繼續查詢,因為檢索到的信息將是相同的,即網絡已經穩定,到了一個可以停止的固定點。
配對聯想推斷和隨機生成圖最短路徑表現搶眼
配對聯想推斷
左邊的面板顯示了一個存儲區,其中充滿了隨機的圖像對。右邊的面板顯示(從左到右)兩個不需要推理的「直接」查詢(AB和BC),以及一個需要推理的「間接」查詢(AC)。
在較小的set,A-B-C 上,MEMO能夠與DNC一起達到最高的準確率,而EMN與UT不能準確的解決這個推理測試。對於較長的序列,如長度為4和5的序列,MEMO是唯一能夠成功回答最複雜推理查詢的架構。
隨機生成圖的最短路徑
10個節點的簡單情況,UT、DNC、MEMO都能有較高的預測精度,隨著節點數增加到20,複雜度也增加的時候,只有MEMO能夠達到較高預測精度。
在bAbI數據集中達到SOTA效果
本文中,我們對支持推理的記憶表示形式進行了深入的研究,並引入了MEMO,這是對現有記憶架構的擴展,在這些推理任務中有了期望的結果。MEMO展示了一項新任務——配對聯想推理——的最新成果,在這個任務和一個具有挑戰性的圖遍歷任務中,MEMO是解決長序列的惟一架構。
此外,MEMO能夠解決bAbI數據集的20個任務,具備了目前最先進的性能,而這種靈活加權是通過將記憶中單個事實的獨立存儲與強大的注意機制相結合來實現的。