讓神經網絡給符號AI打工,MIT和IBM聯合解決深度學習痛點

2021-01-07 TechWeb

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯繫出處。

現在的AI是神經網絡的天下,但科學家們正在嘗試將神經網絡與「老式AI」結合。

這裡說的「老式AI」是上世紀70年代流行的「符號主義」。在幾十年前遭遇失敗後,「連接主義」取代其成為主流。

但是,越來越多的科學家注意到,將二者結合才會讓AI發揮出更強大的威力。

讓連接主義給符號主義「打工」

幾年前,科學家從小鴨子身上學到了一樣不尋常的東西。如果小鴨子出生後先看到的是兩個相似的物體,那麼之後會對相似物體產生更多的偏好。

小鴨毫不費力地做的事情對於人工智慧來說是很難的,尤其是深度神經網絡這一AI分支。

如果交給符號AI,它會怎麼做?符號AI會處理物體的名稱作為知識庫,並給「相似」做出定義作為命題。

憑藉其知識庫和命題,符號AI採用推理引擎的邏輯規則來回答問題。

但符號AI缺點在於,要實現更複雜的推理需要龐大的知識庫(人工構建),如果AI遇到知識庫中沒有的形狀將無法處理。

連接主義利用知識進行訓練,讓神經網絡具有學習能力,但容易受到對抗攻擊。

於是將符號主義和連接主義結合起來的混合式神經-符號AI(neurosymbolic AI)應運而生。

科學家用深度神經網絡來構建符號AI所需的知識庫和命題,省去了人工預設的難題,然後使用符號AI對任務進行推理。

解決李飛飛2016年難題

2016年,李飛飛等人提出了組合語言和基本視覺推理(CLEVR)數據集,要求AI回答由計算機生成的簡單3D形狀圖像相關問題。

使用複雜的深度神經網絡可以解決此問題。但是,IBM、MIT和DeepMind的研究人員提出了一種截然不同的解決方案,顯示出符號AI的強大能力。該方法相關論文已經被ICLR 2019收錄。

在這篇論文中,他們將問題分解為符號AI熟悉的較小部分。

這套系統首先查看圖像並表徵3D形狀及其屬性,由此生成知識庫。然後,它將問題變成一個可以在知識庫上運行並產生答案的符號程序。

過去,在符號AI中,需要讓人類程式設計師去手動輸入知識庫,現在研究人員希望由神經網絡代替人類這項工作。

他們先通過使用卷積神經網絡(CNN)解決了第一個問題,識別目標的顏色、形狀、材質等屬性。

然後使用遞歸神經網絡(RNN)發現順序輸入中的模式。這個模塊負責接收自然語言問題並將其轉換為符號程序形式的問題。

整個過程類似於按需生成知識庫,並讓推理引擎在知識庫上回答問題。

最終,這種混合AI在從未見過的問題和圖像上進行測試,準確率達98.9%,擊敗了人類。人類只能回答正確92.6%的問題。

更好的是,混合AI只需要純粹深度神經網絡訓練數據的10%。混合AI還具有可解釋性,如果發生錯誤,則更容易發現問題所在。

挑戰更高難度

搞定CLEVR數據集後,現在神經-符號AI正在解決更為棘手的問題。

2019年,在李飛飛CLEVR數據集的基礎上,DeepMind、MIT、哈佛大學和IBM設計了一個更加複雜的挑戰CLEVRER:讓AI基於視頻而不是圖像來回答問題。

視頻中會出現CLEVR數據集中的目標類型,但是這些目標會移動甚至發生碰撞,而且問題更加棘手。

有些問題是描述性的,比如:視頻結束時有多少金屬物體在移動?

有些問題則需要預測,比如:接下來將發生哪個事件?[a]綠色圓柱體和球體碰撞,[b]綠色圓柱體與正方體碰撞。

甚至還有些問題是視頻中沒有發生的(反事實),比如:沒有青色圓柱體,將不會發生什麼?[a]球體和立方體碰撞, [b]球體和青色圓柱體碰撞, [c]立方體和青色圓柱體碰撞。

對於當今的深度神經網絡來說,這種隨時間變化的因果關係是非常困難的,這主要表現在發現數據的靜態模式方面。

為了解決這個問題,團隊擴充了之前解決CLEVR的方案。

首先,神經網絡學習將視頻片段分解為目標的逐幀表示,然後被饋送到另一個神經網絡,學習分析這些目標的運動以及它們如何相互影響,並可以預測目標的運動和碰撞。

這兩個模塊共同構成了知識庫。其他兩個模塊處理問題並將其應用於生成的知識庫。

該團隊的解決方案在回答描述性問題方面的準確性約為88%,對於預測性問題的準確性約為83%,對於反事實問題的準確性約為74%。

讓AI學會提問

提出好問題是機器在人類的另一項技能。這是一種不斷學習世界的方式,而不必等待大量的樣本。沒有任何一種機器可以接近人類提問的能力。

而神經-符號AI展現出了這方面的能力。

紐約大學Brenden Lake助理教授和他的學生Wang Ziyun構建了一種混合AI,來玩一種需要主動提問的遊戲——海戰棋(Battleship)。

海戰棋是一種猜謎式的攻防遊戲,一方在棋盤上隱藏自己的「戰艦」(長度不等),另一方負責攻擊。

攻擊方可以翻看某個方塊下是否有「戰艦」的一部分,或者直接向對方提問:「船有多長」、「所有三艘船的尺寸都一樣嗎」,諸如此類的問題 。以此來猜測船隻的位置。

Lake和Wang分別用兩種不同方式來訓練遊戲AI。

一種是監督學習,向神經網絡展示棋盤和人類提出的好問題。最終神經網絡學會了提問,但是很少有創造力。

另一種是強化學習。在這種訓練中,每當神經網絡提出一個有助於找到戰艦的問題時,就會得到獎勵。

神經網絡最終學會了提出正確的問題,既有用又富有創造力。

Lake以前曾使用純粹的符號方法解決了該問題,對於給定的棋盤狀態,符號AI必須在巨大空間中搜索一個好問題,這讓它變得極其緩慢。

但是,神經-符號AI的速度非常快。經過訓練後,深度神經網絡在產生問題方面遠遠勝過純粹的符號AI。

下一步:自動駕駛

MIT-IBM Watson AI實驗室的David Cox團隊希望將這種混合AI用於自動駕駛技術。

自動駕駛AI需要神經網絡經過訓練來識別其環境中的物體,並採取適當的措施。如果神經網絡在訓練中做錯了什麼,例如撞到行人,就會受到懲罰。

另一位小組成員Nathan Fulton解釋這種機制:「為了學會不做壞事,它必須做壞事,體驗過那些壞事,然後在做壞事之前找出30個步驟,防止自己陷入困境。」

因此,AI學習安全駕駛需要大量的訓練數據,而這些「壞事」讓AI很難在現實世界中訓練出來。

Fulton和他的同事正在研究一種神經-符號AI方法,克服這種局限性。AI的符號部分對現實世界的某些危險行為做出限制,來約束深度網絡的行為。

從一開始就排除某些選擇,這種簡單的符號幹預大大減少了訓練AI所需的數據量。

「如果智能體不需要遇到一堆壞狀態,那麼它就只需要更少的數據,」Fulton說。

儘管該項目仍未準備好在實驗室外使用,但Cox設想了一個未來,具有神經-符號AI的汽車將可以在現實世界中學習,而符號組件將成為防止不良駕駛的保障。

原文地址:
https://knowablemagazine.org/article/technology/2020/what-is-neurosymbolic-ai

論文地址:
https://arxiv.org/abs/1910.01442

 

相關焦點

  • MIT 深度學習基礎教程:七個基本框架TensorFlow代碼實戰
    【導讀】麻省理工學院發布一系列深度學習視頻課和代碼實戰,今天給大家介紹的是研究科學家Lex Fridman整理的常用的深度學習七個基本框架實戰,
  • 資源連結|深度學習教程資源整理(伯克利、斯坦福、MIT、阿里、吳恩達)
    近日,麻省理工學院(MIT)正式開源了在線介紹性課程「MIT 6.S191:深度學習入門」。該課程包括一系列有關神經網絡及其在序列建模、計算機視覺、生成模型和強化學習等方面的基本應用知識。近日,來自重慶大學的 Wan Zhen 製作了一份深度學習專項課程筆記,該筆記從神經網絡與深度學習基礎、提升深度神經網絡性能和卷積神經網絡三門課程出發詳細解釋了關鍵概念與作業代碼。本文概括性地介紹了這三課的主要內容,並選擇每個課程主題比較有意思的知識點進行介紹。
  • 吳恩達Deeplearning.ai課程學習全體驗:深度學習必備課程
    Deeplearning.ai 包含的內容 作為深度學習先驅吳恩達的全新嘗試,Deeplearning.ai 是一個自下而上教你神經網絡原理的課程體系,同時淺顯易懂,處於初級-中級難度。吳恩達從他著名的《機器學習》課程遺漏的信息說起,由單一神經元(邏輯回歸)的角度入手介紹神經網絡,隨後慢慢增加複雜性——加入更多的神經元和更多層。在四周課程結束時(第一門課程),學生就會學到構建複雜神經網絡的所有核心知識,如損失函數、梯度下降和向量化並行 python(numpy)實現。
  • 神經網絡和深度學習簡史(全)
    讓我告訴你,說來話長——這不僅僅是一個有關神經網絡的故事,也不僅僅是一個有關一系列研究突破的故事,這些突破讓深度學習變得比「大型神經網絡」更加有趣,而是一個有關幾位不放棄的研究員如何熬過黑暗數十年,直至拯救神經網絡,實現深度學習夢想的故事。
  • 吳恩達Deeplearning.ai課程學習全體驗:深度學習必備課程(已獲證書)
    Deeplearning.ai 包含的內容作為深度學習先驅吳恩達的全新嘗試,Deeplearning.ai 是一個自下而上教你神經網絡原理的課程體系,同時淺顯易懂,處於初級-中級難度。這是經典的吳恩達風格,知識通過精挑細選的課程、長短合適的視頻與精準設置的信息塊共同呈現。
  • 深度學習和深度神經網絡
    深度學習深度學習是眾多機器學習方法中的一種。主要是通過神經網絡來實現。「深度」是指神經網絡的層數。
  • 深度學習應用大盤點
    當首次介紹深度學習時,我們認為它是一個要比機器學習更好的分類器。或者,我們亦理解成大腦神經計算。
  • 打開人工智慧黑箱:看最新16篇可解釋深度學習文章,帶您了解增強AI透明性
    而可解釋性AI在關於人類的很多應用方面是必需的,如醫療診斷、教育學習、政府決策等等。最近,關於深度學習的可解釋性,學者們做了大量的研究工作,專知整理關於深度學習可解釋性的最新一些文章,希望能給讀者提供一些參考和幫助。
  • 什麼是深度學習? - 45分鐘理解深度神經網絡和深度學習
    在筆者所從事的計算機圖形學領域,也出現了越來越多的使用深度學習方法來解決各種問題的研究工作。2018年7月初,筆者首次在第七屆中國科學技術大學《計算機圖形學前沿》暑期課程上講授和分享了筆者從數學(函數逼近論)的角度來對基於深度神經網絡(Deep Neural Network, DNN)的深度學習的進行理解。之後,不斷有學生來向筆者進一步詢問和交流有關資料和問題。
  • 神經網絡與深度學習
    隱藏層使得感知機能夠發展為擬合萬物的神經網絡模型,而反向傳播算法則是整個神經網絡訓練的核心要義。要學習深度學習,恐怕不得不先溫習一下機器學習,搞清楚二者之間的關係。簡單來說,機器學習就是從歷史數據中探索和訓練出數據的普遍規律,將其歸納為相應的數學模型,並對未知的數據進行預測的過程。
  • 一文讀懂深度學習中的矩陣微積分,fast.ai創始人&ANTLR之父出品
    這位ANTLR之父和fast.ai創始人Jeremy Howard一起推出了一篇免費教程,旨在幫你快速入門深度學習中的矩陣微積分。簡明,易懂。DeepMind研究科學家Andrew Trask評價說:如果你想跳過不相干的內容,一文看盡深度學習中所需的數學知識,那麼就是這份資源沒錯了。只需一點關於微積分和神經網絡的基礎知識,就能單刀直入,開始以下的學習啦。
  • 今日Paper|人臉數據隱私;神經符號推理;深度學習聊天機器人等
    為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。
  • AI大事件|深度強化學習Bootcamp-視頻講座&實驗
    utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI本周,AWS和微軟發布了Gluon,一種新的開源深度學習界面,允許開發人員構建機器學習模型。Gluon現在已經在Apache MXNet上可用了。
  • 人工智慧-Andrew Ng版|神經網絡和深度學習|深度學習概述
    專項課程的第一門課是《Neural Networks and Deep Learning 神經網絡與深度學習》。1.1 Welcome這個視頻主要講了什麼是深度學習,深度學習能做些什麼事情。吳恩達老師的從深度學習改變了傳統網際網路業務開始講述,例舉如網絡搜索和廣告。
  • 《神經網絡和深度學習》系列文章四:神經網絡的結構
    本節譯者:哈工大SCIR碩士生 徐偉 (https://github.com/memeda)聲明:我們將在每周一,周四,周日定期連載該書的中文翻譯,如需轉載請聯繫wechat_editors@ir.hit.edu.cn,未經授權不得轉載。
  • 深度 | 致研究者:2018 AI研究趨勢
    blog(http://www.research.ibm.com/ai/)在其中,結果得以清晰展現,所以即使是不諳於研究的人也能看出這有多「酷」。如果我們能構建令人震驚的的多模態-多任務模型,那麼就可以根據完全不同的輸入來解決不同的任務——Google Reasearch 就做到了。他們構建了一個可將圖片和文本作為輸入的體系結構,並用單個神經網絡解決圖像識別、圖像分割、文本翻譯、文本解析等問題。這不算是解決這類問題最聰明的方法,但這是一個很好的開始!
  • 從這開始了解深度學習——視覺的深度學習與網絡
    「深度學習」,接下來就來詳細聊聊深度學習(為什麼要深度學習特徵???),然後來說說深度網絡的搭建,最後讓我們自己用手 DIY 屬於自己的網絡,現在就開始 ing......介紹一說起 「深度學習」,大家有想過為什麼要去搭建複雜網絡,去學習更高級的特徵呢?其實很簡單,因為趨勢是朝著類腦那個大方向,現在類腦工作已經得到很多研究員的關注。
  • NYU、AWS聯合推出:全新圖神經網絡框架DGL正式發布
    機器之心發布作者:DGL Team深度神經網絡在近年來的發展和成功有目共睹。這些網絡架構成功的一個重要原因在於其能有效地捕捉到了數據內在的相關性,並在不同的抽象級別構建表示 (representation)。比如 CNN 刻畫了圖片中相鄰像素點間的空間不變性;RNN 抓住了文本數據的有序線性結構。
  • 【ICML2020】深度神經網絡置信感知學習
    題目:Confidence-Aware Learning for Deep Neural Networks簡介:儘管深度神經網絡可以執行多種任務已經提出了許多新的工作來減輕這個問題,但是大多數工作需要在訓練和/或推理階段增加計算成本,或者需要定製的體系結構來分別輸出置信估計。在本文中,我們提出了一種使用新的損失函數訓練深度神經網絡的方法,稱為正確排名損失,該方法將類別概率顯式規範化,以便根據依據的有序等級更好地進行置信估計。所提出的方法易於實現,並且無需進行任何修改即可應用於現有體系結構。
  • 【四】零基礎入門深度學習:卷積神經網絡基礎之池化和Relu
    ,提升AI技能) 作者 | 孫高峰 百度深度學習技術平臺部資深研發工程師本文轉自飛槳PaddlePaddle前期內容【一】零基礎入門深度學習:用numpy實現神經網絡訓練【二】零基礎入門深度學習:用一個案例掌握深度學習方法【三】零基礎入門深度學習:卷積神經網絡基礎之初識卷積今天為大家帶來的是卷積神經網絡基礎之池化和Relu。