深度| 構建好奇的機器,Maluuba的通用人工智慧探索(附論文)

2020-11-22 搜狐網

原標題:深度 | 構建好奇的機器,Maluuba的通用人工智慧探索(附論文)

選自Maluuba

機器之心編譯

參與:李澤南、朱思穎

人類具有對認識和理解的天生欲望。從學習騎自行車到學習在線課程,我們通過與周遭環境互動來獲得信息。最近,我們受到人類學習方式的啟發,開發了一套任務,讓人工智慧體學會了如何通過提出問題來尋找有效信息。同時,我們也設計了一個基於深層神經網絡的人工智慧系統,它可以通過高效的信息搜索完成這些任務。我們相信,這些研究讓人類向通用人工智慧邁出了重要一步。

問正確的問題

假如你在和朋友聚餐,在飯桌上玩起了「20 個問題」遊戲。現在輪到你了,你決定讓大家來猜「貓」。他們開始從大範圍問題切入:「它/他是活物嗎?」,「它/他是一個人嗎?」,「它/他是一種動物嗎?」,「它是否生活在水下?」。首先猜出正確答案的人會成為勝利者,所以你的朋友們不僅需要找出正確的答案,而且還要儘量少問問題。基於簡單的是或不是的回答方式,你的朋友們可以很快地縮小尋找範圍,最終猜出正確的答案「貓」。

這個例子說明了人類尋找信息的過程具有的迭代性質:你正在尋找的信息永遠基於你已經獲得的信息。同樣,為了保持效率,尋找信息的智能體必須在某種意義上理解它已經獲得的信息。它必須知道自己已經知道了什麼,從而可以知曉如何達成自己真正需要完成的任務。

「20 個問題」的例子也表明了交流通常是在受限的條件下進行的:每個答案都是簡單的是或否(僅僅傳遞 1bit 信息),而且問題的數量也是有限的。在現實世界中我們對於信息的搜索往往面臨同樣的困局——我們通過有限的語言在有限的時間內交流。比如在網上搜索,思考為朋友挑選哪件禮物,你一開始會隨便搜搜——以對方的年齡、性別和自己的錢包為導向——隨後再在縮小的範圍內以興趣和推薦等條件為依據找到最終目標。

由於這種方式構建了智能行為的基礎,人們對人工智慧尋找信息的方法已經進行了廣泛的研究,認知科學、心理學、神經科學和機器學習的角度都已被涉足。例如,在神經科學中,信息尋找策略通常被解釋為對新奇,令人驚訝或不確定的事件的偏見(Ranganath 和 Rainer,2003)。信息尋找是樂趣和創造力等概念的一個關鍵組成部分(Schmidhuber,2010)和內在動機(Oudeyer 和 Kaplan,2007)。也有一些研究認為注意力機制是人類尋找信息的策略,通過忽略不相關的特徵提高了處理問題的效率(Mnih 等人,2014)。

信息搜索的新任務

研究人員會使用各種工具和系統用來訓練人工智慧,從數據集到定製學習環境。人工智慧已經在西洋棋、圍棋、Atari 遊戲中取得了令人矚目的成就。同樣,許多人類熱衷的遊戲看起來正是為了訓練信息搜索而設計的,也許人類能從信息搜索的過程中得到快感。

因此,我們設計了一套信息搜索的任務集來訓練和評估人工智慧的信息搜索能力。在這裡我們展示了三種任務(其他的任務詳見我們的論文):

在任務集中,最有意思的任務就是「劊子手」,「面部識別」和「戰船」。這些任務中,每一個都有自己的獨特規則和獲勝目標。更重要的是,每個任務都需要人工智慧可以在已有信息的基礎上尋找更多信息。

劊子手:西方經典遊戲,給出一個單詞,人工智慧必須在指定輪次內猜出該單詞的每一個字母。

面部識別:人工智慧需要在這個遊戲中回答諸如:「這個人是否戴著帽子?」「這個人是否有鬍子?」這類的問題。

戰船:人工智慧需要擊沉地方戰船,它們會隨機出現在網格中,事先處於隱藏狀態,選擇正確的網格意味著敵方被「擊中」。

訓練模型來獲取信息

在我們任務中人工智慧的行為表現可以理解為對其周圍環境進行提問,如「這個短語包涵字母'a'嗎?」或者「這部分的像素塊看起來像什麼?」為了成功獲取信息,一個人工智慧體必須學會提出有效問題並消化由此獲取的信息。

我們開發了一個模型,這一模型被訓練用來完成上述任務。在完成某一任務的每一步裡,模型都會提出一個其所認為當前情形下最有效的問題,然後從環境中獲取相應的回覆,並進一步將所獲取的回覆與其既有的知識(knowledge)整合。這個模型是一個深度神經網絡,通過把強化學習的技巧(具體是:廣義優勢估計——Generalized Advantage Estimation,Schulman 等人,2016)和反向傳播結合起來的方式訓練得到。詳細內容請參閱該研究的論文。

在訓練中,人工智慧會尋求獎勵最大化,這個最大化獎勵包涵多個特定任務的外部獎勵和一個任務無關的內部獎勵。外部獎勵促使人工智慧體通過儘量多的問題來獲取有效回復,內部獎勵促使模型提出能獲取環境最新信息的問題。具體來說,我們對每個問題的獎勵設置是依據這個問題的回覆能多大程度增加模型的認知與世界真實狀態之間的相似度。因此,人工智慧學會了如何高效的對周圍環境構建一個與之對應的精確內部圖。

目標:通用人工智慧

就如在 demo 裡展示的那樣,我們的方法所訓練出的人工智慧體能夠成功完成較廣泛領域內的任務。同樣的方法可以用於語言處理問題、圖像處理問題以及決策問題。在我們的任務中,所訓練出來的人工智慧的行為是具備可解釋性的,且這些系統具有智能化的信息獲取能力,它們的效率經常超過人類的水平。

我們希望這些研究能為通用智能的發展奠定基礎。我們當下的工作只是朝實現這一宏偉目標所邁出的一小步。

相關論文:TOWARDS INFORMATION-SEEKING AGENTS

摘要:我們開發了一種通用問題集用於訓練和測試人工智慧體收集有效信息的能力。具體來說,它是一系列任務的集合,完成這些任務需要在給定環境中尋找有效信息。同時,我們將深層架構和強化學習技術整合到一起,構建了用於處理此類問題的人工智慧系統。我們通過組合內部和外部獎勵機制來塑造人工智慧體的行為。我們的研究表明,這些人工智慧體可以學會積極、智能化地搜索信息以減少不確定性,並在這個過程中不斷利用已有信息。

©本文為機器之心編譯,轉載請聯繫本公眾號獲得授權

✄------------------------------------------------

加入機器之心(全職記者/實習生):hr@almosthuman.cn

投稿或尋求報導:editor@almosthuman.cn

廣告&商務合作:bd@almosthuman.cn返回搜狐,查看更多

責任編輯:

相關焦點

  • 深度| 機器的自我進化:走向自主編程的人工智慧(附提交ICLR 2017的...
    原標題:深度 | 機器的自我進化:走向自主編程的人工智慧(附提交ICLR 2017的自動編程論文) 選自ICLR、VentureBeat 機器之心編譯
  • 神經、認知、計算三學科深度交叉 建開源開放平臺探索人工智慧...
    神經、認知、計算三學科深度交叉建開源開放平臺探索人工智慧「無人區」目前,大數據+深度學習+大算力構成了人工智慧的主要發展模型,但更多的數據、更強的算力和改進的算法卻未必會讓人工智慧更聰明。有專家指出,人工智慧未來發展的關鍵並不是簡單提高算力和增加數據,而是要重新思考智能模型。
  • 為何除了馬斯克,沒人願意猜通用人工智慧何時出現?
    AGI 將是通用 AI,而不是高度發展的智能。但是萊格還認為,人類可以與 AGI 交際,就好像它也是人類。 他所描述的機器像是玩伴:如果可以與機器互動,給機器展示新的紙牌遊戲,教機器玩,機器會問問題,然後一起玩遊戲,那可太美了。「我的夢想成真了。」 他說。 當人們談論通用人工智慧時,通常會想到的是這些類似於人的能力。
  • 「直覺機器」和「代數思維」,哪條路能走向通用人工智慧?
    編者按:不久前紐約大學心理學教授、Uber人工智慧實驗室前負責人、人工智慧創業公司Geometric Intelligence創始人Gary Marcus給深度學習潑了10次涼水,指出了這種人工智慧方法存在的諸多限制。這次《人工直覺與深度學習手冊》作者Carlos E. Perez開始針鋒相對,逐條予以反擊。
  • 清華大學天機晶片登Nature:類腦加傳統計算融合通用人工智慧
    機器之心報導機器之心編輯部8 月 1 日,頂級學術期刊《自然》雜誌的封面文章介紹了清華大學在通用人工智慧上的新嘗試:一款名為「天機」的全新晶片架構,結合類腦計算和人工智慧算法,展示了迄今為止從未有人實現過的強大能力。
  • 谷歌深度學習實驗室:讓人工智慧在虛擬接觸中訓練感知
    孩子能通過遊戲學習,為什麼機器不可以呢?對於人類來說,了解一個物件屬性最簡單的方法(它是冷是熱,是輕是重,是尖是鈍)是把它撿起來,用手把玩一下。現在,谷歌深度學習實驗室的人工智慧工程師正在用相同的方法訓練機器——通過比較虛擬積木的物理屬性探索它們。
  • 棋類大師 AlphaZero 無師自通,「通用人工智慧」加速到來?
    Perez看來,這是他提出的複雜的邏輯思維可以通過直覺機器來完成的直接證據。AlphaZero的橫空出世,跨越了實現通用人工智慧的一道巨大鴻溝——「語義鴻溝」。Perez認為,這是AGI的一個極其難以實現的裡程碑事件,而且它到來之快已經遠遠超出了專家的估計。現代文明以及披上技術的外衣導致了我們自身直覺的衰退。
  • 類腦智能,邁向通用人工智慧新可能?
    文章經授權轉自公眾號:腦極體(ID:unity007);作者: 海怪如今,第三次人工智慧浪潮的興起已經是一個不爭的事實。我們知道這一次的人工智慧浪潮不僅僅是一次技術的創新,更是一場產業的變革。機器學習,特別是深度學習等算法的突破、算力和數據的井噴,讓AI技術已經廣泛應用在社會生產生活的眾多領域。
  • 突破AI和機器理解的界限,牛津CS博士143頁畢業論文學習重建和分割...
    選自arXiv作者:Bo Yang機器之心編譯讓機器擁有像人類一樣感知 3D 物體和環境的能力,是人工智慧領域的一項重要課題。牛津大學計算機科學系博士生 Bo Yang 在其畢業論文中詳細解讀了如何重建和分割 3D 物體,進而賦予機器感知 3D 環境的能力,突破了人工智慧和機器理解的界限。賦予機器像人類一樣感知三維真實世界的能力,這是人工智慧領域的一個根本且長期存在的主題。考慮到視覺輸入具有不同類型,如二維或三維傳感器獲取的圖像或點雲,該領域研究中一個重要的目標是理解三維環境的幾何結構和語義。
  • 人工智慧,「吃一塹長一智」的機器
    人工智慧領域在過去10年來達到目前的發展高度,技術上最大的功臣無疑是深度學習(Deep Learning)。深度學習利用多層人工神經網絡,從極大的數據量中學習,對未來做出預測,讓機器變得更加聰明。強化學習和深度學習的整合,讓機器學習有了進一步的運用,衍生出深度強化學習(Deep Reinforcement Learning)。2016年,Google的圍棋軟體利用深度強化學習擊敗了世界圍棋冠軍,成為人工智慧的又一個裡程碑。雖然西洋棋、圍棋等腦力運動代表著人類智慧的堡壘,但是強化學習技術的「接地氣」的應用場景還不算多,目前也無法在產出的商業價值上與深度學習相媲美。
  • 極客研報|國內人工智慧行業全梳理(內附 PDF 版)
    同期,被譽為「計算機科學之父」的 Alan Turing 在 Mind 上發表論文,第一次提出機器智能設想。雖然未提到具體的研究方法,但論文中提到的「圖靈測試」、「機器學習」、「遺傳算法」和「強化學習」等理論也在日後成為了人工智慧領域重要的分支。圖靈的計算理論認為任何形式的計算均可被數位訊號描述,這也為人工智慧的後續實踐提供了理論基礎。
  • 摘要翻譯、論文寫作……人工智慧延伸科學交流觸角
    據介紹,運用自然語言處理技術,小柯以英文論文摘要為基礎,能夠快速寫出中文科學新聞底稿,然後由專業人士和報社的編輯進行把關和信息完善,幫助科學家以中文方式快速獲取全球高水平英文論文中的最新科研進展。目前小柯的作品已經上線。人工智慧的觸角,也在伸向各個領域。
  • 如何區分人工智慧、機器學習和深度學習?
    人工智慧(Artificial Intelligence)是一個最廣泛的概念,人工智慧的目的就是讓計算機這臺機器能夠象人一樣思考,而機器學習(Machine Learning)是人工智慧的分支,專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,使之不斷改善自身的性能。
  • 什麼是通用人工智慧,會對人類產生威脅嗎?
    通用人工智慧作為人工智慧學科的核心目標,成為了最受關注的人工智慧科技之一。近日,作家馬丁·福特在採訪人工智慧領域的傑出人物時,讓他們對人類在哪一年能夠有50%的機會實現通用人工智慧作出預測,受訪者給出的預測時間平均算下來是在2099年。雖然,根據專家預測,距離通用人工智慧的到來還有相當長的一段時間。但是,仍有人提出了通用人工智慧會對人類造成威脅的觀點。那麼,事實真會如此嗎?
  • 華盛頓大學成立SAML實驗室:陳天奇參與,探索跨系統堆棧多層問題
    我們想解決調度、網絡、存儲和編程抽象方面的新挑戰,構建可從新興硬體體系中受益的可擴展系統,處理不斷增長的可用數據。重要的是,未來的模型和算法需要與硬體共同設計,系統級的要素需要告知硬體軟體棧的設計。我們需要建立通用、可復用的基礎設施,並製造更智能的系統。目前,這些挑戰和研究問題涉及計算機科學的多個領域。
  • 人工智慧、機器學習及認知計算初學者指南
    千年以來,人類一直在思考如何構建智能機器。從那時起,人工智慧 (AI) 經歷過高潮與低谷,既展現了成功的一面,也有許多潛力有待發掘。時至今日,採用機器學習算法來解決新問題屢屢見諸報端。本文將帶您探索 AI 及其子領域的一些重要方面。首先我們來了解一下 AI 發展的時間表,然後深入了解各個要素。
  • 摘要翻譯、論文寫作、信息檢索、抄襲檢測……人工智慧延伸科學...
    據介紹,運用自然語言處理技術,小柯以英文論文摘要為基礎,能夠快速寫出中文科學新聞底稿,然後由專業人士和報社的編輯進行把關和信息完善,幫助科學家以中文方式快速獲取全球高水平英文論文中的最新科研進展。  目前小柯的作品已經上線。人工智慧的觸角,也在伸向各個領域。
  • ...深度強化學習綜述:從AlphaGo背後的力量到學習資源分享(附論文)
    選自arXiv作者:Yuxi Li編譯:Xavier Massa、侯韻楚、吳攀摘要本論文將概述最近在深度強化學習(Deep Reinforcement Learning)方面喜人的進展。本文將從深度學習及強化學習的背景知識開始,包括了對實驗平臺的介紹。
  • 首屆AAAI/ACM SIGAI博士論文獎公布,姚班學霸吳佳俊獲獎
    AAAI / ACM SIGAI博士學位論文獎由AAAI和ACM SIGAI聯合設立,以表彰和鼓勵人工智慧領域的博士生的出色研究和論文,提名者必須是ACM SIGAI成員和/或AAAI成員。該獎項將每年在AAAI上頒發,獲獎者將被邀請在大會上發表演講。
  • NIH開源迄今最大臨床醫療圖像數據集,用深度學習構建通用疾病檢測...
    要設計深度學習算法解決臨床問題,「需要對技術和臨床實踐兩方面都擁有深刻的理解,」呂樂博士說:「AI 不是把放射科裡面的東西再重新做一遍。哪些需求是臨床上迫切需要的,哪些需求是當前技術能夠滿足的,將放射科學、計算機科學和人工智慧結合在一起時,有很多需要深度考量和仔細權衡的東西,蠻幹是不行的。」