DeepMind新論文:人工智慧學會像哺乳動物那樣抄近路

2021-01-11 澎湃新聞

一手創造史上最強圍棋人工智慧AlphaGo的DeepMind團隊,又教會了人工智慧在迷宮中「抄近路」。

北京時間5月10日凌晨1時,該英國團隊在世界頂級學術雜誌《自然》上發表論文稱,其最新研發出的一個人工智慧程序具有類似哺乳動物一樣的尋路能力,非常類似大腦中網格細胞的工作原理。

神秘的網格細胞:大腦內置GPS

從家出發到新的地點,再原路返回,從中選擇儘可能的捷徑,這是絕大多數動物都能勝任的簡單任務。然而,大腦這種本能的導航機制尚未被完全理解。

科學家們在動物和人類大腦中找到了三種跟認路相關的細胞,分別是位置細胞、方向細胞和網格細胞。

位置細胞能在主體到達特定地點時放電,從而賦予對過往地點的記憶;方向細胞能感應前進的方向;網格細胞則是最神秘的一種:它們能將整個空間環境劃分成蜂窩狀的六邊形網格,仿佛地圖上的坐標系。

發現網格細胞的的莫索爾夫婦因此獲得了2014年的諾貝爾生理學或醫學獎。不過,網格細胞僅僅是在空間環境中提供GPS定位服務嗎?一些科學家猜測,它們也會參與矢量計算,輔助動物規劃路徑。

人工神經網絡中自動出現類似結構

DeepMind團隊決定用人工神經網絡檢驗上述猜想。人工神經網絡是一種利用多層處理模擬大腦神經網絡的運算結構。團隊首先用深度學習算法訓練神經網絡學習哺乳動物的覓食運動路徑,利用線速度、角速度等信號在視覺環境中進行定位。

研究人員隨後發現,一種類似於網格細胞活動特徵的結構自動誕生了!在此前的訓練中,研究人員並未刻意引導神經網絡產生此種結構。

人工神經網絡中自動出現了與大鼠網格細胞(下)類似的網格結構(上)  圖片來源:DeepMind官方博客

這再次顯示了深度學習的可喜又可畏之處:這是一種通過大量匹配的輸入和輸出值訓練機器自我摸索的算法,最後得到的機器邏輯是不為人知的黑匣子。正如AlphaGo自動領悟了人類千年棋史上從所未見的「天外飛仙」棋招,這次的神經網絡也自動出現了令人驚喜的結構。

迷宮尋路

DeepMind團隊隨後利用強化學習檢驗這種網格結構是否能夠進行矢量導航。強化學習被普遍用於訓練遊戲AI,人類告訴AI一種遊戲的得分獎懲機制,但卻不教授遊戲方法,由AI在反覆進行遊戲、努力爭取更高分的過程中自我進化。後期的AlphaGo就完全擯棄了人類棋譜經驗,在純粹的自我對弈中從零進化到更強版本。

研究人員將之前自動出現的網格結構與一個更大型的神經網絡架構結合成了人工智慧體,置於虛擬實境的遊戲環境中。經歷強化學習後,該人工智慧在遊戲迷宮中向目的地前進的導航能力超越了一般人,達到了職業遊戲玩家水平。它能像哺乳動物一樣尋找新路線和抄近路。

人工智慧學習在迷宮中抄近路

最關鍵的是,當研究人員「靜默」原來的網格結構後,人工智慧體的導航能力就會變弱,判斷目標的距離和方向都更不準確了。

論文作者之一Dharshan Kumaran說道:「我們證明了網格細胞遠不只是給我們提供GPS定位信號,也是一種大腦賴以計算兩個地點間的最短距離的核心導航機制。」

用人工智慧代替小白鼠做實驗

與一直強調「人工智慧不是仿生學」的Facebook人工智慧首席科學家楊立昆(Yann Lecun)不同,天才創始人戴密斯·哈薩比斯(Demis Hassabis)執掌的DeepMind熱衷探索人工智慧與腦科學的相輔相成。這項研究再一次體現了他們的科學理念:腦科學啟發下的人工智慧算法能反過來幫助人類探索大腦運行機制,從而也更好地理解人工智慧的內在邏輯。

哈薩比斯評價道:「我們相信人工智慧和神經科學是相互啟發的。這項工作就是很好的證明:通過研發出一個能在複雜環境中導航的人工智慧體,我們對網格細胞在哺乳動物導航中的重要性有了更深的理解。」

DeepMind團隊相信,類似的研究方法還可以用來探索大腦聽覺和控制四肢的機制。在更遠的將來,神經科學家們甚至可以用人工智慧代替小白鼠來做實驗。

(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)

相關焦點

  • Deepmind新一代AlphaGo Zero自學3天打敗AlphaGo
    今天凌晨,谷歌旗下Deepmind人工智慧團隊發布了一篇轟動AI界的論文,《Mastering the game of Go without human knowledge》(在沒有人類知識的情況下掌握圍棋),一句話總結這篇論文,他們研發的AlphaGo大表哥AlphaGo Zero能夠在沒有人類圍棋對弈數據的情況下
  • 谷歌DeepMind 的可微分神經計算機 DNC 怎麼樣?看 Facebook AI...
    近日,谷歌的 AI 部門 DeepMind 開發了一種叫做可微分神經計算機(DNC)的神經網絡模型,相關論文發表於 10 月 12 日在線出版的《自然》雜誌上,題為《 利用神經網絡與外部動態存儲器進行混合計算》。這種新模型將神經網絡與可讀寫的外部存儲器結合,既能像神經網絡那樣通過試錯和樣本訓練進行深度學習,又能像傳統計算機一樣處理數據。
  • 深度學習之Google Deepmind的Alphago人工智慧算法技術演變歷程
    最近大家比較關心的圍棋人機大戰(Alphago vs 李世石)中,deep mind基於Nature2016文章的Alphago在5局制的比賽中已經取得了4-1的獲勝。這兩篇文章都是蒙特卡洛搜索樹+DCNN,效果Google的Alphago優於facebook的方法,剛好藉此機會將之前看到的deep mind該領域的文章捋了一下。
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    #近日,又一世紀級難題被AI迎刃而解:谷歌旗下子公司Deepmind通過AI建立的算法模型,成功精準預測了蛋白質的摺疊方式,這將對人類了解重要的生物學過程和治療新冠等疾病起到十分關鍵的作用。有別於功能應用越來越細分的AI,AGI可簡單理解為我們在各種大片中看到的機器人,具備與人類相近的大腦獨立思考能力的人工智慧。Deepmind最初由三名科學家聯合創辦,就像其創始人兼CEO哈薩比斯(Demis Hassabis)所說的,它的性質更像一個科技研究院而不是創業公司,因為公司一開始並沒有任何產品,而是一直在通過遊戲來研究人工智慧算法。
  • Deepmind Nature論文揭示最強AlphaGo Zero
    AlphaGo「退役」了,但Deepmind在圍棋上的探索並沒有停止。今年5月的烏鎮大會的「人機對局」中,中國棋手、世界冠軍柯潔9段以0:3不敵AlphaGo。隨後Deepmind創始人Hassabis宣布,AlphaGo將永久退出競技舞臺,不再進行比賽。
  • DeepMind新GNN模型,將谷歌地圖預估到達準確率提升50%!
    例如,儘管上下班尖峰時間都會發生在早上、晚上,但具體的確切時間可能每天、每月都有很大差異;一條小巷的擁堵,就會蔓延到下一個大路——這一點,地圖往往無法實時監控;另外,道路質量、限速、事故和封路等因素,都會給預測模型帶來麻煩。
  • 用神經網絡求解薛丁格方程,DeepMind開啟量子化學新道路
    論文地址:https://arxiv.org/abs/1909.02487神經網絡已知最好的應用是在人工智慧領域——視覺、語音和遊戲,但它們在科學和工程領域也有嚴肅的應用。谷歌的 DeepMind 已經訓練出了一個能求解薛丁格方程的神經網絡。為什麼要計算薛丁格方程呢?
  • DeepMind又立功了 | 附兩篇新論文
    即使是最聰明的人工智慧系統,在這種複雜環境中展開想像都會是漫長而成本高昂的過程。 在兩篇最新論文中,我們描述了一類新方法,讓人工智慧建立以想像力為基礎的計劃能力。我們還提出了一種架構,給人工智慧系統提供新方式,去學習並構建計劃,最大化任務效率。對於不完美模型,這些架構高效而健壯,可以利用靈活的策略去發揮想像力。
  • DeepMind 論文三連發:如何在仿真環境中生成靈活行為
    掌握這種精密複雜的運動控制是物理智能(physical intelligence)成熟的標誌,同時也是人工智慧研究中的關鍵一環。  真正的運動智能需要學習控制和協調身體的靈活性從而完成複雜環境之中的任務。控制物理仿真類人身體的嘗試來自多個領域,包括計算機動畫和生物力學(biomechanics)。存在一種使用手工對象(有時帶有動作捕捉數據)生成特定行為的趨勢。
  • 向李昌鈺學破案,這是Deepmind預測蛋白質結構的秘密研究方法嗎?
    可能在社會責任感的感召下,人工智慧公司想在人類急需前沿科技的領域創造一些有價值、有意義的事情,比如生命科學。眾所周知,全世界頂級的圍棋選手人工智慧阿法狗之父,Deepmind公司最近又因為在生命科學領域的成就,上了科技界的熱搜榜。這個小成就就是,新的算法AlphaFold 可以僅根據基因預測生成蛋白質的三維形狀。
  • AlphaGo背後團隊Deepmind有多牛 核心團隊成員資料介紹
    Deepmind官方網站也報導了今天的人機大戰  鑑於此次AlphaGo戰勝的是圍棋界一等一的高手,更重要的是這背後延伸出來的意義——機器已經擁有類人般的學習能力,並且能夠據此戰勝人類。雖然結果未必會以電影《終結者》當中那樣,以人機之間的暴力衝突收場。
  • AlphaFold抗疫,DeepMind公布六種新冠病毒蛋白質結構預測結果
    在昨天發表的博客文章中,DeepMind 表示,他們用 AlohaFold 生成了六種可能與新冠病毒有關的蛋白質結構預測結果,而且已經開放下載。這一結果可能對新冠病毒疫苗研發等工作起到推動作用。DeepMind 開放的新冠病毒蛋白質結構預測結果下載連結:https://storage.googleapis.com/deepmind-com-v3-datasets/alphafold-covid19/structures_4_3_2020.zip為什麼要用深度學習預測新冠病毒蛋白結構?
  • DeepMind破解蛋白質摺疊難題
    ,利用通用人工智慧來極大地加速科學發現的步伐,幫助我們更好地了解周圍世界。」,這篇論文繼續啟發了其他工作和社區開發的開源實現。基於AlphaFold的新突破,人類未來也可能更快地發現更先進的新藥物。知名領域專家Mohammed AlQuraishi發推稱;「它們令人震驚——deepmind似乎已經解決了蛋白質結構預測問題。」
  • DeepMind開源AlphaFold,蛋白質預測模型登上《Nature》
    對於DeepMind的預測方法,由於當時沒有具體論文發布,眾多學者認為是計算能力突出使得AlphaFold獲得冠軍。代碼:https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13模型:https://www.biorxiv.org/content/10.1101/846279v1.full.pdf根據DeepMind的介紹,在預測蛋白質結構的物理性質方面使用了兩種不同的方法來構建預測模型
  • DeepMind綜述深度強化學習中的快與慢,智能體應該像人一樣學習
    不過雖然它們很強大,但學習效率的低下讓它們很難推廣到更普遍的任務,也許結合「快」與「慢」的學習才是強化學習應該走的路。DeepMind 研究者近期在 Trends In Cognitive Sciences 期刊上發表文章,概覽了深度強化學習中的一些新技術,這些技術旨在彌補強化學習智能體與人類之間的學習速度鴻溝。
  • DeepMind發表Nature子刊新論文:連接多巴胺與元強化學習的新方法
    上周,DeepMind在 Nature 發表論文,用 AI 復現大腦的導航功能。今天,DeepMind 在 Nature Neuroscience 發表新論文,該研究中他們根據神經科學中的多巴胺學習模型的局限,強調了多巴胺在大腦最重要的智能區域即前額葉皮質發揮的整體作用,並據此提出了一種新型的元強化學習證明。
  • DeepMind抗疫:預測新冠病毒相關蛋白結構
    DeepMind利用其最新版本的AlphaFold系統,發現幾種與新冠病毒(SARS-CoV-2)相關的蛋白質的結構預測,並在今天對所有人公開。他們表示,這些蛋白質結構還尚未被專家研究,希望能夠對抗疫科研作出貢獻。
  • DeepMind破解蛋白質摺疊難題
    DeepMind聯合創始人及CEO德米斯·哈薩比斯(Demis Hassabis)表示:「DeepMind背後的終極願景一直是構建通用人工智慧,利用通用人工智慧來極大地加速科學發現的步伐,幫助我們更好地了解周圍世界。」谷歌CEO桑達爾·皮查伊(Sundar Pichai)在Twitter上為此次突破點讚。
  • AI巨頭實力排名新鮮出爐:DeepMind第一,IBM墊底
    在 PR 和吸引公眾目光方面,Deepmind 也是首屈一指的,例如 DQN-Atari 和創造歷史的 AlphaGo 時的 PR。每當 Deepmind 發一篇論文,很快就會出現在 Reddit 機器學習板塊和 Hacker News 的頂部,表明他們在技術社區多麼受到推崇。梯隊2.
  • DeepMind重大突破:DNN具有人類行為,認知心理學破解黑箱
    編者按:本文由微信公眾號編譯,來源:deepmind.com 等,作者:DeepMind、Brian Mingus,編譯:熊笑;36氪經授權發布。「新智元」(ID:AI_era)DeepMind 的最新論文稱過去「首次」將認知心理學方法引入了對深度神經網絡黑箱的理解研究中,並用認知心理學的方法發現了深度神經網絡存有和人類兒童在學習詞彙時也存在的「形狀偏好」的行為。此文一出,就有學者指出,DeepMind 是在將自己的研究包裝為全新的研究。