DeepMind聯手哈佛大學,研究神經科學,不同尋常的思路令人興奮

2020-12-04 DeepTech深科技

在人工智慧(AI)的研究中,神經網絡已成為最核心的課題之一。

儘管 AI 研究的神經網絡和大腦中神經元的工作方式有很大區別,但越來越多的科學家認為,這種受到大腦結構啟發而創造出的技術與神經科學存在密切聯繫。研究兩者的相似和不同之處,不僅可以加深我們對神經科學的理解,還可以使 AI 更聰明。

在研究神經科學時,大鼠是常見的實驗對象之一,比如分析大鼠大腦是如何支配其運動的。那麼我們可以像研究大鼠一樣研究 AI 嗎?

DeepMind 和哈佛大學的研究人員認為這一思路是可行的。他們創造了一個由 AI 驅動的虛擬大鼠,可以在模擬的 3D 環境中執行多項複雜任務。在研究所謂的 「AI 大腦」 如何控制大鼠運動的過程中,神經科學技術便可以派上用場。

論文作者之一,哈佛大學研究員傑西 · 馬歇爾(Jesse Marshall)表示,這項研究像是給神經科學研究搭建了風洞實驗室,允許研究人員用不同程度的生物真實性測試不同的神經網絡,從而了解它們如何應對複雜任務和挑戰。

圖 | 模擬大鼠和測試環境(來源:DeepMind & 哈佛大學)

「神經科學研究的典型實驗會在動物執行簡單任務時探查其大腦。相似的,我們希望了解大腦是如何產生和實現靈活性的,然後用成果來設計具有類似機制的人造代理(AI agent),」 傑西解釋稱。

研究人員表示,他們在模擬三維環境中利用神經網絡控制了一隻大鼠的生物模型,然後利用神經科學技術分析生物大腦活動,來更好地了解神經網絡控制大鼠運動的機制。

該研究成果以論文形式發表於正在舉行的 ICLR 大會(國際表徵學習大會)上。ICLR 大會項目組認為,為了使用神經科學技術來理解神經網絡控制特定主體,這項研究採用了不同尋常的思路,提供了一個新的研究方向,令人興奮。

虛擬 AI 大鼠的構造以真實大鼠為基礎,其肌肉,關節和視覺都是基於真實大鼠的測量數據。為了讓 AI 更逼真,虛擬大鼠還能實現本體感覺,即肌肉運動知覺,一種告知動物身體部位及其運動方式的反饋系統。

為了控制虛擬大鼠,研究人員訓練了一個神經網絡,負責指導其完成四種挑戰:跳過空隙,在迷宮中尋路和覓食,逃出山丘環境和符合時間間隔要求的拍球運動。

在大鼠完成任務之後,研究小組會利用神經科學技術分析其 「AI 大腦」 神經活動的記錄資料,以了解神經網絡是如何實現完成特定任務所需的運動控制的。

在現實世界中,研究動物神經活動並將其與特定行為聯繫起來是十分複雜的,大多數實驗都是在嚴格的實驗環境中進行相對簡單的任務。而在虛擬環境中,如果可以很好地模擬大鼠神經活動,控制其完成多部分組成複雜行為,比如覓食和拍球,就可以更好地匹配神經活動和特定行為。

由於驅動大鼠的 AI 系統是自行開發的,所以針對神經網絡運行機制的分析大多是可以預料且符合預期的。不過一個有意思的發現是,如果神經活動直接控制肌肉力量和肢體運動,那麼其持續時間似乎比預期更長。

圖 | AI 大鼠走迷宮(來源:DeepMind & 哈佛大學)

這意味著神經網絡能夠以奔跑,跳躍,旋轉和其他直覺行為等抽象尺度上表示行為。同時,神經網絡似乎還擁有跨任務重用某些行動表示形式的能力,對行為進行編碼的神經活動通常會採用序列的形式。

換句話說,在神經網絡看來,雖然跑步和跳躍等行動需要協調多個身體部位和肌肉組織,但一旦特定的運動模式經常出現,便可以抽象為某種特定運動方式。比如大鼠(AI 大腦)發現後肢發力可以高高躍起,那麼就會記住這是跳躍,如果在執行其他任務時需要跳躍,就會直接控制其後腿發力。

研究人員表示,這種抽象能力和認知模型被普遍認為存在於動物身上,在齧齒和鳴禽動物身上都已觀察到。新的發現進一步證實了這種模型的存在,而且這種現象是自然出現在神經網絡中,並沒有明確設置獎勵機制。因此在印證事實的同時,該研究也證明了神經網絡和神經科學的相似性。

目前研究人員已經開源了虛擬大鼠項目,希望其他團隊可以在現有模型基礎上更進一步,在虛擬環境中測試不同的神經網絡實現方式。

沒有參與研究的加拿大麥吉爾大學神經科學家布萊克 · 理查茲(Blake Richards)認為,儘管沒有模擬全部的生理真實性,但訓練出的神經網絡仍然捕獲了足夠神經活動特徵,可以就神經活動產生的影響進行有價值的預測。

「該論文的一大貢獻在於,提出了一種以現實手段訓練神經網絡的方法,可以更輕鬆地比較生物學數據和虛擬神經網絡數據,」 布萊克強調。

相關焦點

  • DeepMind研究表明,大腦使用與AI類似的分布獎勵機制
    早在 20 世紀 90 年代,受到強化學習算法啟發的研究就已經證明,動物大腦中獎勵系統的運作方式幾乎與這套機制相同。當人或動物將要執行某項行動時,大腦中掌管獎勵機制的多巴胺神經元就會計算預期回報。一旦收到了實際獎勵,它們便會釋放出與預測誤差成正比的多巴胺。如果實際獎勵高於預期,就會觸發強烈的多巴胺分泌,令人倍感愉悅,而低於預期的回報則會抑制它的產生。
  • DeepMind重大突破:DNN具有人類行為,認知心理學破解黑箱
    編者按:本文由微信公眾號編譯,來源:deepmind.com 等,作者:DeepMind、Brian Mingus,編譯:熊笑;36氪經授權發布。為了展示這一點,我們的研究報告包括了一個案例研究:我們設計了一個實驗,來闡明人類認知,從而幫助我們理解深度神經網絡是如何完成一個圖像分類任務的。我們的研究顯示,認知心理學家觀察到的行為,同樣出現在深度神經網絡中。而且,對於網絡是如何完成圖像分類任務的,研究結果揭示出有用且令人驚訝的洞見。更籠統地說,案例研究的成功體現出了使用認知心理學理解深度學習系統的潛力。
  • 向李昌鈺學破案,這是Deepmind預測蛋白質結構的秘密研究方法嗎?
    不,我們要向李昌鈺博士學習破案手段,絕不放過任何蛛絲馬跡,靠豐富的想像力,進行推理,看能否找到Deepmind預測蛋白質結構的秘密研究方法。然而,要弄清一種蛋白質的結構,非常困難,有數百個胺基酸的蛋白質有可能呈現出數量驚人的不同結構,也就是說不同結構的有n中可能,n等於1後面300個零(around a googol cubed, or 1 followed by 300 zeroes.)。
  • DeepMind 綜述深度強化學習:智能體和人類相似度竟然如此高!
    而正是這些關聯,使那些對人類和動物的行為與神經科學學習感興趣的研究人員,產生了豐富的聯想與假設,從而開始將目光轉向了深度強化學習。這樣的結果,也對那些關於一代 Deep RL 發負面評論發出了警告。看似深度強化學習和人類的學習方式完全不同:有人認為,這種差異在於二者的樣本效率(學習系統達到任何選定目標性能水平所需的數據量)。
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    為創建超人類AI而生,讓馬斯克極度關注DeepMind跟傳奇的谷歌X實驗室不同,它並非谷歌親身,而是最初於2010年在英國成立的一家AGI(通用人工智慧)公司。有別於功能應用越來越細分的AI,AGI可簡單理解為我們在各種大片中看到的機器人,具備與人類相近的大腦獨立思考能力的人工智慧。
  • 美國神經科學專業發展前景怎麼樣?附專業排名
    未來發展方向可以是研究神經系統的細胞、功能、進化、運算、分子組成和醫學方面等等,還有一個趨勢是神經科學領域開始有越來越多的人用機器學習的方法來進行神經科學研究,比如哈佛大學,哈佛大學的本科生可以通過神經生物學和計算神經學的軌道追求神經科學的集中,學生們學習使用數學和計算機科學來評估大腦信號。
  • DeepMind破解蛋白質摺疊難題
    在自然界中,蛋白質是胺基酸鏈,可以自發摺疊成無數令人難以想像的形狀,有些甚至在幾毫秒之內完成。為了了解蛋白質如何摺疊,DeepMind的研究人員在一個包含約170,000個蛋白質序列及其形狀的公共資料庫中對其算法進行了訓練。在相當於100到200個圖形處理單元(按現代標準,計算能力適中)上運行,這種訓練需要數周時間。
  • 深度學習之Google Deepmind的Alphago人工智慧算法技術演變歷程
    最近大家比較關心的圍棋人機大戰(Alphago vs 李世石)中,deep mind基於Nature2016文章的Alphago在5局制的比賽中已經取得了4-1的獲勝。這兩篇文章都是蒙特卡洛搜索樹+DCNN,效果Google的Alphago優於facebook的方法,剛好藉此機會將之前看到的deep mind該領域的文章捋了一下。
  • AlphaGo背後團隊Deepmind有多牛 核心團隊成員資料介紹
    從左至右:Deepmind負責人哈薩比斯、李世石與谷歌總裁施密特  於是乎問題就來了——作為孕育巨大變革種子的AlphaGo,其背後到底又有個怎樣牛叉的團隊呢?  2010年在英國首都倫敦,三位年輕的極客首度建立Deepmind團隊,這便是戴密斯·哈薩比斯、塞恩·雷格和穆斯塔法·蘇萊曼。
  • DeepMind開源AlphaFold,蛋白質預測模型登上《Nature》
    代碼:https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13模型:https://www.biorxiv.org/content/10.1101/846279v1.full.pdf根據DeepMind的介紹,在預測蛋白質結構的物理性質方面使用了兩種不同的方法來構建預測模型
  • 谷歌DeepMind 的可微分神經計算機 DNC 怎麼樣?看 Facebook AI...
    賈揚清,擁有加州大學伯克利分校計算機科學博士學位、清華大學碩士學位和學士學位,曾於新加坡國立大學、微軟亞洲研究院、NEC美國實驗室、Google Brain工作,現任 Facebook 研究科學家,主要負責前沿AI 平臺的開發以及前沿的深度學習研究。
  • DeepMind破解蛋白質摺疊難題
    在自然界中,蛋白質是胺基酸鏈,可以自發摺疊成無數令人難以想像的形狀,有些甚至在幾毫秒之內完成。為了了解蛋白質如何摺疊,DeepMind的研究人員在一個包含約170,000個蛋白質序列及其形狀的公共資料庫中對其算法進行了訓練。
  • DeepMind綜述深度強化學習中的快與慢,智能體應該像人一樣學習
    在本文中,DeepMind 研究人員利用最近開發的技術反駁了這一批評。這些技術允許深度強化學習更靈活地進行操作,能夠比之前的方法更快速地解決問題。深度強化學習的快與慢近期的 AI 研究引出了強大的技術,如深度強化學習。深度強化學習將表示學習和獎勵驅動的行為結合起來,似乎與心理學和神經科學具備內在的相關性。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    「蛋白質摺疊」是一種令人難以置信的分子摺疊形式,科學界以外很少有人討論,但卻是一個非常重要的問題。生物由蛋白質構成,生物體功能由蛋白質形狀決定。理解蛋白質的摺疊方式可以幫助研究人員走進科學和醫學研究的新紀元。
  • DeepMind破解蛋白質摺疊難題
    在自然界中,蛋白質是胺基酸鏈,可以自發摺疊成無數令人難以想像的形狀,有些甚至在幾毫秒之內完成。為了了解蛋白質如何摺疊,DeepMind的研究人員在一個包含約170,000個蛋白質序列及其形狀的公共資料庫中對其算法進行了訓練。在相當於100到200個圖形處理單元(按現代標準,計算能力適中)上運行,這種訓練需要數周時間。
  • DeepMind宣布解決蛋白質摺疊問題,獲92.4準確性得分
    首先,研究人員把摺疊的蛋白質認為是一個「空間圖」,其中殘基是節點,邊緣連接著非常接近的殘基。DeepMind的研究人員對此說道:DeepMind方法將產生深遠的影響,其中包括極大地加快新藥的開發速度。馬裡蘭大學的結構生物學家Shady Grove則表示:
  • 認知神經科學:人類行為研究新進展
    不同學科之間雖存在差異和鴻溝,但對人類行為的思考和研究從未停止過,迄今為止,這仍是具有挑戰性的科學問題。神經科學從生物學視角出發,試圖解釋神經迴路如何活動進而執行當前行為;認知科學則從心理學視角出發,探討行為產生的內部認知加工過程是什麼;這些過程如何通過計算機加以實現,則是人工智慧關心的問題。
  • DeepMind新GNN模型,將谷歌地圖預估到達準確率提升50%!
    但畢竟世界是動態的,每天的狀況都有可能不同,特別是疫情期間。例如,儘管上下班尖峰時間都會發生在早上、晚上,但具體的確切時間可能每天、每月都有很大差異;一條小巷的擁堵,就會蔓延到下一個大路——這一點,地圖往往無法實時監控;另外,道路質量、限速、事故和封路等因素,都會給預測模型帶來麻煩。
  • DeepMind發了篇物理論文,用神經網絡求解薛丁格方程
    與Slater行列式不同,FermiNet是通用函數逼近器,如果神經網絡層變得足夠寬,則可以無限逼近真實波函數。實驗結果研究人員將FermiNet用在具有10個電子以內的原子上,能量精度均在99.8%左右。
  • ...DeepMind AI解決生物學50年來重大挑戰,破解蛋白質分子摺疊問題
    但這一思路的挑戰在於,在形成三維結構之前,蛋白質的理論摺疊方式是一個天文數字。  蛋白質摺疊問題解讀視頻請戳:    視頻來源:https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology