驚悚!人腦與卷積神經網絡的詭異對應,識別三維圖形反應模式非常相似

2020-11-26 騰訊網

新智元報導

來源:futurism

編輯:小勻

【新智元導讀】一直以來,神經網絡可以讓我們了解我們的大腦,就像我們利用我們對大腦的了解來開發新的神經網絡一樣。近日,有研究團隊發現了詭異的現象:在識別三維圖形方面,大腦和AI竟存在驚人的相似!

在人腦中,視覺信息穿過多個皮質,每個皮質都解釋圖像的不同方面,最終將我們對周圍世界的感知拼湊在一起。

長久以來,人工智慧與人腦之間都有著十分微妙的聯繫。

最近,在發表於《當前生物學》雜誌上的一項新研究更令人毛骨悚然,在此過程的早期就對3D形狀的各個方面(例如凹凸和球形)進行了解釋。

而且,事實證明,同樣的事情也發生在人工神經網絡中。

「幽靈般的通信」:大腦與Alexnet對圖像反應模式的相似

人工智慧面臨的長期挑戰之一是copy人類視覺。基於為遊戲開發的高容量GPU和網際網路上海量圖像和視頻提供的大規模訓練集,像AlexNet這樣的深(多層)網絡在物體識別方面取得了重大進展。

Connor和他的團隊對自然神經元和人工神經元的圖像反應進行了相同的測試,結果令人 「毛骨悚然」:V4和AlexNet第3層的圖像反應模式非常相似。

驚悚x2!人腦與電腦或趨同進化

神經網絡是一種明確模仿大腦的人工智慧架構,它以相似的方式解釋信息,這並不令人吃驚。

在看到算法AlexNet之後,科學家們驚呆了:AI與大腦讀圖像的方式竟是如此相同。

在物體視覺的開始階段,大腦就能探測到三維形狀,如凸起、空洞、軸狀、球體。這是一種新發現的自然智能策略,約翰霍普金斯大學的研究人員也在訓練識別視覺物體的人工智慧網絡中發現了這種策略。

這個研究主要集中在V4區域。

過去40年來,人們一直將研究的重點放在「V4區域的神經元如何呈現二維形狀」,《當代生物學》上的新論文詳細描述了該區域是如何呈現三維形狀碎片的。

隨後,約翰霍普金斯大學的研究人員在高級計算機視覺網絡AlexNet的早期階段(第3層)中發現了人工神經元幾乎相同的反應。

在自然和人工視覺中,早期發現3-D形狀可能有助於解釋真實世界中的實體3-D物體。

約翰霍普金斯大學神經學家、研究作者埃德·康納(Ed Connor)在一份新聞稿中提到了一種特殊的視覺皮層,他說:「早在V4時代,我就很驚訝地看到了3D形狀強烈而清晰的信號,但我永遠也想不到,你會在AlexNet上看到同樣的事情發生,它只被訓練成將2D照片轉換為物體標籤。」

AlexNet是什麼?

AlexNet是2012年ImageNet競賽冠軍獲得者Hinton和他的學生Alex Krizhevsky設計的。

也是在那年之後,更多的更深的神經網絡被提出,比如優秀的vgg,GoogLeNet。這對於傳統的機器學習分類算法而言,已經相當的出色。

實際上,AlexNet就是基於大腦中的多級視覺網絡設計的。研究團隊觀察到的相似之處,很可能預示著自然智能和人工智慧之間的相關性,這也是對未來利用AI的一種重要啟示。

人腦與電腦的「近親」早已起源

當然,人腦與電腦的相似早就被熱議。

除了計算機硬體與人腦之間的明顯類比和區別(例如,計算機的RAM與大腦的工作記憶之間,計算機的硬碟驅動器與大腦的長期記憶之間),通常,還認為兩者彼此相似。

數字與模擬

絕大多數計算機都是數字計算機,這意味著它們使用只有兩個可能的離散狀態的二進位系統執行操作:「開」和「關」,或者,如果您願意,還可以選擇「0」和「 1」。

例如,以老式黑膠唱片上使用的模擬編碼形式,音樂信息以凹槽輪廓的連續變化記錄,並且在回放錄音時不可避免地會聽到輕微的錯誤。相反,數字編碼可提供更高的保真度,因為它會自動消除所有這些錯誤,除非它們足夠大,可以用1代替0。

那麼,人腦是作為模擬系統還是數字系統運行?答案是「both」。

一方面,神經元傳遞或不傳遞動作電位。這是一個「全有或全無」的過程,從這個意義上說,大腦以數字方式運行。但是神經元傳遞動作電位的頻率可以連續變化,因此也具有模擬系統的這種特性。

在另一種意義上,神經元也類似地工作。每個神經元在突觸與其樹突之間不斷地從其他神經元接收大量神經衝動(動作電位)。

串行並行

大多數計算機都非常快速地處理信息,但是它們是以串行方式進行的:所有信息都由一個中央處理單元(CPU)處理,該中央處理單元一個接一個地執行操作。但是,CPU還可以通過將其各種任務細分為子任務並在它們之間快速交替來模擬並行處理。

大腦的神經元比計算機的集成電路慢得多。

但是大腦的力量來自於它是執行大規模並行處理的機器。大腦沒有CPU。相反,它具有數百萬個同時合併信號的神經元。在任何給定時間,大腦的許多大型專業區域並行運行以執行各種任務,例如處理視覺或聽覺信息或計劃動作。即使在這些區域中的每個區域中,信息也會通過沒有重要序列結構的神經網絡流動。

但是,就像計算機是可以模擬並行處理的串行系統一樣,大腦也可以模擬串行操作(例如,處理口語和書面語言)的並行系統。

確定性與非確定性

從給定輸入的意義上說,計算機是確定性機器,它們將始終產生相同的輸出。

但這並不意味著該輸出總是可預測的。例如,計算機可以通過引入偽隨機變量來模擬非確定性系統。計算機還可以應用來自混沌物理學的方程,其中確定性過程的結果可能會受到初始條件中微小變化的極大影響。

整個大腦被認為是非確定性系統,原因很簡單:一個時刻到下一個時刻永遠不會完全相同。

它不斷地形成新的突觸,並根據其用法來增強或削弱現有的突觸。因此,給定的輸入將永遠不會產生完全相同的輸出兩次。但是,腦活動的生理化學過程被認為是確定性的。

「人工網絡是目前研究大腦最有希望的模型。相反,大腦是使人工智慧接近自然智能的最佳策略來源。」Connor說。

神經網絡可以讓我們了解我們的大腦,就像我們利用我們對大腦的了解來開發新的神經網絡一樣。

對這個毛骨悚然的消息,外國網友們議論紛紛。

「我有點開始認為,我們並不真正理解智能意識是什麼。也許所有形式的智能都只是自我意識的不同表達,沒有一種智能真的比另一種更好或更強大。」

但有人卻認為這沒什麼大驚小怪的:「我對此不太確定,但我認為卷積神經網絡(AlexNet)在某種程度上是通過模仿人眼的工作方式來實現的(當然,除了參數數量的大量減少之外)。諸如本文和DeepDream之類的一些先前工作已經證明了神經網絡與我們的大腦和認知有多麼相似。因此,這對我來說並不是真的那麼令人驚訝和恐怖。」

這個「毛骨悚然」消息,讓你怕了嗎?

參考連結:

https://en.wikipedia.org/wiki/Visual_cortex

https://techxplore.com/news/2020-10-spooky-similarity-brains.html

相關焦點

  • 人腦與卷積神經網絡的詭異對應,識別三維圖形反應模式非常相似
    近日,有研究團隊發現了詭異的現象:在識別三維圖形方面,大腦和AI竟存在驚人的相似!在人腦中,視覺信息穿過多個皮質,每個皮質都解釋圖像的不同方面,最終將我們對周圍世界的感知拼湊在一起。Connor和他的團隊對自然神經元和人工神經元的圖像反應進行了相同的測試,結果令人 「毛骨悚然」:V4和AlexNet第3層的圖像反應模式非常相似。
  • 「詭異」的對應——電腦視覺和人腦視覺的共同策略
    一項10月22日發表在《當代生物學》雜誌的文章指出,大腦在視覺形成的初始階段就會檢測到三維形狀信號這一自然人腦策略與約翰霍普金斯大學研究人員在訓練人工智慧時發現的智能視覺策略一致。研究人員對自然神經元和人工神經元進行了同樣的圖像反應測試,並在論文中詳細介紹了大腦視覺皮層V4區的神經元是如何形成三維形狀信號的,打破了過去40年來的研究局限性(過去科學家只關注二維形狀信號)。
  • 應用豐富的「卷積神經網絡」技術,怎樣實現了圖像識別?
    通過圖像識別,計算機將學會識別圖像中的視覺對象和視覺元素。使用龐大的數據集和各種新興的模式,計算機能夠理解圖像,並且用公式表達出相關的標籤和類別。圖像識別的普遍應用圖像識別有著非常廣泛的應用,其中的「個人照片管理」是最常見,同時也是最受歡迎的應用。面對成千上萬張繁雜的照片,幾乎每個人都想根據照片主題把它們一一分類,整理成有序的照片集。
  • MSRA視頻理解新突破,實現199層三維卷積神經網絡
    (Pseudo-3D Convolution)的深度神經網絡的設計思路,並實現了迄今為止最深的 199 層三維卷積神經網絡。通這項工作主要集中在如何利用大量視頻數據來訓練視頻專用的深度三維卷積神經網絡,它提出了一種基於偽三維卷積(Pseudo-3D Convolution)的深度神經網絡的設計思路,並實現了迄今為止最深的 199 層三維卷積神經網絡。通過該網絡學習到的視頻表達,在多個不同的視頻理解任務上取得了穩定的性能提升。
  • 解析卷積神經網絡的應用
    只有當使用圖像數據集對計算機進行訓練後,其方可識別對象 不過,情況正發生變化。近年來,一個稱之為「深度學習」的領域大幅提升了計算機理解所見事物的能力。深度學習,尤其是卷積神經網絡的使用,並沒有依賴傳統的圖像處理技術,而是賦予計算機理解世界的能力,且這方面已取得重大進展。
  • 卷積神經網絡理解(一):濾波器的意義
    卷積神經網絡的發展二. 卷積神經網絡的重要性三. 卷積神經網絡與圖像識別四.同時,他們注意到了兩種不同類型的細胞,簡單細胞和複雜細胞,簡單細胞只對非常特定的空間位置,對它們非常偏好的方向有強烈的反應,複雜細胞有更大的空間不變性,複雜細胞通過幾個簡單細胞(每個簡單細胞存在不同方向的偏好)的輸入上進行池化而實現這種不變性。這兩個特徵即對特定特徵的選擇和通過前饋連接增大空間不變性構成了卷積神經網絡的人工視覺基礎。
  • 反思卷積神經網絡:圖像角度泛化上的困難重重
    來自華盛頓大學和加州大學伯克利分校等四所大學的研究人員也發現,當停車標誌被漆或貼紙掩蓋住時,路標識別模型就完全失效。這並非是在為難系統,而是現實生活中確實會碰到這種情況。此外,卷積神經網絡在圖像移動或旋轉上的泛化能力很差,更不用說觀察三維的不同角度了。
  • YJango的卷積神經網絡——介紹
    目錄● 視覺感知       ● 畫面識別是什麼        ● 識別結果取決於什麼● 圖像表達        ● 畫面識別的輸入         ● 畫面不變形● 前饋神經網絡做畫面識別的不足● 卷積神經網絡做畫面識別       ● 局部連接
  • 圖像識別技術——卷積神經網絡CNN詳解
    前言卷積神經網絡不同於神經網絡,在圖片處理這方面有更好的表現。本文主要對神經網絡和卷積神經網絡做了簡要的對比,著重介紹了卷積神經網絡的層次基礎,同時也簡要介紹了卷積神經網絡參數更新方式和其優缺點,並結合具體實例對卷積神經網絡的工作方式做了介紹。
  • 卷積神經網絡的卷積到底是什麼
    卷積神經網絡是一種特殊的神經網絡結構,是自動駕駛汽車、人臉識別系統等計算機視覺應用的基礎,其中基本的矩陣乘法運算被卷積運算取代。1989年,Yann LeCun利用反向傳播和Neocognitron的概念提出了一種名為LeNet的架構,該架構被美國和歐洲用於手寫的郵政編碼識別。郵政服務。Yann LeCun進一步研究了這個項目,最終在1998年發布了LeNet-5——第一個引入了我們今天在CNN仍然使用的一些基本概念的現代卷積神經網絡。他還發布了MNIST手寫數字數據集,這可能是機器學習中最著名的基準數據集。
  • 用Hinton的膠囊神經網絡來識別空間關係 Part1: CNNs及其缺點
    翻譯 | 陳曉璇  劉寧 魏洪貴    整理 |  凡江「普通的」卷積神經網絡是當前機器學習領域最熱的一個概念, 但是它也有一些問題,例如不能識別空間關係,比如說圖片或其他數據裡不同部分之間的相對位置關係。Hinton最近提出的膠囊神經網絡也許能幫助我們解決包括這一問題和其他問題。
  • 基於卷積神經網絡的目標檢測算法簡介
    什麼是卷積神經網絡?卷積神經網絡是一個層次模型,主要包括輸入層,卷積層,池化層、全連接層以及輸出層。卷積神經網絡是專門針對圖像而設計,主要特點在於卷積層的特徵是由前一層的局部特徵通過卷積共享的權重得到。
  • 改進卷積神經網絡,你需要這14種設計模式
    然而,訓練神經網絡的技巧並不容易掌握。與之前的機器學習方法一樣,細節是最恐怖的地方,然而在卷積神經網絡中有更多的細節需要去管理:你所用的數據和硬體的限制是什麼?你應該以哪種網絡作為開始呢?AlexNet、VGG、GoogLeNet 還是 ResNet 呢?甚至 ResNet 裡面還有 ResNet 分支選項。你應當建立多少與卷積層相對應的密集層?
  • 一文讀懂卷積神經網絡工作原理
    卷積神經網絡(Convolutional Neural Network, CNN)是人工神經網絡的一種,是當下語音分析和圖像識別領域的研究熱點。這篇文章用最簡明的語言和最直觀的圖像,帶你入門CNN。準備好了嗎?
  • 卷積神經網絡算法結構分析及其工作效率的影響因素
    2012年Krizhevsky等提出的卷積神經網絡卷積神經網絡算法結構分析。就目前算法的發展狀況而言,卷及神經網絡作為當前在圖像識別領域的主流算法,被諸多工作團隊所廣泛接受,而對於圖像識別的研究重點,也從尋找更為優秀的算法,轉移到了對卷積神經網絡算法本身的優化上,並且在應用領域,也在近年取得了長足進展。
  • 孫啟超:卷積神經網絡在人臉識別技術中的應用 | AI研習社第51期猿...
    隨著 iPhone X 的發布,Face ID 人臉識別技術開始進入人們的日常生活中,當我們拿起手機並看著它的時候就可以實現手機解鎖的功能。而人臉識別中的關鍵技術就是卷積神經網絡。近日,在雷鋒網 AI 研習社公開課上,法國蒙彼利埃大學孫啟超就講述了卷積神經網絡的基本原理以及人臉識別技術是如何運行的。
  • 深度學習資訊|用於人體動作識別的26層卷積神經網絡
    諸如卷積神經網絡(CNN)之類的深度學習算法已在各種任務上取得了顯著成果,包括那些涉及識別圖像中特定人物或物體的任務。基於視覺的人類動作識別(HAR)是計算機科學家經常嘗試使用深度學習解決的任務,它特別需要識別圖像或視頻中捕獲的人類動作。
  • 卷積神經網絡(CNN)介紹與實踐
    - 來源:http://cs231n.github.io/classification/為了「教會」一種算法如何識別圖像中的對象,我們使用特定類型的人工神經網絡:卷積神經網絡(CNN)。他們的名字源於網絡中最重要的一個操作:卷積。卷積神經網絡受到大腦的啟發。
  • 給你一個卷積神經網絡工作原理最直觀的解釋
    卷積神經網絡(Convolutional Neural Network, CNN)是人工神經網絡的一種,是當下語音分析和圖像識別領域的研究熱點。這篇文章用最簡明的語言和最直觀的圖像,帶你入門CNN。準備好了嗎?Let’s go——我們先從最基礎的內容說起。對二維數位訊號(圖像)的操作,可以寫成矩陣形式。
  • 深度學習入門:淺析卷積神經網絡
    它在語音識別、自然語言處理、計算機視覺、圖像與視頻分析、多媒體等諸多領域的應用取得了巨大成功。至今已有數種深度學習方法,如卷積神經網絡(CNN)、自編碼神經網絡(包括Auto encoder和Sparse Coding)和深度置信網絡(DBN),並在各個領域中取得了極好的效果。