中科院自動化所餘山:對大腦的未知,並不阻礙借鑑大腦,成就智能

2020-12-09 雷鋒網

作者 | 蔣寶尚

編輯 | 賈偉

他山之石,可以攻玉。對於人工智慧研究,腦科學無異是最重要的「他山之石」了。

近年來,人工智慧在經歷過一波由深度學習帶來的火爆之後,已然進入深水區;如何通向強人工智慧,逐漸成為智能研究的各界人士共同關注的中心話題。「類腦計算」正是智能研究人員嘗試以腦科學之「石」攻智能之「玉」的重要方向。

5月19日,在中國圖象圖形學學會主辦的「CSIG·雲講堂」上,中國科學院自動化研究所餘山研究員作了「從腦網絡到類腦網絡計算」主題報告。餘山研究員借鑑Marr對視覺體系的劃分,將類腦計算的研究分為四個層面:硬體、算法、計算、學習。針對每一層面,餘山研究員做了或簡或詳的介紹,頗有啟發。

餘山研究員認為,儘管當前人類對大腦的認知並不充分,但這並不阻礙智能研究的各界人士去借鑑已有的神經科學和腦科學的知識,從而來發展對智能系統的研究和設計。

硬體層面:存算一體設計結構

傳統計算機使用的是馮諾依曼架構,其基本架構如上圖所示,包括控制器、運算器、記憶單元、輸入系統和輸出系統等五個組成部分;其中控制器和運算器構成了處理單元(CPU)。

做數據處理時,計算機把數據從存儲單元調到處理單元,運算之後再返回到存儲單元。但這種操作方式,會導致存儲單元和處理單元之間進行非常高頻的數據搬運,從而帶來極高的能耗。

圖註:其中時鐘頻率代表數據在存儲單元和處理單元之間調用的速度。能量頻率代表功率。

儘管近年來計算機有高速的發展,GPU時鐘頻率不斷提升,但隨之而來的也是能量密度的逐年提升。以IBM在2000年開發的一個用來做生物信息學研究的計算機為例,其包含了144TB的內存, 14萬個處理器,功耗高達1.4兆瓦。每當這臺計算機運行時,就必須有一個專門的電站為其供能。

反過來,我們看人腦,具有如此高的智能,然而其功耗卻只有20瓦左右,僅相當於一顆黯淡的白熾燈的能耗。如此大的差別,原因是什麼呢?原因自然很多,但重要的一點是,不同於馮諾依曼機,人腦的計算是「存算一體」。在人腦的神經網絡中, 信息的存儲和處理並不分開,神經網絡本身即是存儲器,又是處理器。

借鑑人腦的這種特點,近年來,有越來越多的研究團隊加入了「存算一體」晶片研製中,其中IBM研製的TrueNorth和清華大學研製的Tianjic是這方面最出色的代表。這種晶片被稱為神經形態或神經擬態晶片,極大地解決了數據頻繁搬運所帶來的能耗問題。

算法層面:藉助突觸式信號傳遞

在算法層面,生物腦和人工神經網絡之間也有非常重要聯繫。餘山研究員在報告中提了兩個例子。第一個例子是突觸的概率釋放與Dropout算法之間的關係。

生物神經網絡中,神經元之間的連接是通過一個叫做突觸的結構進行的,這個結構也是兩個神經元之間進行信息交互的地方。當前神經元有一個動作電位時,它會釋放某種神經遞質,這種遞質被後神經元吸收之後便會轉化為電信號,從而實現電信號在神經元之間的傳遞。

這裡面兩個神經元之間信息傳遞的關鍵是:電信號促使化學物質釋放。這種方式存在缺點,即神經衝動導致神經遞質釋放並不總是成功——成功概率的中位數僅在0.2~0.3之間,也即有80%左右的概率會出現信息傳輸失敗。然而,如此低的成功率卻有它獨特的意義。低成功率,可以使神經網絡更快、更好地學習。

人工神經網絡訓練方法Dropout正是對這種現象最好的借鑑:在網絡訓練時,隨機關閉某些神經元;而在測試時,讓所有神經元都工作。結果顯示,利用這種方法,神經網絡的學習能力將有明顯地提高。第二個例子是有關神經網絡的臨界狀態。我們先介紹一個概念:神經元的傳播係數。簡單來理解,即一個神經元能夠激活的神經元個數。

我們看上圖,當傳播係數大於 1時,隨著時間的發展,系統中信號的傳播將會產生爆炸;而當傳播係數小於 1時,由於每一次傳播後激活神經元的個數都在變少,因此最終信號會呈指數消退;只有當傳播係數等於 1 時,系統才會保持相對的穩定。

我們將這種傳播係數等於 1 的穩定狀態稱為臨界狀態,而>1的情況稱為超臨界狀態,< 1的情況稱為亞臨界狀態。顯然無論是亞臨界還是超臨界,都不利於信息的傳遞和處理。只有在臨界狀態,信息才能夠通過神經元的活動把信息保持並傳播下去。

臨界狀態下,網絡錯誤率往往會比較低。但,從上圖中可以看出,臨界狀態是非魯棒的,稍微有一點擾動,其性能便會受到很大的影響。如何解決這一問題,在保持高性能的情況下同時還具有較高的魯棒性?大腦給了我們可以借鑑的答案:自適應機制。

神經科學家根據生物實驗,提出了模擬模型,讓網絡模型能夠自適應地學習傳播係數。結果如上圖所示,正常情況下,臨界狀態很窄;而採用自適應模型,臨界狀態的寬度便大大地增寬。

同樣的,在人工神經網絡中,也存在著信息傳輸所帶來的網絡爆炸或快速消失的問題,即所謂「梯度消散」。針對這一問題,目前主流的解決方案是用Batch Norm或 Layer Norm,也即在人工神經網絡中,每兩個處理層次之間添加一個專門的處理層;這個層的作用是把前面傳來的信號做增強或衰減的調整,從而使後面層的反應不至太強或太弱。

但新增層必然會帶來額外的計算負擔。大腦就沒有這種額外層。能否借鑑大腦的機制,通過某種方式,在不使用額外層的情況下,同時還能夠保持網絡的信息傳播平衡呢?

計算層面:情境相關

相較於算法層面,在計算層面的借鑑稍顯抽象。餘山研究員結合他們近期發表在《Nature Machine Intelligence》上的一篇工作,做了相應的介紹。

人類作為智慧生物,最重要的特徵便是能夠"適應環境變化,實現自身目的"。人類大腦不僅可以在新的環境中不斷吸收新的知識,而且可以根據不同的環境靈活調整自己的行為。

作為對應,當前以DNN為代表的神經網絡,儘管可以建立輸入輸出之間非常複雜的映射關係,用於識別、分類和預測。

但是一旦學習階段結束,它所能做的操作就固化了,既難以方便的學習新的映射,也不能對實際環境中存在情境信息(比如自身狀態,環境變化、任務變化等)做出靈活的響應,難以滿足複雜多變的需求,即缺少情境依賴學習(contextual-dependent learning)的能力。那麼,我們如何借鑑腦科學知識呢?

據腦科學家的研究表明,大腦的結構,除了感覺輸入、運動輸出這個通路之外,還存在一個調控的通路(主要在大腦前額葉發揮作用,因此也可以說,前額葉區決定了人的隨機應變能力)。這個調控通路在很大程度上決定了人的靈活應變能力。

受此啟發,餘山等人提到了一種PFC-like的新網絡架構,在輸入輸出之間加入了一個情境處理模塊(CDP)。CDP模塊的作用便是在輸入輸出之間,根據Context對結果進行旋轉,從而能夠依據上下文動態調整網絡內部信息。

它包括兩個子模塊:1、編碼子模塊,其負責將情境信息編碼為適當的控制信號;2、「旋轉」子模塊,其利用編碼模塊的控制信號處理任務輸入(由於其功能上相當於將特徵向量在高維空間上進行了旋轉,故稱為「旋轉」子模塊)。結果喜人!

圖註:同一個分類器對於同樣的輸入,連續學習40種不同人臉屬性的分類任務(藍色數據點),正確率與用40個分類器的系統(橙色線)幾乎一致。

他們在CelebA數據集上進行測試。按照傳統的模型,針對數據集上的40個類型,需要訓練40個模型才能完成任務,而採用CDP模塊後,一個模型能解決所有分類問題,且性能不降。若想進一步了解這個奇妙的思想,可參看文章:《國內首發Nature子刊 Machine Intelligence論文:思想精妙,或對DNN有重大改進!》

學習層面:連續學習和情境依賴

學習層面,神經網絡面臨的一個重要問題是災難性遺忘,即神經網絡在學習不同的任務時,如果不是把不同任務的訓練樣本混在一起去訓練,往往在學習新的任務時候,網絡就會把從舊任務中學到的知識忘掉。

以上圖為例,先讓神經網絡識別「狗」,得到一個性能非常高的網絡;繼而再讓網絡去學習識別「貓」,這時網絡的權重就會重新調整;學完之後再拿來去識別「狗」,神經網絡的性能就會大幅下降,甚至不能使用。

原因就在於,當學習「貓」的任務時,網絡把針對「狗」的任務學到的知識給忘了。然而,人腦卻沒有這種所謂「災難遺忘」的問題。人類先後順序地學習不同的任務,最後識別能力還能不斷提升。針對這一問題,餘山研究員在上面提到的那篇文章中提出一種稱為「正交權重修改 (Orthogonal Weights Modification,OWM) 」的算法。

圖:OWM算法原理示意圖。(a): 在權重更新時,OWM算法只保留傳統BP算法計算的權重增量中與歷史任務輸入空間正交的部分;(b): 在新任務中,OWM算法將神經網絡對解的搜索範圍約束在舊任務的解空間中。

OWM算法的核心思想很簡單,即通過 P 映射之後,學習新任務的解仍然在舊任務的解空間當中。正如其名「正交權重修改」,在學習新任務時,只在舊任務輸入空間正交的方向上修改神經網絡權重。如此,權重增量幾乎不與以往任務的輸入發生作用,從而保證了網絡在新任務訓練過程中搜索到的解,仍處在以往任務的解空間中。數學上,OWM通過正交投影算子P與誤差反傳算法得到的權重增量△w作用來實現其目的,即最終的權重增量△w=kp△w,這裡k為係數。OWM算法實現了對網絡中已有知識的有效保護,並可以與現有梯度反傳算法完全兼容。

如上圖所示,餘山等人在ImageNet 上做了測試,選取 1000個類,特徵提取器使用ResNet152,在訓練分類器時:

1)當採用傳統的SGD方法,任務混合訓練時,準確率為78.31%;

2)在採用SGD,但所有任務順序訓練時,準確率直降到4.27%,這正是「災難性遺忘」的結果;

3)當採用OWM方法,任務順序訓練時,結合經過預訓練的特徵提取器,準確率能夠達到75.24%,性能媲美於SGD的混合訓練。

餘山等人同樣在手寫字數據集HWDB上進行了測試,包含3755個類,特徵提取器選用ResNet18,同樣可以看到,採用OWM順序訓練分類器依然能夠保持較高的性能。

值得一提的是,算法具有優良的小樣本學習能力,以手寫體漢字識別為例,基於預訓練的特徵提取器,系統可以從僅僅數個正樣本中就能連續的學習新的漢字。上圖中顯示在3755個類(漢字)上,僅需要在10個類上進行連續學習,便能夠達到90%以上的性能。

OWM算法有效地克服了災難性遺忘的難題,使得單個神經網絡不僅可以先學「狗」再學「貓」,而且可以逐漸的學習多達數千個類型的識別。這一新型學習算法和前面介紹的情境依賴處理 (CDP) 模塊配合,能夠使人工神經網絡具備強大的連續學習和情境依賴學習能力。

其中,OWM 算法可以有效克服神經網絡中的災難性遺忘,實現連續學習;而受大腦前額葉皮層啟發的 CDP 模塊可以有效整合情境信息,調製神經網絡的信息處理過程。二者結合便有望讓智能體通過連續不斷的學習去適應複雜多變的環境,從而逐步逼近更高水平的智能。

先驗知識、語義理解和記憶

除了上面四個層次的借鑑之外,餘山老師還介紹了如何將先驗知識壓縮並注入神經網絡、從符號計算到語義理解、從有監督的分類訓練到無監督的重構和預測等類腦計算的思路。如何將先驗知識壓縮並注入神經網絡。

認知學家曾經做過一個實驗,即從小教一個黑猩猩學習語言,發現黑猩猩在語言學習上遠遠不能達到人類的高度。這說明我們人類大腦有先天的神經結構能夠讓我們容易學習語言,這種先天結構即為先驗知識。作為對比,當前的神經網絡基本上沒有先驗知識,都得從頭學起。

那麼我們是否可以借鑑大腦積累先驗知識的機制,來設計人工神經網絡呢?從符號計算到語義理解。目前的自然語言處理系統訓練的材料是語料,純粹是文字或符號。

以中文屋(Chinese Room)實驗為例,裡面純粹是做一些非常簡單的信息處理工作,只是一個符號到符號的處理過程,並沒有真正理解內在的含義。因此NLP的研究,若想克服這個問題,未來必然需要向大腦學習。有監督的分類訓練到無監督的重構和預測。

當前,訓練好的做分類任務的神經網絡在複雜環境下往往性能並不好。但對比一下,人類的視覺系統並沒有使用監督信號去訓練分類任務,例如小孩學習識別物體,完全是靠自監督的方式看這個世界的。因此,真正的強人工智慧可能並不是現在這種端到端的有監督訓練,而是採用類腦的分階段的、包含無監督或自監督的訓練方式。最近機器學習領域的進展,也說明了這一策略正逐漸受到人們的關注。

結語

餘山研究員總結道,雖然我們對於大腦的了解尚不完備,生物腦和人工神經網絡的結構也有很大的差異,但是這並不是開展類腦計算研究的本質障礙。

神經科學和認知科學的研究已經發現了大腦的很多機制性原理,這些知識足夠指導我們不斷改善智能系統的設計,最終有望實現在不同層面上受腦啟發的更加強大和高效的人工智慧系統。

(雷鋒網)、(雷鋒網)、(雷鋒網)

相關焦點

  • 中國製造的「大腦」,長期被德日壟斷,中科院終於迎來技術突破
    數控系統是工控自動化的核心,主要應用於數控工具機等自動化裝備上,在各大工業領域發揮著重要作用。高檔數控工具機的「大腦」便是高檔數控系統,其性能、可靠性、功能等,都由高檔數控系統所決定。經過多年的發展,在中科院瀋陽計算技術研究所的帶領下,我國數控系統迎來了一系列突破。該研究所高檔數控國家工程研究中心總工程師——於東,便講述了我國數控系統多年來的發展成果。作為「04專項」至今的親歷者,於東認為,我國自主研發數控工具機控制系統的突破,是厚積薄發的必然結果。
  • 從「大腦GPS」到「窩細胞」
    本報記者 沈湫莎我們的大腦可以抽提出一些抽象的概念,這在很早就被哲學家提出。可這些概念是如何在大腦中形成的?科學家正不斷發現其中的奧秘。這一切還要從今年獲得諾貝爾生理學或醫學獎的「大腦GPS」說起。
  • 大安全時代:360安全衛士應運而「升」,已連接360「安全大腦」
    隨著全球最大的智能安全防禦系統——360安全大腦面世,至此世界上的安全軟體可分為兩類:一類是沒有連接安全大腦的傳統安全軟體;而另一類,是已經連接360安全大腦的新安全軟體360安全衛士12.0。360安全大腦的安全能力如何?360安全大腦是一個分布式智能安全系統。
  • 中科院自動化所在常州成立智慧機器人研究所—新聞—科學網
    日前,常州國家高新區政府、中科院自動化所、常州愛爾威智能科技有限公司在常州舉行了合作籤約儀式,標誌著中科院自動化所常州智慧機器人研究所正式成立。
  • 谷歌大腦科學家:大腦是AI研究的靈感來源 AI沒有邊界
    選自:Gigaom 編譯:網易智能 參與:nariiy本期對話嘉賓是谷歌大腦的研究科學家、機器學習專家、副教授Hugo LaRochelle,他專攻計算機視覺和自然語言處理領域的深度神經網絡。Hugo LaRochelle:也許我們可以在生物學和人類智力之間建立平行關係,我並不是生物學方面的專家,以至於能夠做出這樣的表述,但我想,在我研究的方式中,不僅僅是看到我們是智能生物的事實,以及我們的智力本質上來自我們的大腦,也不僅僅是從大腦中獲得一些啟發,我主要是從數學或統計學的角度設計學習算法來推動我的研究,試著思考這個問題的合理解決方法,以及我如何用類似像人工神經網絡的方式來實現它
  • 人類的大腦有沒有天生的缺陷? 大腦有哪些局限?
    目前人類對於大腦的探索還處於初級階段,很多理解是建立在觀察和假設上的,根本的 運行機制仍然未知。對於一個了解未深的事物,直接詢問它的缺陷在哪   原標題:人類的大腦有沒有天生的缺陷? 大腦有哪些局限?
  • ...創建大腦神經元的基因表達「藍圖」 有望解釋大腦細胞多樣性的...
    2020年11月7日 訊 /生物谷BIOON/ --近日,一項刊登在國際雜誌Nature上的研究報告中,來自紐約大學等機構的科學家們通過研究利用基因測序和機器學習技術對果蠅大腦中超過25萬個神經元進行分類,繪製出了大腦神經元中基因表達的發育藍圖,相關研究結果表明,神經元細胞在發育過程中能夠表現出最豐富的分子多樣性,同時研究人員還發現了此前未知類型的神經元細胞
  • 中科院自動化所餘山:儘早制定腦機接口的信息加密及防護標準
    為了推動腦機接口實現應用,基礎研究方面,還需要進一步了解大腦信息處理的原理和機制,闡明感覺、運動、記憶、情感、抉擇等腦功能所對應的神經環路活動特徵及其調控過程。(作者系中國科學院自動化研究所模式識別國家重點實驗室副主任,中國科學報記者卜葉採訪整理。原標題為「腦機接口」應用防護先行)【來源:中國科學報】聲明:轉載此文是出於傳遞更多信息之目的。若有來源標註錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯繫,我們將及時更正、刪除,謝謝。
  • 什麼是第二大腦思維,如何培養自己的「第二大腦」?三點幫助你
    在過往的思維觀念中,我們很仰賴大腦來處理所有事情,如果你理解大腦這個神奇的器官,你會發現大腦幾乎無時無刻在處理你所有的事情,要思考什麼時候該說什麼話,哪些表情不該出現,同時大腦還要處理手、腳的行動,把該記住的東西要記錄下來。只是隨著科技越來越發達,如果有一個方法可以讓你的大腦發揮更大的生產力,你覺得這件事對你的幫助有多大?
  • 新一季《最強大腦》綜合實力更強,這才是真正的「最強大腦」?
    之前的《最強大腦》就曾因為這種問題而發生過矛盾。像是在《最強大腦》第二季的時候,王昱珩跟日本記憶選手原口證同臺競技,就是在用微觀方法VS記憶方法,結果是王昱珩完勝對方,王昱珩也因此被大家奉為「神一樣的選手」。
  • 智能交通「2.0」 給道路裝上「大腦」
    新華社記者 劉大偉 攝道路交通的「大腦」你見過嗎?智慧出行的未來是哪種場景?其實,在我們還未察覺前,交通「大腦」便早已在川流不息的道路間「勇挑大梁」,賦能科技感更強的出行方式。近年來,以「網際網路+」、智能網聯、大數據、人工智慧等為代表的新技術在道路交通領域不斷深化應用,越來越深地融進百姓生活,也在不斷滿足人們對於安全便捷、高質量出行的新期盼。
  • AI賦能內容創作 百度大腦智能創作平臺新版上線
    早在2019年4月,百度大腦就上線了「智能創作平臺」,集合了百度領先的自然語言處理和知識圖譜技術,旨在成為更懂用戶的智能創作助手;2019年12月底,百度大腦智能創作平臺又上線全新版本,助力用戶解決創作痛點,提升創作效率。
  • 大腦槓桿
    大腦在面對信息時,會有一個加工的過程。這種加工能力,決定了大腦厲害與否,以及一個人能否在現實世界裡做出更聰明的決策。如上計算,每摸到一個紅球,是二號口袋的概率就會乘上3倍。三次的話,就是3的三次方,也就是27倍。沒錯,這是一個並不複雜的貝葉斯計算。
  • 新一季《最強大腦》綜合實力比水哥更強?這才是真正的最強大腦
    之前的《最強大腦》就曾因為這種問題而發生過矛盾。像是在《最強大腦》第二季的時候,王昱珩跟日本記憶選手原口證同臺競技,就是在用微觀方法VS記憶方法,結果是王昱珩完勝對方,王昱珩也因此被大家奉為「神一樣的選手」。但是,王昱珩真有那麼厲害嗎?其實不然。
  • 人工智慧變革,長沙製造的「最強大腦」
    其實人工智慧所賦予的,是自動化與IT技術的深度融合。通俗地說,就是為自動化設備安裝「最強大腦」,讓整個生產工序更加協調可靠。正如中國工程院院士、清華大學自動化系教授吳澄所說,智能製造要在人工智慧的支持下,實現從「有沒有」到「好不好」的轉變。
  • 「中醫大腦」系統應用場景及功能
    中醫大腦是由問止中醫聯合創始人暨首席醫療官林大棟博士領導數十名中醫學專家與計算機專家,在中美兩地歷時十餘年研發,擁有海量名醫智慧經驗和上千萬有效數據案例,並不斷從臨床中實時學習現代最新的診療方法的中醫人工智慧輔助診療系統。  中醫大腦功能強大,能夠輔助中醫師精確使用8000多首方劑,治療3000多種病症。並有問診提示、誤診提示,輔助中醫師精準辨證。
  • 華為林明:智能城市須從城市「大腦」走向城市智能體
    中國經濟新聞網訊(記者 劉慧)「一個城市不僅要有智慧『大腦』,還需要靈活的『手腳』,關鍵要耳聰目明,有暢通的『血脈』。城市還要具備深度學習的能力,通過不斷處理城市底層的問題,來提升城市的自動化水平。所以,整個城市要形成一盤棋、一體化、智能化,智能城市須從城市『大腦』走向城市智能體。」華為智慧城市執行總裁林明近日對中國經濟時報記者表示。
  • 百度大腦UNIT智能教育機器人方案接入大疆機甲大師,複雜指令解析...
    發布會上教育機器人RoboMaster EP的產品經理演示了接入百度大腦智能對話定製與服務平臺UNIT的智能對話技術後,機器人快速獲得的智能交互能力。在發布會上演示的其中一個功能中,為RoboMaster EP產品提供語音語義智能交互能力的,正是來自百度大腦UNIT平臺,該方案正助力RoboMaster EP產品拓展未來教育的全新邊界。RoboMaster EP機器人接入百度大腦UNIT語音交互控制技能後,能夠聽懂用戶對它發出的包括前進、後退、加速、減速、左轉、右轉、拍照、尋找周圍目標等在內的20餘個操控指令。
  • 菜鳥上線「智能供應鏈大腦」,為雀巢打造可以看見的供應鏈
    今天技術有了很大不同,品牌商可以藉助網際網路手段更加快速、全面、精準地獲取消費端、物流引擎端和供應商端的數據,這正是「智能供應鏈大腦」得以構建的基礎。「智能供應鏈大腦」的三大創新菜鳥首席數據科學家弘偉向雷鋒網(公眾號:雷鋒網)介紹,「智能供應鏈大腦」主要有幾個維度的創新:首先是數據處理。
  • 「最強大腦」秒變「圍棋大腦」?
    「真瘋叔叔」則在微博上表示接受挑戰,願意培訓「最強大腦」6天,向世界證明圍棋速成法真的靠譜。確實,如果「最強大腦」都不能做到速成圍棋,「圍棋速成法」自然是一大笑話。之後,金地集團發文稱將為「最強大腦挑戰速成圍棋」一事提供平臺,還將邀請「棋聖」聶衛平前來見證。隨後,聶衛平也在微博轉發了這條消息。至此,讓棋界、教育界乃至全社會驚愕的「圍棋速成」一事有了實質性進展。