中科院自動化所餘山:對大腦的未知,並不阻礙借鑑大腦,成就智能

2020-11-28 雷鋒網

作者 | 蔣寶尚

編輯 | 賈偉

他山之石,可以攻玉。對於人工智慧研究,腦科學無異是最重要的「他山之石」了。

近年來,人工智慧在經歷過一波由深度學習帶來的火爆之後,已然進入深水區;如何通向強人工智慧,逐漸成為智能研究的各界人士共同關注的中心話題。「類腦計算」正是智能研究人員嘗試以腦科學之「石」攻智能之「玉」的重要方向。

5月19日,在中國圖象圖形學學會主辦的「CSIG·雲講堂」上,中國科學院自動化研究所餘山研究員作了「從腦網絡到類腦網絡計算」主題報告。餘山研究員借鑑Marr對視覺體系的劃分,將類腦計算的研究分為四個層面:硬體、算法、計算、學習。針對每一層面,餘山研究員做了或簡或詳的介紹,頗有啟發。 

餘山研究員認為,儘管當前人類對大腦的認知並不充分,但這並不阻礙智能研究的各界人士去借鑑已有的神經科學和腦科學的知識,從而來發展對智能系統的研究和設計。

硬體層面:存算一體設計結構 

傳統計算機使用的是馮諾依曼架構,其基本架構如上圖所示,包括控制器、運算器、記憶單元、輸入系統和輸出系統等五個組成部分;其中控制器和運算器構成了處理單元(CPU)。

做數據處理時,計算機把數據從存儲單元調到處理單元,運算之後再返回到存儲單元。但這種操作方式,會導致存儲單元和處理單元之間進行非常高頻的數據搬運,從而帶來極高的能耗。

圖註:其中時鐘頻率代表數據在存儲單元和處理單元之間調用的速度。能量頻率代表功率。

儘管近年來計算機有高速的發展,GPU時鐘頻率不斷提升,但隨之而來的也是能量密度的逐年提升。以IBM在2000年開發的一個用來做生物信息學研究的計算機為例,其包含了144TB的內存, 14萬個處理器,功耗高達1.4兆瓦。每當這臺計算機運行時,就必須有一個專門的電站為其供能。

反過來,我們看人腦,具有如此高的智能,然而其功耗卻只有20瓦左右,僅相當於一顆黯淡的白熾燈的能耗。如此大的差別,原因是什麼呢?原因自然很多,但重要的一點是,不同於馮諾依曼機,人腦的計算是「存算一體」。在人腦的神經網絡中, 信息的存儲和處理並不分開,神經網絡本身即是存儲器,又是處理器。

借鑑人腦的這種特點,近年來,有越來越多的研究團隊加入了「存算一體」晶片研製中,其中IBM研製的TrueNorth和清華大學研製的Tianjic是這方面最出色的代表。這種晶片被稱為神經形態或神經擬態晶片,極大地解決了數據頻繁搬運所帶來的能耗問題。

算法層面:藉助突觸式信號傳遞

在算法層面,生物腦和人工神經網絡之間也有非常重要聯繫。餘山研究員在報告中提了兩個例子。第一個例子是突觸的概率釋放與Dropout算法之間的關係。

生物神經網絡中,神經元之間的連接是通過一個叫做突觸的結構進行的,這個結構也是兩個神經元之間進行信息交互的地方。當前神經元有一個動作電位時,它會釋放某種神經遞質,這種遞質被後神經元吸收之後便會轉化為電信號,從而實現電信號在神經元之間的傳遞。

這裡面兩個神經元之間信息傳遞的關鍵是:電信號促使化學物質釋放。這種方式存在缺點,即神經衝動導致神經遞質釋放並不總是成功——成功概率的中位數僅在0.2~0.3之間,也即有80%左右的概率會出現信息傳輸失敗。然而,如此低的成功率卻有它獨特的意義。低成功率,可以使神經網絡更快、更好地學習。

人工神經網絡訓練方法Dropout正是對這種現象最好的借鑑:在網絡訓練時,隨機關閉某些神經元;而在測試時,讓所有神經元都工作。結果顯示,利用這種方法,神經網絡的學習能力將有明顯地提高。第二個例子是有關神經網絡的臨界狀態。我們先介紹一個概念:神經元的傳播係數。簡單來理解,即一個神經元能夠激活的神經元個數。

我們看上圖,當傳播係數大於 1時,隨著時間的發展,系統中信號的傳播將會產生爆炸;而當傳播係數小於 1時,由於每一次傳播後激活神經元的個數都在變少,因此最終信號會呈指數消退;只有當傳播係數等於 1 時,系統才會保持相對的穩定。

我們將這種傳播係數等於 1 的穩定狀態稱為臨界狀態,而>1的情況稱為超臨界狀態,< 1的情況稱為亞臨界狀態。顯然無論是亞臨界還是超臨界,都不利於信息的傳遞和處理。只有在臨界狀態,信息才能夠通過神經元的活動把信息保持並傳播下去。

臨界狀態下,網絡錯誤率往往會比較低。但,從上圖中可以看出,臨界狀態是非魯棒的,稍微有一點擾動,其性能便會受到很大的影響。如何解決這一問題,在保持高性能的情況下同時還具有較高的魯棒性?大腦給了我們可以借鑑的答案:自適應機制。

神經科學家根據生物實驗,提出了模擬模型,讓網絡模型能夠自適應地學習傳播係數。結果如上圖所示,正常情況下,臨界狀態很窄;而採用自適應模型,臨界狀態的寬度便大大地增寬。

同樣的,在人工神經網絡中,也存在著信息傳輸所帶來的網絡爆炸或快速消失的問題,即所謂「梯度消散」。針對這一問題,目前主流的解決方案是用Batch Norm或 Layer Norm,也即在人工神經網絡中,每兩個處理層次之間添加一個專門的處理層;這個層的作用是把前面傳來的信號做增強或衰減的調整,從而使後面層的反應不至太強或太弱。

但新增層必然會帶來額外的計算負擔。大腦就沒有這種額外層。能否借鑑大腦的機制,通過某種方式,在不使用額外層的情況下,同時還能夠保持網絡的信息傳播平衡呢?

計算層面:情境相關

相較於算法層面,在計算層面的借鑑稍顯抽象。餘山研究員結合他們近期發表在《Nature Machine Intelligence》上的一篇工作,做了相應的介紹。

人類作為智慧生物,最重要的特徵便是能夠"適應環境變化,實現自身目的"。人類大腦不僅可以在新的環境中不斷吸收新的知識,而且可以根據不同的環境靈活調整自己的行為。

作為對應,當前以DNN為代表的神經網絡,儘管可以建立輸入輸出之間非常複雜的映射關係,用於識別、分類和預測。

但是一旦學習階段結束,它所能做的操作就固化了,既難以方便的學習新的映射,也不能對實際環境中存在情境信息(比如自身狀態,環境變化、任務變化等)做出靈活的響應,難以滿足複雜多變的需求,即缺少情境依賴學習(contextual-dependent learning)的能力。那麼,我們如何借鑑腦科學知識呢?

據腦科學家的研究表明,大腦的結構,除了感覺輸入、運動輸出這個通路之外,還存在一個調控的通路(主要在大腦前額葉發揮作用,因此也可以說,前額葉區決定了人的隨機應變能力)。這個調控通路在很大程度上決定了人的靈活應變能力。

受此啟發,餘山等人提到了一種PFC-like的新網絡架構,在輸入輸出之間加入了一個情境處理模塊(CDP)。CDP模塊的作用便是在輸入輸出之間,根據Context對結果進行旋轉,從而能夠依據上下文動態調整網絡內部信息。

它包括兩個子模塊:1、編碼子模塊,其負責將情境信息編碼為適當的控制信號;2、「旋轉」子模塊,其利用編碼模塊的控制信號處理任務輸入(由於其功能上相當於將特徵向量在高維空間上進行了旋轉,故稱為「旋轉」子模塊)。結果喜人! 

圖註:同一個分類器對於同樣的輸入,連續學習40種不同人臉屬性的分類任務(藍色數據點),正確率與用40個分類器的系統(橙色線)幾乎一致。

他們在CelebA數據集上進行測試。按照傳統的模型,針對數據集上的40個類型,需要訓練40個模型才能完成任務,而採用CDP模塊後,一個模型能解決所有分類問題,且性能不降。若想進一步了解這個奇妙的思想,可參看文章:《國內首發Nature子刊 Machine Intelligence論文:思想精妙,或對DNN有重大改進!》

學習層面:連續學習和情境依賴

學習層面,神經網絡面臨的一個重要問題是災難性遺忘,即神經網絡在學習不同的任務時,如果不是把不同任務的訓練樣本混在一起去訓練,往往在學習新的任務時候,網絡就會把從舊任務中學到的知識忘掉。

以上圖為例,先讓神經網絡識別「狗」,得到一個性能非常高的網絡;繼而再讓網絡去學習識別「貓」,這時網絡的權重就會重新調整;學完之後再拿來去識別「狗」,神經網絡的性能就會大幅下降,甚至不能使用。

原因就在於,當學習「貓」的任務時,網絡把針對「狗」的任務學到的知識給忘了。然而,人腦卻沒有這種所謂「災難遺忘」的問題。人類先後順序地學習不同的任務,最後識別能力還能不斷提升。針對這一問題,餘山研究員在上面提到的那篇文章中提出一種稱為「正交權重修改 (Orthogonal Weights Modification,OWM) 」的算法。

圖:OWM算法原理示意圖。(a): 在權重更新時,OWM算法只保留傳統BP算法計算的權重增量中與歷史任務輸入空間正交的部分;(b): 在新任務中,OWM算法將神經網絡對解的搜索範圍約束在舊任務的解空間中。 

OWM算法的核心思想很簡單,即通過 P 映射之後,學習新任務的解仍然在舊任務的解空間當中。正如其名「正交權重修改」,在學習新任務時,只在舊任務輸入空間正交的方向上修改神經網絡權重。如此,權重增量幾乎不與以往任務的輸入發生作用,從而保證了網絡在新任務訓練過程中搜索到的解,仍處在以往任務的解空間中。數學上,OWM通過正交投影算子P與誤差反傳算法得到的權重增量△w作用來實現其目的,即最終的權重增量△w=kp△w,這裡k為係數。OWM算法實現了對網絡中已有知識的有效保護,並可以與現有梯度反傳算法完全兼容。 

如上圖所示,餘山等人在ImageNet 上做了測試,選取 1000個類,特徵提取器使用ResNet152,在訓練分類器時:

1)當採用傳統的SGD方法,任務混合訓練時,準確率為78.31%;

2)在採用SGD,但所有任務順序訓練時,準確率直降到4.27%,這正是「災難性遺忘」的結果;

3)當採用OWM方法,任務順序訓練時,結合經過預訓練的特徵提取器,準確率能夠達到75.24%,性能媲美於SGD的混合訓練。

餘山等人同樣在手寫字數據集HWDB上進行了測試,包含3755個類,特徵提取器選用ResNet18,同樣可以看到,採用OWM順序訓練分類器依然能夠保持較高的性能。

值得一提的是,算法具有優良的小樣本學習能力,以手寫體漢字識別為例,基於預訓練的特徵提取器,系統可以從僅僅數個正樣本中就能連續的學習新的漢字。上圖中顯示在3755個類(漢字)上,僅需要在10個類上進行連續學習,便能夠達到90%以上的性能。

OWM算法有效地克服了災難性遺忘的難題,使得單個神經網絡不僅可以先學「狗」再學「貓」,而且可以逐漸的學習多達數千個類型的識別。這一新型學習算法和前面介紹的情境依賴處理 (CDP) 模塊配合,能夠使人工神經網絡具備強大的連續學習和情境依賴學習能力。

其中,OWM 算法可以有效克服神經網絡中的災難性遺忘,實現連續學習;而受大腦前額葉皮層啟發的 CDP 模塊可以有效整合情境信息,調製神經網絡的信息處理過程。二者結合便有望讓智能體通過連續不斷的學習去適應複雜多變的環境,從而逐步逼近更高水平的智能。

先驗知識、語義理解和記憶

除了上面四個層次的借鑑之外,餘山老師還介紹了如何將先驗知識壓縮並注入神經網絡、從符號計算到語義理解、從有監督的分類訓練到無監督的重構和預測等類腦計算的思路。如何將先驗知識壓縮並注入神經網絡。

認知學家曾經做過一個實驗,即從小教一個黑猩猩學習語言,發現黑猩猩在語言學習上遠遠不能達到人類的高度。這說明我們人類大腦有先天的神經結構能夠讓我們容易學習語言,這種先天結構即為先驗知識。作為對比,當前的神經網絡基本上沒有先驗知識,都得從頭學起。

那麼我們是否可以借鑑大腦積累先驗知識的機制,來設計人工神經網絡呢?從符號計算到語義理解。目前的自然語言處理系統訓練的材料是語料,純粹是文字或符號。

以中文屋(Chinese Room)實驗為例,裡面純粹是做一些非常簡單的信息處理工作,只是一個符號到符號的處理過程,並沒有真正理解內在的含義。因此NLP的研究,若想克服這個問題,未來必然需要向大腦學習。有監督的分類訓練到無監督的重構和預測。

當前,訓練好的做分類任務的神經網絡在複雜環境下往往性能並不好。但對比一下,人類的視覺系統並沒有使用監督信號去訓練分類任務,例如小孩學習識別物體,完全是靠自監督的方式看這個世界的。因此,真正的強人工智慧可能並不是現在這種端到端的有監督訓練,而是採用類腦的分階段的、包含無監督或自監督的訓練方式。最近機器學習領域的進展,也說明了這一策略正逐漸受到人們的關注。

結語

餘山研究員總結道,雖然我們對於大腦的了解尚不完備,生物腦和人工神經網絡的結構也有很大的差異,但是這並不是開展類腦計算研究的本質障礙。

神經科學和認知科學的研究已經發現了大腦的很多機制性原理,這些知識足夠指導我們不斷改善智能系統的設計,最終有望實現在不同層面上受腦啟發的更加強大和高效的人工智慧系統。

(雷鋒網(公眾號:雷鋒網))、(雷鋒網)、(雷鋒網)

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 中科院自動化所發力類腦智能研究—新聞—科學網
    >自動化所供圖 ■本報記者 彭科峰 你能試想有一天,機器人的大腦能夠如同人腦一樣自主識別陌生的環境,並具備思考能力嗎?
  • 「智能科學與技術」交叉學科國際論壇在自動化所召開
    為進一步提升「智能科學與技術」高精尖學科建設水平,推進學科建設與人才培養深度融合,搭建海內外學者進行思想碰撞和學術交流的平臺,12月17日,中國科學院大學(以下簡稱「國科大」)人工智慧學院在中科院自動化所舉辦了「智能科學與技術」交叉學科國際論壇。
  • 【中國科學報】新平臺可從突觸水平「看清」大腦
    在多個層次上解析腦網絡系統的聯結方式與規則,繪製大腦線路圖,並對其進行研究和模擬,是近年來神經科學和計算科學一個重要的交叉融合點。日前,記者從中科院自動化所獲悉,科研人員已經建立國內最高通量的納米級突觸水平神經大數據重建與分析平臺。
  • 餘山:從腦網絡到人工智慧——類腦計算的機遇與挑戰
    所以AlphaGo 可以說是結合了類腦與非類腦的計算與智能,完美發揮其各自特長所取得的成功。除了AlphaGo 所運用的深度神經網絡之外,現在研究的類腦計算和智能還有哪些方面?可能會在不久的將來帶來什麼樣的突破呢?  什麼是類腦計算?
  • 新平臺可從突觸水平「看清」大腦—新聞—科學網
    本報訊(記者彭科峰)在多個層次上解析腦網絡系統的聯結方式與規則,繪製大腦線路圖,並對其進行研究和模擬,是近年來神經科學和計算科學一個重要的交叉融合點
  • 中科院自動化研究所研究員做客「珠海文化大講堂」 人工智慧技術將...
    隨著科技的發展,人工智慧技術逐漸走進人們的視野,各種類型的機器人得到越來越廣泛的應用。近日,中國科學院自動化研究所研究員原魁做客「珠海文化大講堂」,帶來主題為「智慧機器人與人工智慧」的講座,講解機器人的類型、智慧機器人的發展現狀和發展趨勢以及人工智慧的相關知識,給市民帶來一場科技盛宴。
  • 我是中科院神經所的研究員仇子龍,關於基因與大腦發育等問題,問我吧!
    我是中科院神經所的研究員仇子龍
  • 賓通智能贊助2019高工機器人年會:打造平臺型智能工業大腦
    國內相對完整的產業鏈所帶來的就是自動化的「非標準化」,所以在當前「柔性製造」的市場環境下,訂單呈現少量多樣,企業盲目的進行自動化改造並不現實。 賓通智能科技CEO龔超慧認為:「原來很多傳統的製造業想要實現自動化,它必須要把很多的工藝環節做得非常的標準,用很多的夾具,保證機械臂標準化的動作,然後他就能實現一件工藝一件事情的自動化,但是說有些場景,其實整個物料過來都是一個散亂的一個狀態。」 「它是不標準的,所以很難做到自動化。
  • 中科院神經所最新研究成果:大腦通過統計推理表徵「自我」
    該研究由中國科學院腦科學與智能技術卓越創新中心(神經科學研究所)、上海腦科學與類腦研究中心、靈長類神經生物學重點實驗室王立平研究組完成,博士後方文為該論文第一作者。更重要的是,研究人員通過電生理記錄的方式,發現了獼猴大腦前運動皮層的群體神經元以貝葉斯因果推斷的方式對身體擁有感進行編碼。我們的大腦究竟如何感知自己?自我意識的神經機制是什麼?這一直是神經科學領域中最激動人心的問題之一。雖然意識問題極其複雜,所涉及的內容也非常廣泛,但其中最為核心之一的是我們對於自我身體的感知。
  • 智能計算中心:新型「超級大腦」
    如今,不少地方政府和企業正在布局人工智慧計算,通過新型人工智慧晶片和新型計算方法強化計算中心這一「超級大腦」,使其算力更強、速度更快,賦予人工智慧更強勁的「爬坡之力」。該模型可預測60天的新冠肺炎疫情,並在僅有確診病例數據的情況下,推導潛在感染人數、接觸感染率等未知因素,進而在不同防控力度的預置條件下實施預測,為疫情防控提供決策輔助。使這一預測模型更快學習真實疫情數據並推演未來的,正是116億億次/秒(1.16Eops)的智能化算力,由珠海橫琴新區的橫琴先進智能計算平臺所提供。
  • 自動化類專業:為各行各業構建「智慧大腦」
    張佐:自動化專業就好比一把信息與智能時代、跨行業的「金剛鑽」,面對各個行業特定的問題,以信息處理、系統決策和智能控制為專業核心能力,深度利用信息科技與智能技術,善於理解人的願望,能夠找到最適合的目標,設計無人或少人參與的自動控制系統、智能裝備和智能服務系統,並保證系統能夠自動、智能、高效、節能、安全、穩定運行,從而實現預期目標。
  • 杭州市下城區:城市大腦建設探索與借鑑
    一是率先發布城市大腦區縣級平臺。依託城市大腦中樞體系,應用三維實景地圖,整合資源建成杭州城市大腦下城平臺。開發拓展住建、衛健、統計、城管等部門駕駛艙功能。建成區級駕駛艙手機版——「掌上微駕」,實現從「掛圖作戰」到「帶圖作戰」的跨越。二是率先建成街道級數字駕駛艙並實現全覆蓋。8個街道數字駕駛艙總體框架與區級駕駛艙一致,實現市、區、街三級任務、職能、責任協同。
  • 人民日報創作大腦背後的AI支撐:百度大腦智能創作平臺技術解密
    12月24日,人民日報舉辦"2020智慧媒體高峰論壇",發布人民日報"創作大腦",百度公司提供技術支持,助力智能編輯部建設,開啟智能媒體新時代。人民日報"創作大腦"具備直播智能拆條、在線視頻快編、圖片智能處理、智能字幕製作、可視化大數據、智能寫作、新聞轉視頻、實時新聞監測等18項重點功能,是集輕應用平臺、智慧媒體雲、知識社區、開放生態於一身的一站式智能創作平臺,能夠為媒體機構提供全媒體生態智能解決方案。人民日報"創作大腦"背後,是百度智能雲提供領先的雲+AI技術支持,尤其是來自百度大腦智能創作平臺的支持。
  • 破解了結構之謎,就能再造大腦嗎
    這一發現讓光也成為影響大腦神經環路的因子之一,牽起了一連串關於益智、健腦的可能遐想。      越來越深入的研究,讓人們探查到大腦中越來越多的秘密,但大腦謎題卻絲毫沒有因此減少。到底大腦裡還有多少未知的謎題?所有的謎題能不能得到答案,解題後又能否再造一個大腦呢?      人類對大腦了解多少?
  • 全國首個億噸級智能礦區「最強大腦」來了!
    綜採工作面自動化控制系統——對採煤機、液壓支架、三機保護系統遠程監測,隨時掌握工作面煤機運行情況及當班割煤刀數,將運輸機機頭崗位工、馬蹄兒司機、控制臺崗位工「三崗合一」,減少了井下作業人員;對綜採主要設備實時監測,同時進行智能關聯分析,根據數據變化趨勢提前發現設備隱患,提前組織檢修,提高了設備開機率;對綜採「三機」、泵站、組合開關
  • 發現不易察覺的「頭腦病毒」,去除大腦雜質非常重要
    就拿以往筆者作文中多次提到的查補肉身大腦的「漏洞」和消除「智能病毒」這項功課來舉例,所謂的大腦中的漏洞和病毒,這是一個形象的比喻,因為人的腦就相當於一部精密複雜的計算機,出廠默認的系統設置不會完美無缺,需要在使用過程中不斷進行刪除、更換、下載、安裝、升級各種功能的應用系統軟體,如此才會越來越先進和順暢好使,而那些阻礙頭腦科學運作的低級認知、荒謬理念、錯誤想法、垃圾經驗以及墊底標配思維模式等信息
  • 《科學》:青春期大腦發育變化阻礙學習認知能力
    美國一項研究表明,這一現象由青春期大腦發育變化引起,一定程度上會阻礙學習認知能力。 老鼠實驗 紐約州立大學醫療中心研究人員以老鼠為實驗對象,訓練它們坐在轉盤上識別房間內的路標。 先前研究顯示,人的大腦年輕時能接受較多信息,所以兒童時期學習能力較強,但進入青春期有所下降,青春期過後相對恢復。 研究人員眼下對這一現象的解釋是:人腦內海馬狀突起處控制人的記憶和學習能力。青春期時此處有一器官凸起,分泌大量蛋白質,降低大腦興奮度,損害空間認知能力,使人記憶能力下降。
  • 人的大腦為什麼需要智能記憶?
    人的學習過程主要是由大腦來控制和管理,這種管理存在許多缺陷。首先,學習者對自己的學習記憶狀況了解只是大概的而不是精細的。由於人腦的認知能力局限,它不能精確地記錄學習者自身的詳細學習情況,如學習一百個單詞,我們的大腦並不知道記住了多少個,忘記了多少個,記住的單詞什麼時間會忘記,什麼單詞需要複習,要複習幾遍。此類信息往往通過測試來部分獲得,測試結果只能反映當時的情況而不能預測將來的狀況。其次,人腦對自身學習的管理是經驗性的而不是科學性的,定性的而不是定量的。
  • 中國首個智慧機器人網絡協作大腦「河圖」發布
    原標題:中國首個智慧機器人網絡協作大腦「河圖」發布   記者19日獲悉,中國人工智慧「獨角獸」曠視科技推出機器人戰略,重磅發布首個智慧機器人網絡協作大腦——河圖(Hetu),未來5年將連接超10億個機器人以期創造更大價值。
  • 中科院瀋陽自動化研究所舉辦建所六十年主題展
    為紀念建所60周年,中國科學院瀋陽自動化研究所19日面向社會公眾舉行「光輝一甲子」——建所六十年主題展,包括科技成果展示和大事記影像展單元,得到了眾多科技愛好者的青睞。中國自主研製的首套6000米級遙控潛水器裝備(ROV)首次公開展出 據中科院瀋陽自動化研究所相關負責人介紹,本次主題展是紀念建所60周年系列活動之一,集中對外展示了該所自1958年建所以來,在機器人、智能製造和光電信息技術三個學科領域取得的科研成果和進展,展現了研究所從基礎研究、工程應用、成果轉化與產業化