Nature通訊:判別神經網絡間的個體差異——計算神經科學新工具

2020-12-17 騰訊網

導語

深度學習的成功,正在反哺神經科學。例如現在如果想研究哺乳動物的大腦是如何區別貓和狗的,可以去考察判別貓和狗的神經網絡是如何工作的。然而11月12日Nature Communications雜誌在線發表的論文指出,由於神經網絡的訓練初始條件和超參數不同,即使具有相近的判別精度,不同的神經網絡也存在顯著差異。該研究還指出在比較網絡結構差異性時,需要考慮對比多組而不是多個神經網絡間的區別。這對計算神經科學尤其是視覺模型研究具有啟發意義。

論文題目:

Individual differences among deep neural network models

論文地址:

1. 如何衡量神經網絡間的異同

卷積神經網絡作為目前最成功AI模型,其靈感來自於模仿大腦的視覺皮層腹側視覺流(ventral visual stream)。由於視覺處理是分層次的,早期階段處理諸如邊緣、顏色等低級特徵。而整個物體和面孔這樣的抽象程度更高的特徵,只會在下額葉皮層這樣的後期處理階段才會湧現。

圖1:卷積神經網絡結構示意圖(判別圖片中的馬)

借鑑神經科學對大腦的研究,卷積神經網絡也採取了類似的結構。上圖表示的卷積神經網絡分為9層,通過對數據的分層壓縮,提取高層特徵,最後再利用該特徵分類。

研究大腦的神經科學家,需要了解大腦如何判別不同的物體。例如判別植物和動物,是否使用了相同的神經機制。但直接觀測大腦太難。而觀測和大腦具有相近結構的人工神經網絡就容易多了。神經科學家可以根據人工神經網絡在判別動物與識別植物時,有何差異,推斷大腦識別動物和植物的腦區的異同。

圖2:兩個神經網絡的差異性估計

根據人工神經網絡中的激活情況(即訓練好的網絡中的神經元權重向量),可以計算判別馬和卡車的神經網絡的差異,偏離右圖中的斜線越遠,兩個神經網絡的差異越大。這被稱為表徵差異性矩陣(representational dissimilarity matrices,RDMs)。

圖3:衡量兩組神經網絡差異的方法

對於兩組功能相同的神經網絡(例如一組判別馬,一組判別卡車),可以通過兩兩比較功能A和功能B網絡的RDMs,之後計算兩組網絡之間的皮爾森相關係數,來衡量這兩種功能對應的神經網絡間的差異。

2. 深度的增加

帶來了神經網絡間表徵差異性的異同

不論是判別動物還是植物,最初都是要分別諸如圖像的局部直線還是曲線這樣的特徵,而隨著抽象層次更高的特徵被抽取出來,判別任務相同的神經網絡,會在經由多維標度(multidimensional scaling)分析進行可視化後聚在一起,如圖4所示。

圖4:每一個點代表一個神經網絡,不同的顏色對應不同的判別功能,從左到右,神經網絡的深度不斷提升

將圖中判別每個物體的神經網絡看成一類,再將不同層的神經網絡間的相關性差異距離用設色熱圖展示,可以看到最神經網絡的第一層,判別不同物體的神經網絡並沒有什麼區別。

而隨著網絡層數的增加,對角線上的小正方形漸漸變淺,說明判別不同物體的神經網絡出現差異,這進一步說明了和待判別對象相關抽象表徵會在神經網絡的較高層次出現。如圖5所示

圖5:神經網絡的個體差異隨著網絡深度的增加而湧現

3. 高層次的特徵各有不同

該研究的另一發現是,相同結構、相同判別能力的神經網絡,僅僅因為訓練過程中的隨機性,會導致高層表徵的差異。

下圖中,對於共享權重差異的神經網絡(藍線)以及7層的類似Alex Net的神經網絡(黑線),網絡深度的增加,會造成網絡間標準差異性的增加。

圖6:100種判別神經網絡每一層的表徵矩陣對應的相關係數的均值

這意味著訓練過程中的隨機性,會造成具有相同判別能力的神經網絡,依據著各自提取的、不盡相同的抽象特徵進行判別。而無論使用何種方式計算抽象特徵間的相似度,都會得出相近的結果。

如下圖所示,當將衡量差異的方式換成cos距離,曼哈頓距離或正則化後的距離時,也會得出相似的結果。

圖7:不同的衡量方式下,神經網絡每一層的表徵矩陣對應的相關係數的均值隨層數增加降低

4. 高層次表徵向量差異的根源

為何會出現上述「完成同一種判別任務的神經網絡,具有不同的高層表徵」,是本研究接下來討論的問題。

在人類的學習中,該問題可以類比為,為何老師教會學生一個任務,但不同的學生在最後的步驟中會自發地出現差異。

假設有10個判別貓的神經網絡,對這些網絡的表徵向量求質心(centroid),再用這樣的質心來計算判別不同物體的神經網絡間的相關性,會發現隨著網絡深度的增加,標準差異性並沒有顯著增加(下圖中綠線)。

圖8:不同層的表徵向量質心對應的相關性不隨網絡層數深度增加而增加

這意味著判別不同的任務,所需的特徵是類似的,同一任務間的表徵差異性來自於訓練初始化中引入的隨機性

神經網絡在訓練過程中,為了避免梯度爆炸,會對權重進行正則化。這會在造成部分人工神經網絡中的神經元在實際中等效與被剔除。在深度學習中,為了提高泛化能力,一種常見的方式是dropout,即隨機失活部分神經元。

下圖展示了訓練過程中,隨著dropout的神經元的比例(縱軸)增加,神經網絡最後一層的表徵一致性先增加,後降低。

圖9:訓練過程中dropout比例不同的神經網絡最後一層的表徵一致性熱圖

如圖9所示,圖中的點越靠近黃色,抽象表徵的相似度越高。由於判別不同物體神經網絡間的抽象表徵相似,使得網絡具有了更好的泛化能力,進而解釋了為何dropout是一個有效的正則化機制。而當dropout的比例過高時,網絡無法提取出對分類任務有意義的特徵,因此最終的表徵有所差異。

5. 神經網絡模型個體差異性

對神經科學和人工智慧的啟發

該研究通過一系列的實驗,說明了由於前饋深度神經網絡訓練過程中初始權值的隨機性,在保持其他所有因素不變的情況下,會造成網絡學到的內部表示不同。且個體差異出現隨著網絡層數深度的增加而顯著增加。而湧現出的個體差異,部分可以通過正則化隨機導致的部分神經元失活解釋。

對於神經科學的研究者,如果忽略了相同功能的神經網絡本身的差異性,那麼在使用神經網絡類比大腦的運行時,得出的結論就會受到隨機性的影響。更合適的做法是去研究多個相同功能的神經網絡的質心,以此克服隨機因素的影響

而對於人工智慧的研究者,該研究可使研究人員能夠估計在給定訓練參數(例如網絡結構多大,不同的網絡類型、不同的訓練集及待完成的任務目標)時,訓練得出的網絡,可能具有多少表徵差異性,這反映了預期網絡可變性。

據此可使研究者能夠更好地調整神經網絡的超參數和訓練過程,以確保從他們那裡得出的模型能夠具有更強的泛化能力。並更深入地理解不同難度的分類任務上,不同的神經網絡為何會出現性能差異。

作者:郭瑞東

審校:劉培源

編輯:鄧一雪

相關焦點

  • 中科院神經所解析個體之間衰老速度差異之謎—新聞—科學網
    、腦科學與智能技術卓越創新中心、神經科學國家重點實驗室蔡時青研究組題為《膠質細胞-神經元信號的遺傳多態性調節衰老速度》的研究工作。衰老速度在個體之間存在明顯差異,大部分人行為和認知隨衰老逐漸地退化,也有一些人在耄耋之年仍能保持較好的活力。這種現象提示我們,研究個體衰老速度差異的遺傳基礎將為抗衰老提供重要線索,但相關研究還未見報導。   蔡時青研究組利用秀麗線蟲這一模式生物探討個體之間衰老速度差異的遺傳機制。
  • 耶魯大學教授汪小京:21世紀中國計算神經科學展望
    計算神經科學是一門跨領域的交叉學科,把實驗神經科學和理論研究聯繫在一起,運用物理、數學以及工程學的概念和分析工具來研究大腦的功能。隨著各項新技術,如高密度多電極記錄、用大量鈣敏感染料的雙光子成像技術、腦基因組學、腦連接組學的快速發展,未來數年裡實驗數據將以空前的速度增加。
  • ...MIT神經科學教授James DiCarlo談如何通過人類神經理解神經網絡
    總體研究內容與方法教授的研究內容是人類的大腦,研究它是如何工作的、如何用計算的方式模擬它;而CV界的研究目標則是嘗試構建出達到人類大腦表現的系統。所以在教授看來,希望CV界的人也能夠從神經科學的研究中受益。
  • 神經科學50年|NeuroHub
    研究者們發明了利用光線來刺激神經元的新工具。這項發明讓我們能夠更好地繪製腦內神經元的連接,並有望抗擊失明、疼痛與癲癇。但是,一項更新的研究表明健康的老年個體海馬體中有穩定的神經再生[22][23],給這一問題增添了爭議性。這一持續不斷的爭議或許與處理屍體組織時使用不同固定方法的技術限制有關,可能是檢測了錯誤的神經幹細胞標記物,或者是只研究了齧齒動物模型。在下一個50年裡,我們希望新技術能最終在體內用非入侵性成像技術標記新生神經元,或在不同哺乳動物的體外樣本中發現新生神經元。
  • 肖巍:女性主義「神經倫理學」的興起——從全球男女大腦性別差異...
    21世紀以來的十餘年裡,這一研究已經在悄然中催生 出女性主義生命倫理學發展的一個新趨向一女性主義神經倫理學,它是一種以女性主義視角研究和解釋神經科學發展所帶 來的一系列社會、倫理和法律問題的生命倫理學理論。關於大腦性別差異的研究是女性主義神經倫理學當前所關注的重要問 題,一些學者試圖以女性主義視角分析和解釋當代神經科學對於大腦性別差異研究的各種新發現。
  • DeepMind新研究登上《Nature》
    解決獎勵預測問題的重要突破是時序差分算法(TD),TD 不會去計算未來的總體回報,它嘗試預測當前獎勵和未來時刻預期獎勵之和。當下一個時刻來臨時,將新的預測結果與預期中的相比,如果有出入,算法會計算二者之間的差異,並用此「時序差分」將舊版本的預測調整為新的預測。
  • Hinton等人新研究登Nature子刊
    在皮層中,突觸嵌入在多層網絡中,這導致我們難以確定單個突觸的調整對整個系統行為的影響。而反向傳播算法在深度神經網絡中解決了上述問題,不過長期以來人們一直認為反向傳播在生物層面上存在問題。儘管如此,神經科學的最新發展和神經網絡的成功激活了人們對反向傳播能否幫助進一步了解皮層學習的興趣。
  • 研究新發現!人類記憶中特有神經「指紋」解碼
    雖然人類大腦的一般結構和組織是普遍的,但日前發表在《自然·通訊》上的一項新研究表明,可通過大腦活動觀察並量化人們重新構想常見情景之間的差異,這些獨特的神經系統特徵最終可用於理解、研究甚至改善諸如阿爾茨海默症等疾病的治療。當人們想像相似類型的事件時,每個人都會做不同的事情,因為他們有不同的經歷。
  • 模仿人腦視覺處理,助力神經網絡應對對抗性樣本
    在 bioRxiv 預印本伺服器上發表的一篇論文中,研究人員介紹了 VOneNet,一種結合了當前深度學習技術和神經科學啟發的神經網絡的架構。當今計算機視覺的主要體系結構是卷積神經網絡(CNN)。當卷積層疊加在一起時,可以學習和提取圖像中的層次特徵。較低的圖層找到一般的模式,如角落和邊緣,而較高的圖層逐漸變得善於找到更具體的東西,如物體和人。神經網絡的每一層都將從輸入圖像中提取特定的特徵。與傳統的全連接網絡相比,卷積神經網絡已被證明是更加健壯和計算效率更高的。
  • 北京大學麥戈文腦科學研究所研究成果入選2020年度「中國神經科學...
    為了推動神經科學領域的創新發展,充分展示和宣傳神經科學領域的重大科研成果,中國神經科學學會於2020年度首次開展「中國神經科學重大進展」推薦工作。  北京大學麥戈文腦科學研究所方方課題組和羅歡課題組在人類注意機制方面的研究成果、唐世明課題組在認知顏色空間形成的神經機制方面的合作研究成果入選2020年度「中國神經科學重大進展」。
  • VINE神經演化可視化工具
    VINE(Visual Inspector for Neuroevolution) 是用於神經演化的交互式數據可視化工具此外,VINE 還可以與其他神經演化算法(例如遺傳算法等)進行無縫的協作。事實上,這個工具獨立於任何特定的神經演化算法,用戶所需要做的只是稍微修改一下他的神經演化代碼,保存它想要了解的行為特徵。
  • 重建腦科學與AI之間的橋梁,人工神經網絡比機器學習更優嗎?
    1943 年,美國神經科學家麥卡洛克(Warren McCulloch)和邏輯學家皮茨(Water Pitts)在 「A Logical Calculus of Ideas Immanent in Nervous Activity」 一文中提出了神經元的數學模型,受人體大腦神經元的啟發,機器學習領域早期的重要算法 —— 人工神經網絡(Artificial
  • Nature子刊:大腦學習也靠反向傳播?Hinton等用新一代反向傳播算法...
    主要思想是:大腦神經活動中,局部計算出的差異會被編碼為類似反向傳播的誤差信號,從而促進大腦深層網絡中的有效學習。  結論:NGRAD就是人腦中的反向傳播神經迴路  研究團隊認為,反向傳播提供了一個理解人腦皮質如何學習的概念框架,但是關於大腦如何對算法進行近似,仍然存在許多謎團。  其中一些謎團很小,很容易解決。
  • 清華團隊首提新理論概念,將極大擴展類腦計算系統的應用領域
    這項成果表明,類腦計算系統也可以支持通用計算,將極大地擴展類腦計算系統的應用領域,也使類腦計算軟硬體各自獨立發展成為可能。提出「類腦計算完備性」概念為何重要?類腦計算,是借鑑生物神經系統信息處理模式和結構的計算理論、體系結構、晶片設計以及應用模型與算法的總稱。
  • 北師大盧春明組新綜述:適用於人際間言語交流的認知神經層級模型
    語言是為滿足群體協作的需要而產生的交流工具,也是人類區別於其它動物的重要標誌之一。但是長期以來,大部分關於語言腦機制的研究都脫離了交流情境,將聽和說割裂開來單獨進行考察。因此,基於這些研究建立的語言加工認知神經機制模型可能並不適用於語言交流過程的闡釋。
  • 2020年度「中國神經科學重大進展」獲獎名單「附成果介紹」
    中國科學技術大學生命科學與醫學部教授薛天和合肥學院教授趙歡為該論文的共同通訊作者,博士生安楷和趙歡為該論文共同第一作者。研究人員利用秀麗線蟲生活周期短的特點,以神經遞質功能變化為指標,在全基因組水平上進行篩選、尋找調控衰老的基因,獲得了59個候選基因。通過構建這些候選基因之間的相互作用網絡,發現其中兩個表觀遺傳調控因子BAZ-2和SET-6位於該調控網絡的關鍵節點,並且主要表達在神經系統中。
  • 清華大學計算機系張悠慧團隊首次提出「類腦計算完備性」
    研究完備性,可以為軟硬體系統的解耦合、劃分不同研究領域間的任務分工與接口提供理論基礎,我們的研究聚焦完備性理論研究,先回答基本的問題。」張悠慧說。相對於通用計算機,這一定義放鬆了對系統計算過程和精度的約束。團隊進一步提出相應的類腦計算機層次結構和確保類腦計算完備性的硬體原語(相當於通用處理器的機器指令)來充分利用這一新完備性帶來的優勢。
  • 研究不同神經元在人工神經網絡中的作用
    在過去十年左右的時間裡,世界各地的研究人員一直在開發越來越先進的人工神經網絡(ANNs),這種計算方法旨在複製人類大腦的生物機制和功能。雖然其中一些網絡在各種任務中取得了顯著的成果,但預測背後的決策過程並不總是很清楚。
  • 中科院計算所研究團隊提出圖神經網絡加速晶片設計
    《中國計算機學會通訊》(CCCF)近日刊發了中科院計算所特別研究助理嚴明玉、研究員範東睿以及研究員葉笑春共同撰寫的綜述文章《圖神經網絡加速晶片:人工智慧「認知智能」階段起飛的推進劑》。文章披露,該團隊提出了圖神經網絡加速晶片設計「HyGCN」。相關論文也先後在計算機體系結構國際會議上發表。