分析帖!怎樣辨別生物和人工神經網絡中的遞歸?

2020-12-06 IT168

  遞歸是神經網絡中的一個重要術語,在機器學習和神經科學領域有著不同的含義。然而,隨著用於實際應用的人工神經網絡(ANNs)越來越複雜,且在某些方面更像生物神經網絡(BNNs),這種差異正在逐漸縮小(但總體上仍存在巨大差異)。

  在這篇文章中,我們將重點介紹這兩個群體中遞歸使用的歷史差異,重點介紹一些比較新的神經科學領域的深度學習神經網絡模型,指出一些神經科學研究揭示遞歸的功能,並對未來進行預測。

  深度學習社區所指的是經常性連接類似於神經科學界所說的橫向連接。 即局部區域中的互連神經元。

  在神經科學界,經常性網絡是一種多樣性的網絡,包括前饋、橫向和反饋連接。

  反饋連接適合動物的能力和行為,在沒有這種連接的深度學習模型中可能無法複製。

  深度學習人工神經網絡的遞歸

  正如許多讀者所知,深度學習網絡是神經網絡的子類型,其中神經元(或節點)被安排成層。與早期研究的只有一兩個這樣的層的網絡相比,這樣的網絡中存在許多層,這也是它命名的原因。在一個典型的全連接前饋深度學習網絡中,給定層中的所有神經元都將它們的輸出發送給緊隨其後的層中的所有神經元(計算的方向流通常被描述為從下到上或從左到右在層之間移動)。

  人們還可以設計網絡,其中給定層中的神經元將其輸出發送到緊接在其之前的層,從而引入層之間的反饋連接。

  最後,一層神經元可以以完全連接(或其他)的方式將其輸出發送回自身。 存儲在層中的信息在下一個處理步驟中作為對同一層的輸入重新出現。 這是一種遞歸的類型,在深度學習實踐者討論時總是意味著遞歸僅限於一個層。 (請注意,可能存在多個循環層,但層間連接僅為前饋。)

  與右側的前饋網絡不同,左側的網絡具有「反饋」到自身的重複層(較大的淺藍色圓圈)。在深度學習的說法中,

  這種遞歸連接將記憶賦予遞歸神經網絡(RNN)。網絡的輸出不再僅僅依賴於對標時間的輸入。相反,網絡在任何給定的時間都有一個「狀態」,它與下一個輸入相結合,提供一個新的輸出,並更新網絡的狀態。

  這允許RNN識別或產生其時間結構不同的模式,例如語音[1]。 例如,話語<sleep>和<sleeeep>都可以被識別為單詞「sleep」。 事實上,這種序列到序列網絡的設計和訓練方法的重大進步是語音識別技術在過去2 - 3年中取得如此巨大進步的關鍵原因。 Siri和Alexa可能仍然像個「人工智障」,但至少他們可以非常準確地將您口語翻譯成文本(儘管您可能並不總是認可它們的回答)。

  文本的語言翻譯是另一個取得巨大成功的領域。遞歸式的使用允許在編碼階段中積累信息,在解碼階段中進行分布式(跨時間輸出),因此不需要直接進行單詞對單詞或短語對短語的對齊。例如,允許一種語言中單詞前的修飾語在另一種語言中緊隨其後,或是將red hat翻譯成sombrero rojo。

  更不用說上面所說的「普通」RNN架構在實踐中很少使用了。高級應用程式通常依賴於人為設計的修改,以適應門控機制。在某種意義上,這允許它在接收到某個輸入或交付某個輸出時「轉儲」循環層的狀態內存。作為一個類比,當你完成一個想法時,可能會希望扔掉那個想法,這樣它就不會和你的下一個想法混淆了。值得注意的是,最常見和有效的門控層之一是長短期內存(LSTM)層,最初創建於1997年,遠遠早於基於rnnn的應用程式的。

  生物神經網絡中的遞歸

  在神經科學家中,遞歸有一個更寬泛的定義:基於生物神經網絡(BNNs)中神經元之間幾乎各向同性的連接模式。神經元向其他神經元的軸突投射非常豐富,可以向前或向後、短距離或長距離傳送。雖然有證據表明,大腦皮層在結構和功能上都存在粗糙的分層結構,但大腦皮層顯然沒有被安排成神經元的有限層(組)。大腦作為一個整體有不同的區域,有不同類型的神經元和神經遞質,但沒有像深度學習神經網絡定義特徵那樣的分隔連接。儘管如此,深度學習實踐者所稱的反覆連接更有可能被神經學家稱為橫向連接。

  遞歸網絡是以吸引子網絡的模式完成特性,這也是計算神經科學家進行大量研究的方面。在我們自己的腦海中,可能只需要短暫的一瞥,一陣短暫的聲音或者一點點氣味,就能帶來強烈而充滿活力的記憶。或者當我們試著回憶一個演員或女演員的名字時,我們會想像他們的臉,想起他們合作過的其他演員的名字、電影的名字等等,直到他們的名字神奇地出現在我們的腦海中。類似的現象已經在吸引子網絡的模擬中被觀察到(一個非深度學習結構的ANN,通常帶有抑制和興奮性的人工神經元,這代表了BNNs的更現實的模型)。例如,由人臉圖像驅動的神經活動模式也可能由同一人臉的模糊或嘈雜圖像驅動,只是在後一種情況下,網絡的動態需要更長的時間才能達到穩定狀態。

  Hopfield吸引網絡的能量景觀。感覺信息可以簡單地將網絡活動定位在不穩定的部分信息狀態,從該狀態

  比區分深度學習神經網絡的有限遞歸(層內)與廣泛遞歸更重要的是,在大多數深度學習模型中缺乏反饋連接。在神經科學領域,「遞歸」一詞幾乎等同於反饋和前饋連接的混合,最近的研究為反饋的作用提供了新的證據。

  生物網絡中可能存在的周期性連接和反饋連接功能:

  迭代感知處理:即循環處理,其中自下而上和自上而下的信息流相互作用以穩定結果。有關該主題的更深入問題,請見以下內容。

  長期記憶:不完整的信息可以發起從長期儲存在網絡的存儲器召回(如上所述)。

  短期記憶:可以記憶短數字序列或幾句話內容所需,由共同產生穩定(或動態的)發射模式的神經元維持,保持新的短期記憶。該功能與上述序列到序列深度學習RNN的功能相似(例如,允許語音識別和語言翻譯)。

  自上而下的目標驅動注意力:基於目前的任務和相關目標,並不是所有的感官信息都具有同等價值。尋找自己喜愛的紅色漿果的動物可能具有反饋連接,這種連接可以增強對紅光作出反應的低層神經元的活動,同時降低對其他顏色作出反應的神經元的活動。這個過程的神經模型利用了深度學習社區工作。

  可塑性:遞歸也是生物大腦學習機制的重要組成部分。例如,皮層下基底核中的多巴胺釋放神經元是由皮層和皮層下區域組成的複雜網絡的一部分,能夠增強皮層區域對獎賞(食物、交配等)行為的可塑性,從而加強這種行為。這種神經元和網絡的複雜性在最先進的深度學習中幾乎完全缺失。

  門控:據推測,反饋也可以作為一種門控機制來控制信息從低級神經元到高級神經元的流動。注意力可能會使用這樣的門控,但這裡我們指的門控不是由生物體的意識感知和目標驅動的。例如,眾所周知,關於物體身份的視覺信息是沿著枕葉皮質到下顳葉皮質的通路提取和提煉的。相反,目標位置信息是沿著枕葉皮質到頂葉皮質的路徑提取和細化的。門控可能有助於指導這種信息傳遞過程,並且可能是支持前面討論的迭代感官處理的機制。

  迭代感官處理

  我們簡要強調BNN中循環和反饋連接的迭代感知處理角色,並將其與在深度學習神經網絡中主導圖像分類任務的前饋卷積神經網絡(CNN)進行對比。

  深度學習對象(image)識別模型在該領域取得了巨大的成功,自CNN發布第一個贏得ImageNet大型視覺識別挑戰(ILSVRC)的模型「AlexNet」以來,該領域發展迅速。由於視覺皮層是哺乳動物皮層中研究最廣泛的區域,因此,人們對深度學習中樞神經網絡與哺乳動物視覺進行了許多主觀和定量的比較。

  早期的視覺神經科學模型是基於Hubel和Weisel等人對單個神經元的記錄,它們與標準的中樞神經網絡相似,都有卷積、匯聚和前饋連接。功能模型前饋的部分動機是視覺感知速度很快,大約在100毫秒左右。這一估計是基於大腦「高級」區域的神經放電時間相對於向實驗動物展示圖像的時刻。基於解剖學,視覺皮層通常被建模為一個鬆散的層次結構,由4-6個層次組成,具有強烈的反饋連通性。儘管存在反饋連接,但較高水平的神經反應速度表明,反饋連接並非完全必要(對於簡單的對象識別任務)。如果不是這種情況,在這些領域形成穩定反饋的速度將會更慢,因為反饋循環的貢獻需要更多的時間來傳播。

  然而,在具有挑戰性的ILSVRC測試集中,CNNs需要幾十層甚至數百層才能實現良好的圖像分類性能,這與僅僅由幾個前饋級組成的視覺皮層模型形成了矛盾。此外,在一些計算研究中,相對較淺的RNNs與較深的CNNs表現相當。

  Liao和Poggio [10]建立了一個4級復發網絡,旨在模擬視覺皮層。在這個粗糙的模型中,來自眼

  最近,世界級實驗室進行的一對神經科學研究以及對生物反饋性連接的時間延遲研究,表明需要遞歸才能捕獲人類視覺皮層的動態計算, 遞歸對於視覺皮層執行識別行為至關重要。 簡而言之,如果沒有被循環網絡多次迭代,就無法識別出更具「挑戰性」的對象圖像實例。 換句話說,需要額外的非線性變換以成功識別對象,在那些區域中形成的反饋將更慢,因為來自反饋迴路的貢獻需要更多的時間來傳播。

  最後的話

  如上所述,雖然循環深度學習神經網絡模型具有層內遞歸(神經科學用語中的「橫向」連接),但很少有神經科學家經常研究的反饋連接類型:從較高層到較低層的連接。

  與此相關的是,生物神經元是並行運作的,因此在大規模的遞歸網絡中的計算可以快速進行。事實上,神經元狀態的同步計算更新是成功的關鍵。對於運行在現代硬體上的大型、高重複性神經網絡,這種程度的並行可能很難實現。我們推測,在深度學習模型中引入大量的反饋遞歸,並為這些模型開發訓練方將帶來強大的人工智慧能力。

相關焦點

  • 人工神經網絡在區塊鏈技術中的應用是什麼
    人工神經網絡在解決分類、回歸、函數估計和降維等問題中非常有用。然而,不同的神經網絡結構能夠在某些問題上獲得更高的性能。本文將概述最常見的神經網絡架構——包括遞歸神經網絡和腦回神經網絡——以及如何實現它們來幫助區塊鏈技術。
  • 全球首款利用尖峰遞歸神經網絡(SNN)處理雷達信號的晶片
    據外媒報導,近日歐洲研究與創新中心(IMEC)推出全球首款利用尖峰遞歸神經網絡(SNN)處理雷達信號的晶片。 人工神經網絡(ANN)已被證明可在廣泛的應用領域中使用,例如,已被用於汽車工業中常用的基於雷達的防撞系統。但是,人工神經網絡有其自身的局限性——它們消耗的功率過多,無法集成到越來越受約束的(傳感器)設備中。此外,人工神經網絡的基礎架構和數據格式要求數據在做出決定之前要經歷從傳感器設備到AI推理算法的耗時過程。
  • 深度|人工神經網絡深入分析
    本文與吳老師的講解方式不同,筆者希望能從神經網絡的起源揭開神經網絡的面紗,從而幫助更多的對神經網絡感興趣但卻沒有相關理論基礎的朋友們。說起人工神經網絡的起源肯定要追溯到生物的神經網絡。突觸延遲使輸入與輸出間有固定時滯。人工神經網絡1943年,基於生物神經網絡莫克羅-彼特氏神經模型(McCulloch-Pitts′neuronmodel)誕生。它由心理學家Warren McCulloch(下圖左)和數學家Walter Pitts(下圖右)合作提出。
  • 人工智慧神經網絡和生物大腦有什麼區別 神經網絡將如何發展
    但是正如Zador解釋的那樣,人工神經網絡中的學習與大腦中發生的事情有很大不同。他寫道:「在人工神經網絡中,學習是指從輸入數據中提取結構(統計規律性)並將該結構編碼為網絡參數的過程。」例如,當您開發卷積神經網絡時,您將從一塊空白板開始,這是一層由隨機權重連接的人工神經元的分層結構。當您在圖像及其相關標籤上訓練網絡時,它將逐漸調整其數百萬個參數,以便能夠將每個圖像放入其合法的存儲桶中。
  • 訪遞歸神經網絡之父:AI下一輪革命的核心是「人工好奇心」
    以上三段話不是科幻電影的臺詞,也不是科幻小說的描述,是人工智慧遞歸神經網絡之父、德國計算機科學家尤爾根·施米德胡貝在參加2019世界人工智慧大會之際接受澎湃新聞(www.thepaper.cn)專訪時,對人工智慧的預測。
  • 對人工神經網絡「開刀」,利用神經科學消融法檢測人工神經網絡
    在此之前,消融已經被應用在一些人工神經網絡的研究中,但這些研究主要關注於調整神經網絡層和改變其結構,因此更像是參數搜索而不是生物學的消融法。Mayes Meisen 以及他們的同事 Peter Lillian 進行這項實驗的目的是想從生物學的角度檢驗人工神經網絡,評估它們的結構以及不同組成部分的不同功能。
  • 初識人工神經網絡
    人工神經網絡(artificial neural networks) 是一種模仿生物神經網絡行為特徵,進行信息處理的算法數學模型。在人工神經網絡模型中使用單元節點模擬神經元,通過調整神經網絡內部大量節點(神經元)之間相互連接的權重來達到處理信息的目的。
  • 人工神經網絡研究的發展歷程及重要特性
    人工神經網絡研究的先鋒麥卡洛克和皮茨曾於1943年提出一種叫做「似腦機器(mindlike machine)」的思想,這種機器可由基於生物神經元特性的互連模型來製造,這就是神經學網絡的概念。他們構造了一個表示大腦基本組成部分的神經元模型,對邏輯作業系統表現出通用性。
  • 谷歌ICML獲獎論文 看像素遞歸神經網絡如何幫圖片「極致」建模 ?
    我們提出一個深度神經網絡,它根據順序沿著兩個空間維度來預測圖片中的像素。我們的模型離散了原始像素值的可能性,同時編碼保證了整個圖片的完整性。建模特性包含二維循環層,以及對深度遞歸網絡連接的有效利用。我們實現了比之前所有的模型都要好的在自然圖片上對數可能性的分數。我們的主要結果也對Imagenet進行分類提供了支撐依據。從模型分析出的樣本相當清楚、多樣且有普遍適用性。
  • Imec晶片利用尖峰遞歸神經網絡處理雷達信號 可用於汽車防撞系統
    蓋世汽車訊 據外媒報導,歐洲研究與創新中心Imec聲稱推出全球首款利用尖峰遞歸神經網絡(SNN)處理雷達信號的晶片。Imec晶片模仿生物神經元識別時間模式的方式,比傳統方案相比,功耗減少了100倍,同時延遲減少了10倍,幾乎可以瞬間做出決定。
  • 科技:人工神經網絡的進步
    這些重大新故事中的一些與人工神經網絡有關,人工智慧研究中的一個相對較新的現象正在推動從娛樂到醫學等許多領域的各種進步。人工神經網絡依賴於這樣的思想:技術可以使用對應於個體人類神經元和神經元組的小單元來模擬人類大腦的生物學工作,以基於輸入產生輸出。
  • AI的人工神經網絡
    人工神經網絡是模擬人和動物的神經網絡的某種結構和功能的模擬,所以要了解神經網絡的工作原理,所以我們首先要了解生物神經元。其結構如下圖所示:   而人工神經網絡的基本原理也就是對生物神經元進行儘可能的模擬,當然,以目前的理論水平,製造水平,和應用水平,還與人腦神經網絡的有著很大的差別,它只是對人腦神經網絡有選擇的,單一的,簡化的構造和性能模擬,從而形成了不同功能的,多種類型的,不同層次的神經網絡模型。
  • ...跑遞歸神經網絡!法國研究人員研發新系統識別人類行為,準確率達...
    分析在這裡主要指運動自分析,可用於骨科患者的臨床研究,或幫助運動員提高成績。這麼看來,從視頻序列中識別人類活動無疑是一個挑戰,研究人員需要克服背景雜亂、尺度或視角變化、照明和外觀等問題。如今,深度學習已成功應用於語音識別、自然語言處理和推薦系統中。同時,它還被引入到基於視頻的人類行為識別研究中,通過原始視頻輸入,系統能自動進行特徵推斷,以及識別複雜行為。
  • 人工神經網絡及其應用
    1958年計算機學家Frank Rosenblatt 發表一篇很有名的文章,在文章中他提出了具有三層網絡結構的神經網絡結構,該文章中提出的算法與後來的反向傳播算法和自組織算法類似。在1960年,Bernard Widrow 和Marcian Hoff發表的一篇為《自適應開關電路》的文章,他們不僅設計了在計算機仿真的人工神經網絡,而且用硬體電路實現了他們的設計。
  • 胖不胖:看人工神經網絡怎麼「稱」
    然而,怎樣才算肥胖,如何對肥胖進行更確切的評估呢?2016年第3期《前沿科學》刊載了清華大學體育與健康科學研究中心主任張冰教授等的論文「基於BP神經網絡的體脂百分比評估模型研究」,對這一問題進行了詳細解讀。張冰告訴記者,通常人體體重可劃分為兩部分,脂肪組織的重量和去脂肪重量。
  • 盤點人臉識別中的黑科技——人工神經網絡
    他們發現大腦中編碼人臉的方式和成功地執行人工智慧系統(稱為深度神經網絡)的驚人相似性。當我們看一張面孔時,視覺皮層中的神經元群被激活並發射它們的信號。事實上,某些神經元對面部有選擇性的反應,而不是對其他物體的反應。但是單個神經元的激活是如何共同產生面部感知和識別的呢?
  • 人工神經網絡發展歷程及特點
    ^_^ 最近十幾年來,人工神經網絡ANN的研究工作不斷深入,已經取得了很大進展,其在模式識別、智慧機器人、自動控制、預測估計、生物、醫學、經濟等領域已成功地解決了許多現代計算機難以解決的實際問題,表現出了良好的智能特性。 那麼究竟什麼是人工神經網絡ANN呢?
  • 什麼是人工神經網絡(ANN)?
    但是直到最近幾年,神經網絡的承諾才變為現實,並幫助AI行業擺脫了漫長的冬季。儘管神經網絡幫助AI取得了飛躍,但它們也常常被誤解。這時您需要了解的有關神經網絡的所有信息。人工和生物神經網絡之間的相似性人工智慧先驅的最初願景是複製人類大腦的功能,這是自然界最聰明,最複雜的已知創造。
  • 人工神經網絡的五大主要應用場景
    人工神經網絡(ANN)是一種被設計用來模擬人腦分析和處理信息的計算系統。它是人工智慧(AI)的基礎,解決了以人類或統計標準將被證明是不可能或很難解決的問題。人工神經網絡具有自我學習能力,能夠在獲得更多數據的前提下產生更好的結果。人腦對現實世界情境的解讀方式是計算機無法做到的。神經網絡最初是在20世紀50年代發展起來的,目的就是解決這個問題。
  • 研究不同神經元在人工神經網絡中的作用
    在過去十年左右的時間裡,世界各地的研究人員一直在開發越來越先進的人工神經網絡(ANNs),這種計算方法旨在複製人類大腦的生物機制和功能。雖然其中一些網絡在各種任務中取得了顯著的成果,但預測背後的決策過程並不總是很清楚。