具有自學習能力的全光尖峰神經突觸網絡

2020-12-05 神經小白

從圖像處理到語音識別,再到人工智慧和深度學習應用,人腦計算的軟體實現構成了許多重要計算任務的基礎。然而,與真實的神經組織不同的是,傳統的計算架構將存儲和處理的核心計算功能物理地分離開來,使得快速、高效、低能耗的計算難以實現。為了克服這些限制,一個有吸引力的替代方案是設計模擬神經元和突觸的硬體。當這些硬體連接到網絡或神經形態系統時,它們處理信息的方式更類似於大腦。在這裡,我們提出了一個全光學版本的神經突觸系統,能夠監督和非監督學習。利用波分復用技術實現了一種可擴展的光子神經網絡電路結構,成功地在光學領域實現了模式識別。這種光子神經突觸網絡有望獲得光學系統固有的高速和高帶寬,從而能夠直接處理光學通信和視覺數據。

在我們的日常生活中,人工神經網絡已經被廣泛使用,例如,用於執行面部和語音識別等任務,這些任務經常在我們的行動電話上執行。在更複雜的應用中,如醫療診斷和自動駕駛,高速數據分析將變得越來越重要。然而,由於速度和能量效率低下,使用傳統計算技術來滿足快速高效處理的需求是有問題的。傳統的計算機是按照馮·諾伊曼的架構建造的,有兩個獨立的單元分別用於內存和處理器,它們以順序的方式運行,一次一個命令。

與大腦的大規模並行信號處理相比,在基於馮·諾依曼架構的計算機上用軟體模擬神經網絡,並受到內存和處理器之間數據傳輸的限制,其效率是很低的,這是顯而易見的。神經形態計算的更激進的方法是,通過開發生物大腦的基本構件(即神經元和突觸)的硬體模擬,並將它們組合成適當規模的網絡和陣列,從而克服使用傳統計算機進行類似大腦處理的局限性。例如,這種方法可以使直接在晶片上並行地高效處理和分析數據成為可能,從而在諸如行動裝置和所謂的「邊緣計算」應用程式等電力關鍵情況下獲得廣泛的實用價值。

最近,在電氣領域提出了許多不同的實現人工智慧硬體(即神經形態)實現的概念,但光學方法還處於初級階段。然而,一種非常有前途的光子神經形態計算方法是基於相變材料(PCMs)和器件,因為它們已經被證明具有內在的能力,能夠在硬體上提供神經元的基本集成和激發功能以及synapses的塑性加權操作。一個完全光學的、集成的、可擴展的神經形態框架,用於使用PCMs實現spiking神經網絡——據我們所知——還沒有被證明。

在此,我們提出並製作了一個集成了全光突觸的全光尖峰神經元電路,並證明該系統能夠完成模式識別的典型人工智慧任務。此外,系統中的訓練和學習同時以監督和非監督兩種方式進行,這兩種方式都有廣泛的應用,但依賴於不同的學習規則。在第一種情況下,如果訓練集有一對已知的輸入和輸出,就可以應用監督學習規則,例如著名的反向傳播算法。第二種情況需要無監督學習,這意味著網絡可以自行適應特定的重複特徵和模式,而這些特徵和模式在此之前是未知的。

我們設計了一個可擴展的、分層的架構,基于波分復用(WDM)來實現這樣一個複雜的集成光子系統,提出了一個由4個神經元和60個突觸(總共140個光學元件)組成的光子神經網絡,能夠成功地識別呈現給它的字母。通過在納米光子晶片上實現一個全光尖峰神經網絡,我們向光學神經形態系統邁出了一步,這將得益於在光學領域完全運行所帶來的高帶寬和快速信號特性。

一個人造神經元的光子實現

圖1a, b所示為我們的光尖峰神經元電路的草圖,其中也包含了全光突觸,顯示了它是如何集成到一個納米光子平臺上的,N個輸入(突觸前)神經元,1個輸出(突觸後)神經元和N個相互連接的突觸。突觸前神經元與突觸後神經元之間的每一個連接都有一定的權值wi。在圖1a的結構中,來自突觸前神經元的光脈衝從左側進入連接的突觸,進而進入突觸後神經元本身。的突觸建立光學波導(見圖1 b)和加權實現通過PCM細胞細胞(這裡有一個面積3.6μm2和顯示為紅色的方塊)集成波導的頂部,可以修改傳播光以一種受控制的方式。pcm經常用於可重寫的光碟技術,如藍光光碟,並且在matter24的非晶態和晶態(相)之間的光吸收方面表現出很大的反差。

PCM細胞處於無定形狀態,突觸波導具有高度的透射性,代表了兩個神經元之間的強連接。然而,在晶體狀態,大部分的光被吸收,導致弱連接。將輸入脈衝加權後,使用波分復用(WDM)27,28將它們組合成單個波導,並引導到(輸出)尖峰神經元電路。它由一個環形諧振器和它自己集成的PCM單元組成,可以通過輸入的組合脈衝(在晶體和非晶狀態之間)進行切換。神經元PCM細胞的切換反過來又改變了環的光共振條件及其傳播損耗。

當神經元PCM細胞處於結晶狀態時,合適的探頭脈衝沿「輸出」波導耦合強地發送到環形諧振腔,因此不會觀察到輸出脈衝(spike)。然而,如果來自突觸前神經元的加權輸入脈衝的瞬時綜合功率足夠高,可以切換神經元PCM細胞以其無定形狀態,探針脈衝不再與環發生共振,並將通過環傳遞,從而生成輸出神經尖峰。因為PCM細胞的切換隻發生在一定的閾值功率之上,所以當輸入功率的加權和超過這個閾值時,神經元才會產生輸出脈衝(spike)。因此,該系統自然地模擬了生物神經元的基本集成和發射功能,其區別在於,人造神經元在固定的時間內通過光功率進行集成,而生物神經元則在一段時間內對傳入脈衝進行集成。這個人造神經元,如圖1c所示的光子電路形式,是適合神經突觸系統可擴展實現的分層光子網絡(如下所述)中的一個構件。

到目前為止所描述的神經突觸系統提供了監督學習任務所需的基本結構,其中輸入的權重由外部主管設定。然而,為了也能夠進行無監督學習,我們添加了一個反饋波導,將神經元的部分輸出脈衝導回突觸PCM細胞。通過這種方式(如下文更詳細的描述),所有導致特定輸出峰值的輸入之間的連接將會增強,而那些沒有貢獻的連接將會減弱——或者,用Hebbian的術語來說,就是「激活的神經元」

圖1d顯示了實際實現的光學顯微圖(×3)單神經元神經突觸系統,經電子束光刻在一個由一層氮化矽和一層氧化矽組成的平臺上。幾個輸入波導每個與突觸PCM細胞在頂部(用紅色橢圓表示)是饋給上層波導使用小環諧振器作為一個簡單的多路復用設備(環形諧振器有四個不同的半徑從線性增加40μm 55μm,光學品質因數(Q值)的價值1萬,插入損耗1.5 dB。這上波導然後導致光神經(大)環諧振器(半徑60μm)有自己的集成PCM細胞(面積9μm2)。發送到位於神經元環形諧振器下方的波導的探針脈衝可以與之耦合,也可以產生輸出脈衝,這取決於神經元PCM細胞是處於結晶狀態還是非晶狀態,如前所述。光通過光柵耦合器耦合在晶片上和晶片外,光柵耦合器在測量裝置中提供對多個光纖的訪問。

單神經元器件的光學性能

圖2a詳細顯示了單個神經元的光子信號處理和光學操作。每個輸入脈衝發送在不同波長λi和第一個部分吸收有關突觸PCM(加權)的細胞。加權後,單個輸入波導與一個多路復用器組合成單個波導,將輸入功率相加。如果這個能量足夠高,可以切換神經元大環形諧振器的PCM細胞(見圖2b),產生一個輸出峰值,在無監督學習的情況下,利用反饋迴路調整突觸權重。在圖2b中,可以看到用於傳遞脈衝神經元功能的環形諧振器的更詳細的掃描電子顯微圖。使用神經元PCM細胞為了調節諧振條件,在專門為低光損耗設計的波導道口上沉積了30 (0.23 dB)。第二個波導交叉(沒有PCM單元)僅用於測試目的,並允許偏置輸入。

為了表徵我們的神經元電路的積分-激髮型響應(或激活函數),我們通過交叉波導將不同能量的脈衝發送到神經元PCM細胞後,獲得了多個諧振器的透射光譜(圖2c;見的方法)。通過繪製不同激勵脈衝後環形諧振器的傳輸與固定波長下的脈衝能量的關係,得到如圖2d所示的激活函數。根據選擇的波長,可以調整輸出函數的對比度和最大傳輸電平。

可以清楚地看到,只有在最大脈衝能量的60%的閾值能量以上才能產生大量的輸出。這種非線性響應類似於經過校正的線性單元(ReLU)函數,對神經激活函數至關重要,因為它將複雜的輸入數據投射到更高的維度,使輸出神經元能夠進行線性分離

監督和無監督學習

實現了一個全光尖峰神經元,並進行了監督學習實驗。在這種情況下,網絡的突觸權值由外部管理器設置(例如,在基於軟體的人工神經網絡中使用反向傳播算法)。這裡,一組由輸入模式對和預期輸出對組成的訓練數據被顯示給網絡。根據預期輸出和實際輸出之間的偏差,在a中調整突觸權值優化過程,直到解決方案是最好的近似和網絡訓練。

所使用的實驗神經網絡由兩個單一的神經突觸系統(如圖1d所示)組成,每個神經突觸系統由四個輸入(突觸前)神經元連接到一個輸出(突觸後)神經元由四個PCM突觸組成。第一個神經元的權重被設置為「1010」模式,意味著第一個和第三個神經元PCM突觸處於高傳遞狀態(主要貢獻活化能),第二和第四突觸處於低傳遞狀態(較少貢獻活化能)。第二個神經元以同樣的方式被訓練。

在圖3a、b中,突觸後神經元的輸出被描繪成輸入模式的函數。可以清楚地看到,在這兩種情況下(即對於兩種輸入模式),神經元都得到了成功的訓練,而且從神經元的輸出中很容易確定哪種模式呈現給了網絡。利用同一組輸入神經元上的兩個輸出神經元,我們的全光神經形態系統已經可以解決簡單的圖像識別任務。通過增加的數量輸入每個神經元和神經元的數量,可以處理更複雜的圖像和更困難的任務,比如字母(或數字)識別或語言識別可以使用相同的基本解決方法,如下我們展示(在字母識別實驗,模擬數字識別和語言識別)。

我們已經舉了一個監督學習的例子。這種學習技術適用於許多任務,但存在輸入模式和期望輸出元組的訓練集的局限性必須存在。如果輸出是未知的,例如,如果必須在數據流中發現未知的重複模式,那麼監督學習是不適用的,非監督學習過程是必要的。在無監督方法中,網絡自動更新其權重,並以這種方式適應特定的模式,而不需要外部監控器。

為此,需要定義更新規則。無監督學習中一個常見的概念是依賴於尖峰時間的可塑性。在這裡,輸出峰值後突觸重量的變化取決於神經元的輸入和輸出峰值之間的相對時間(突觸前和突觸後神經元觸發的時間差異)。如果一個輸入信號剛好在輸出峰值產生之前到達,那麼這個輸入信號很可能已經達到了觸發閾值,相應的權重將會增加。如果輸入脈衝在輸出脈衝之後到達,突觸的重量就會減少。增強的量(體重增加)或下降(體重減少)是輸入和輸出峰值之間的時間差的函數。

在我們的全光神經元方法中應用了一個相似但簡化的學習規則。在我們的例子中,輸入脈衝和輸出脈衝之間的時間間隔是固定的(因為我們以計時的方式操作神經元,每一個時間步進有一個完整的輸入模式;因此,在輸入和輸出事件之間沒有變化的時間延遲。因此,我們採用了一個簡化的學習規則,增加了所有輸入的突觸權重,從而產生了一個尖峰減少所有沒有減少的權重。通過實驗,我們通過輸出脈衝與輸入脈衝的(時間上)重疊來獲得這種特性。

圖3d, e顯示了一個神經元在無監督學習過程中四個突觸權重隨時間的變化。最初,所有PCM突觸都處於無定形(高透過率)狀態。當輸入模式『0110』被重複時,神經元會隨著時間的推移適應它,直到最後神經元在沒有外部監督的情況下學會了這個模式。神經元現在專門用來識別這種特殊的模式。從圖3可以看出,w2和w3的權值與輸入3和輸入4對應,隨著時間的推移,權值幾乎保持不變,因為重疊的輸入和反饋脈衝保持其無定形狀態。相比之下,權值w1和w4是隨每個epoch逐步下降的。

參考文獻:

All-optical spiking neurosynaptic networks with self-learning capabilities

相關焦點

  • 會「學習」的超導人工突觸:讓神經形態計算更快更節能!
    (圖片來源:NIST)突觸的感受能力決定了突觸後神經元是否會對於信號作出響應發送的信號越多,那麼突觸的感受力就會加強,這樣就使得突觸具有了學習能力。人腦由兩個主要組成部分:神經元網絡和突觸。它與機器相比具有顯著優勢:第一,並行處理和存儲大量數據;第二,進行並行處理的能耗極低。
  • AI的人工神經網絡
    人工神經網絡是模擬人和動物的神經網絡的某種結構和功能的模擬,所以要了解神經網絡的工作原理,所以我們首先要了解生物神經元。其結構如下圖所示:   突觸界面具有脈衝/電位信號轉換功能,即類似於D/A轉換功能。沿軸突和樹突傳遞的是等幅、恆寬、編碼的離散電脈衝信號。細胞中膜電位是連續的模擬量。 神經衝動信號的傳導速度在1~150m/s之間,隨纖維的粗細,髓鞘的有無而不同。
  • ACS Nano:柔性碳納米管突觸電晶體,用於神經電子皮膚應用
    儘管已經有許多關於在剛性基板上實現人工突觸電晶體的報導,但是使用柔性器件有可能實現更大範圍的應用。本文,報告了使用高載流子遷移率半導體單壁碳納米管在超薄柔性基板上構建的人工突觸薄膜電晶體。柔性突觸電晶體的突觸特性包括長期/短期可塑性,尖峰幅度相關的可塑性,尖峰寬度相關的可塑性,成對脈衝促進和尖峰時間相關的可塑性。
  • 人造突觸問世,可用於搭建神經網絡
    科學家用有機材料製成了人工突觸,可模仿神經元之間的信息傳遞。多年以來,雖然計算機技術飛速發展,但是科學家們仍然難以構建出高效而精巧的大腦仿生計算機。將來,這種突觸不但可能成為高仿人腦計算機中的一部分,而且還尤其適用於通過採集視覺和聽覺信號來工作的計算機。這方面已有應用實例,如聲控界面和無人駕駛汽車。過去,科學家在這個領域努力耕耘,基於人工智慧算法建立了高性能的神經網絡,但因為目前算法仍然依賴於能耗較高的傳統計算機硬體,所以還遠遠稱不上模擬人腦。
  • ACS Nano:柔性碳納米管突觸電晶體用於神經電子皮膚
    對於模擬用於神經形態計算應用的神經元活動的憶阻或人工突觸設備的開發,人們倍感興趣。儘管已經有許多關於在剛性基板上實現人工突觸電晶體的報導,但是使用柔性器件有可能實現更廣泛的應用。柔性突觸電晶體的突觸特性包括長期/短期可塑性,尖峰幅度相關的可塑性,尖峰寬度相關的可塑性,成對脈衝促進和尖峰時間相關的可塑性。2.
  • 全球首款利用尖峰遞歸神經網絡(SNN)處理雷達信號的晶片
    據外媒報導,近日歐洲研究與創新中心(IMEC)推出全球首款利用尖峰遞歸神經網絡(SNN)處理雷達信號的晶片。 人工神經網絡(ANN)已被證明可在廣泛的應用領域中使用,例如,已被用於汽車工業中常用的基於雷達的防撞系統。但是,人工神經網絡有其自身的局限性——它們消耗的功率過多,無法集成到越來越受約束的(傳感器)設備中。此外,人工神經網絡的基礎架構和數據格式要求數據在做出決定之前要經歷從傳感器設備到AI推理算法的耗時過程。
  • 神經網絡的基礎是MP模型?南大周志華組提出新型神經元模型FT
    據論文介紹,這項研究為神經網絡提供了一種新的基本構造單元,展示了開發具有神經元可塑性的人工神經網絡的可行性。當前的神經網絡大多基於 MP 模型,即按照生物神經元的結構和工作原理構造出來的抽象和簡化模型。此類模型通常將神經元形式化為一個「激活函數複合上輸入信號加權和」的形式。
  • Nature 長文綜述:類腦智能與脈衝神經網絡前沿
    突觸(synapses)是記憶和學習的基本存儲元素。人腦擁有數十億個神經元網絡,通過數萬億個突觸相互連接。基於脈衝的時間處理機制使得稀疏而有效的信息在人腦中傳遞。研究還表明,靈長類動物的視覺系統由分層級的關聯區域組成,這些關聯區域逐漸將視覺對象的映像轉化為一種具有魯棒性的格式,從而促進了感知能力。
  • 史丹福大學實現高性能低功耗人工突觸,可用於神經網絡計算
    現在,史丹福大學和桑迪亞國家實驗室的研究人員取得了重要進展,該研究可以幫助計算機模擬某塊大腦高效設計,亦即人工突觸。Alberto Salleo,材料科學與工程學副教授,研究生 Scott Keene 在確知用於神經網絡計算的人工突觸的電化學性能。他們是創造這一新設備團隊的成員。
  • 神經元的神經突觸
    當動作電位到達軸突末端時,它會刺激儲存在稱為囊泡的神經遞質分子的釋放。它們在脂質和蛋白質膜組成方面有特殊的特徵,可以被認為是細胞器。它們需要特定的轉運體向突觸前膜移動。一旦到達突觸前膜,它們就向突觸間隙釋放神經遞質分子。然後囊泡經歷胞吐作用,被重吸收並結合到囊泡循環中。
  • BP神經網絡
    BP神經網絡原理 人工神經網絡是一種數學模型,它具有人類神經網絡的一些特質,並且有自學習的能力,一般由MATLAB軟體來實現。與傳統統計方法不同之處是神經網絡是通過訓練實驗來找到解決問題的路徑。
  • 【新智元專訪】神經元本身也能編程,神經網絡學習能力遠超預期
    日前,瑞典隆德大學研究人員發表在 PNAS 的一項研究發現,神經元本身也具有編程或者說學習的能力,單個神經元中存儲信息的容量遠超預期。論文作者在接受新智元採訪時表示,這一發現或將為設計全新的人工神經網絡帶來啟發。
  • 人工突觸模擬憶阻器研究取得進展,有助深度學習神經網絡發展
    同時,上述缺陷也阻礙了深度學習神經網絡的進一步發展。而借鑑人腦神經突觸結構,構築結構簡單、低功耗、高低阻態連續可調的非易失性阻態憶阻器是實現類腦神經形態計算中至關重要的一步。目前,模仿生物神經系統中突觸間隙神經遞質釋放過程與電信號傳遞處理調控構建的多柵極人造神經元電晶體常表現出高低電阻態的突變。
  • Imec晶片利用尖峰遞歸神經網絡處理雷達信號 可用於汽車防撞系統
    蓋世汽車訊 據外媒報導,歐洲研究與創新中心Imec聲稱推出全球首款利用尖峰遞歸神經網絡(SNN)處理雷達信號的晶片。Imec晶片模仿生物神經元識別時間模式的方式,比傳統方案相比,功耗減少了100倍,同時延遲減少了10倍,幾乎可以瞬間做出決定。
  • 能夠學習的人工神經突觸 人造大腦已在地平線?
    以 Vincent Garcia 為首的法國科研人員,近日在該領域取得了突破:在晶片上直接創製出能夠學習的人工神經突觸,以及能夠解釋其學習能力的物理模型。該研究為創造人工神經突觸網絡,因而開發出更快速高效的人工智慧系統打開了一扇大門。
  • 神經突觸的複雜化驅動大腦進化
    英國科學家日前公布的研究結果表明,物種的聰明程度並非僅由腦容量大小決定,大腦神經突觸分子結構的不斷複雜化,可能是導致人等物種進化出聰明大腦的主要驅動力。
  • 圖解全光網絡的核心技術:光交換技術
    現代通信網中,密集波分復用(DWDM)光傳送網絡充分利用光纖的巨大帶寬資源來滿足各種通信業務爆炸式增長的需要。然而,高質量的數據業務的傳輸與交換仍然採用如IP over ATM 、IP over SDH等多層網絡結構方案,不僅開銷巨大,而且必須在中轉節點經過光電轉換,無法充分利用底層DWDM帶寬資源和強大的波長路由能力。
  • 新型生物電路模仿突觸與神經元,向類腦計算邁出重要一步
    背景如今,數字計算機,特別是超級計算機,已經具備令人驚訝的計算能力。可是,所有的數字計算機都具有一個鮮明的特徵:存儲器與處理器分離。信息需要在硬碟與中央處理器之間來回移動。這個地方就是神經突觸,或者說神經元之間的連接。人腦中有數以百萬億計的神經元。
  • 復旦大學新成果:用於有機環境中,模式識別的人工神經突觸!
    在過去的幾年裡,研究人員使用單一的物理設備模擬了多功能突觸功能。這些設備很快就能在機器上實現高級學習和記憶功能,模擬人腦的功能。新研究提出了用於模式識別的靈活、透明甚至生物兼容的電子設備。這可能為新一代可穿戴和可植入突觸系統鋪平道路,然而,這些「隱形」的電子突觸也有一個明顯的缺點:它們很容易溶解在水中或有機溶液中,這對於可穿戴應用來說遠非理想。
  • 能夠學習的人工神經突觸人造大腦已在地平線?
    雷鋒網消息,法國研究人員日前成功開發出能自主學習的人工神經突觸,即 artificial synapse。他們還創建了物理模型,這對於開發更複雜的電路十分關鍵。研究成果在昨日發表於《Nature Communications》。