導讀
據美國喬治·華盛頓大學官網近日報導,該校和加州大學洛杉磯分校的研究人員與深度科技創業公司 Optelligence LLC 共同開發出一種光學卷積神經網絡加速器,每秒能夠處理拍字節(1拍字節=2^50位元組)級的大量信息。
背景
目前計算能力的供應遠遠無法滿足全球對機器學習硬體的需求。最先進的電子硬體,如圖形處理單元和張量處理單元加速器,有助於緩解這一問題,但受到了串行數據處理的內在挑戰,因為串行數據處理需要迭代數據處理,還會遇到布線和電路限制所造成的延遲。電子硬體的光學替代品可以通過非迭代的方式簡化信息處理,幫助加快機器學習進程。然而,基於光子的機器學習通常受制於光子集成電路上可放置的元件數量,限制了互連性,而自由空間的空間光調製器則受制於較慢的編程速度。
創新
近日,美國喬治·華盛頓大學和加州大學洛杉磯分校(UCLA)的研究人員與深度科技創業公司 Optelligence LLC 共同開發出一種光學卷積神經網絡加速器,每秒能夠處理拍字節(1拍字節=2^50位元組)級的大量信息。這項創新利用了光的巨量並行性,預示著用於機器學習的光學信號處理新時代的到來,應用領域眾多,包括無人駕駛汽車、5G網絡、數據中心、生物醫學診斷、數據安全等。
大規模並行的唯幅度傅立葉神經網絡(圖片來源:喬治·華盛頓大學)
技術
為了在這種光學機器學習系統中實現突破,研究人員用基於數字鏡的技術取代了空間光調製器,從而開發出速度快百倍的系統。該處理器的非迭代時序,再加上快速的可編程性以及大規模並行化處理,使得這個光學機器學習系統的性能甚至超越頂尖的圖形處理單元一個數量級,而且在最初的原型機之外還有進一步優化的空間。
不同於目前電子機器學習硬體中按順序處理信息的範式,這款處理器採用了傅立葉光學,即頻率濾波的概念,可以利用數字鏡像技術將神經網絡所需的卷積執行為更簡單的逐元(element-wise)乘法。
價值
喬治·華盛頓大學電氣與計算機工程系副教授 Volker Sorger 表示:「這種大規模並行的、唯輻度的傅立葉光學處理器預示著信息處理和機器學習的新時代的到來。我們表明,訓練該神經網絡可以解決相位信息缺乏的問題。」
加州大學洛杉磯分校計算機工程系副主任 Puneet Gupta 教授表示:「光學允許在單個時間步長內處理大規模矩陣,從而實現了通過光學方式執行卷積操作的新尺度向量。正如在這裡所演示的,這對於機器學習應用來說有著巨大的潛力。」
Optelligence LLC 公司聯合創始人 Hamed Dalir 表示:「該原型展示了光加速器的商業化途徑,它已經為網絡邊緣處理、數據中心和高性能計算系統等許多應用做好了準備。」
關鍵詞
機器學習、神經網絡、光學
參考資料
【1】Mario Miscuglio, Zibo Hu, Shurui Li, Jonathan K. George, Roberto Capanna, Hamed Dalir, Philippe M. Bardet, Puneet Gupta, Volker J. Sorger. Massively parallel amplitude-only Fourier neural network. Optica, 2020; 7 (12): 1812 DOI: 10.1364/OPTICA.408659