原標題:光子處理器:為 AI 加速,「變革」AI硬體
我們身處於一個數據、信息量爆炸性增長的時代,一個由 AI 引領的、更加智能的時代。
但是,持續增加的數據量在為人工智慧(AI)提供源源不斷的「動力」的同時,也對用於 AI 的電子計算硬體提出了更多的挑戰,無論是在計算速度,還是在功耗方面,都已經成為嚴重製約 AI 發展的主要瓶頸之一。
如今,隨著用於自動駕駛汽車和語音識別等機器學習方法的出現,這種數據增加的上升趨勢仍將繼續下去。所有這些,都給當前的計算機處理器在滿足人們需求方面帶來了沉重的負擔。
好在,一個由多國科學家組成的團隊已經開始著手解決這個問題。最新研究進展以「Parallel convolutional processing using an integrated photonic tensor core」為題,於 1 月 6 日發表在頂級科學期刊《自然》(Nature)上。
據論文描述,研究人員開發了一種新的方法和架構,通過使用基於光的處理器或光子處理器,將處理和數據存儲結合到單個晶片上。研究結果首次證明,這些設備可以快速並行處理信息,而這種能力是現有電子晶片無法做到的。
研究人員表示,通過這種利用光的獨特屬性來加速 AI 處理的方式,可能會加速光學計算領域的變革。
新型硬體系統的發展
隨著 AI 的興起,傳統的電子計算方法逐漸達到了其性能極限,並且滯後於可處理數據的快速增長。在各種類型的 AI 系統中,人工神經網絡由於優異的性能而被廣泛應用於 AI 任務,這些網絡使用多層相互連接的人工神經網絡進行複雜的數學運算。
為了加速人工神經網絡的處理,人們已經做出了各種努力來設計和實現特定的電子計算系統。特別值得一提的是,人們在專用集成電路、大腦靈感計算和內存計算等定製晶片的應用上,已經取得了相當大的成功,這些晶片通過一系列稱為憶阻器的內存設備直接進行處理。
在電子計算中,電子是信息的載體,但一直以來光子都被認為是一種更優的替代選擇。因為光譜覆蓋的波長範圍很廣,不同波長的光子可以同時多路復用(並行傳輸)和調製(通過改變它們可以攜帶信息),而不會使光信號相互幹擾。
這種以光速傳播信息的方式能達到目前最小的時間延遲。此外,無源傳輸有助於實現超低功耗,而相位調製可以輕鬆調製並檢測出頻率高於 40 千兆赫的光。
在過去的幾十年裡,光纖通信取得了巨大的成功。然而,使用光子進行計算仍然具有一定的挑戰性,特別是在規模和性能水平上,其與最先進的電子處理器相比更具挑戰性。這一困難來自於缺乏合適的並行計算機制、使用材料來允許人工神經元的高速非線性響應以及可擴展的光子器件來集成到計算硬體中。
幸運的是,過去幾年來,光學頻率梳(Optical Frequency Combs)的發展為集成光子處理器帶來了新的機會。光學頻率梳是一組光源,其發射光譜由數千或數百萬條頻率均勻且間隔緊密的清晰譜線組成。這些器件在光譜學、光學時鐘計量和電信等領域取得了巨大的成功,其可以集成到計算機晶片中,並用作光學計算的高效能源,非常適合採用波分復用技術(WDM)進行數據並行處理。
光子處理器:為 AI 加速
在此次工作中,研究人員成功研製了一個集成光子處理器,該處理器可以對跨越二維空間的光信號進行卷積處理。該設備在基於相變材料(一種可以在非晶相和晶相之間切換的材料)的「內存」計算架構中使用光學頻率梳。
通過波長復用,該處理器可以對輸入數據進行充分的並行化處理,並利用相變材料的集成單元陣列進行類似的矩陣矢量乘法運算。
該團隊也針對矩陣—向量乘法開發了一個硬體加速器。由於不同波長的光不會相互幹擾,研究人員可以使用多個波長的光進行並行計算。
為了做到這一點,他們使用了洛桑聯邦理工學院(EPFL)開發的另一項創新技術,一種基於晶片的「頻率梳」,並以此作為光源。頻率梳可以提供各種不同的光波,這些光波在同一個光子晶片中相互獨立地處理。
該研究的負責人之一、EPFL 的 Tobias Kippenberg 教授說:「我們的研究首次將頻率梳應用於人工神經網絡領域。」 Kippenberg教授在頻率梳發展方面做出開創性的研究工作。
同時,該研究的負責人之一、明斯特大學(WWU)的 Wolfram Pernice 教授也表示:「在機器學習領域,用於加速任務的光子處理器使複雜的數學任務能夠以很高的速度和處理量處理,這比依賴電子數據傳輸的傳統晶片快得多。」
在設計和製造完光子晶片後,研究人員在一個可識別手寫數字的神經網絡上對其進行了測試。這些網絡受到生物學的啟發,是機器學習領域的一個概念,主要用於圖像或音頻數據的處理。
論文的第一作者之一 Johannes Feldmann 表示:「輸入數據和一個或多個過濾器之間的卷積運算非常適合我們的矩陣體系結構。利用光進行信號傳輸使處理器能夠通過波分多路復用執行並行數據處理,這保證了更高的計算密度,並且僅需一個時間步長就可以進行許多矩陣乘法。與通常在較低頻率工作的傳統電子設備相比,光調製速度可以達到 50-100GHz 範圍。」
牛津大學的 Nathan Youngblood 認為,「利用波分多路復用可以實現更高的數據速率和計算密度,也就是處理器單位面積上的操作,這是以前無法實現的。」
這種高度並行化的框架,有可能在單個步驟中高速處理整個圖像。在不久的將來,該系統可以通過使用商業製造程序和輔助現場機器學習來進行大規模擴展。
新型硬體的巨大應用潛力
由於卷積過程涉及到無源傳輸,所以理論上光子處理核心的計算能以光速和低功耗來進行。這種能力對於能源密集型應用程式非常有價值,比如應用在雲計算中。
鑑於傳統電子計算方法面臨的挑戰,集成光子學的出現是令人興奮的。它作為一個潛在的「接班人」,為未來的計算架構實現前所未有的性能。
然而,建造一個實用的光學計算機仍將需要廣泛的跨學科努力和材料科學、光子學、電子學等領域的研究人員之間的合作。
儘管報導的光子處理器具有較高的單位面積計算能力和潛在的可擴展性,但全光學計算規模仍然很小。此外,由於存在固有的吸收光的計算元件,以及光電信號經常需要轉換,能源效率會受到一些限制。
未來另一個研究方向是,發展先進的非線性集成光子計算架構,而不是單一或二維的線性卷積。
通過將電子電路和數千或數百萬個光子處理器集成到一個合適的架構中,一種同時利用光子和電子處理器的混合光電框架,或許在不久的將來可以徹底改變 AI 硬體。未來,這種硬體將在通信、數據中心營運和雲計算等領域具有十分重要的應用。
(文章來源:OFweek)
(責任編輯:DF052)