隨著人工智慧的爆炸式增長,其對算力的要求也越來越高。
Nature最新一期,就連登了兩篇光學加速AI計算的論文,裡面介紹了兩個AI計算加速器:分別是11TOPS的光子卷積加速器和張量核光子加速器,兩者都可以達到每秒數萬億次的計算速度。
光子處理器利用光的特性,可以加速人工智慧計算處理過程,同時,還會引領光子計算的復興。
為何光子計算能加速AI?
由於光譜覆蓋的波長範圍很廣,不同波長的光子可以進行多路傳輸或者平行傳輸,光信號之間而相互幹擾,還能夠進行調整,改變傳輸方式,攜帶更多的信息。
所以在過去幾十年中,光纖通信取得了巨大成功。
但是,光子計算跟SOTA水平的電子計算處理器相比,還是有著很多不足,比如缺乏合適的並行計算機制、人工神經元的高速非線性響應的材料和可擴展的光子設備,這些都難以讓光子計算快速準確地集成到計算硬體中。
幸運的是,光梳的發展為集成光子處理器帶來了新的機遇。所謂的光梳是一組發射光譜的光源,它們由數千或數百萬條在頻率上均勻緊密排列的尖銳光譜線組成。
光梳在光譜學、光時鐘計量學和遠程通信等領域取得了巨大成功,因此獲得了2005年諾貝爾物理學獎。
光梳還能集成到計算機晶片中,用作光計算的節能能源,給光子計算的增速帶來了曙光。
在光梳的基礎上,他們創造出了這兩個AI加速器。
11TOPS的光子卷積加速器
11TOPS的光子卷積加速器是研究人員利用了光梳製造的一種多功能的光學矢量加速器。
研究者採用了巧妙的方法進行卷積運算,他們先利用色散為波長多路復用光信號產生不同的時間延遲,然後將這些信號沿著與光波波長相關的維度進行組合。
通過充分利用光子波長的廣泛範圍,研究者實現了不同卷積運算的並行計算,使用單個處理核心的光計算速度,只受數據吞吐量的限制,速度能達到10萬億次每秒。
運用這個加速器,每秒可以對25萬像素進行卷積運算,足以進行人臉識別。
他們還使用這個加速器形成一個有10個輸出神經元的光學卷積神經網絡,成功地識別出不同的數字圖像,準確率高達88% 。
這種方法還可以訓練更複雜的模型,比如無人車、視頻實時識別等。
張量核光子加速器
另外一個研究團隊,展示了一個張量核光子加速器,每秒能夠進行數萬億次的MAC運算。
它是一個特殊計算集成的光子硬體加速器,利用相變材料存儲器陣列和基於光子晶片的光梳實現了光子存儲的並行計算,還通過多種波長和相變材料的集成單元陣列進行模擬矩陣矢量乘法,使輸入數據完全並行化。
高度並行化的計算框架,可以同時高效處理整個圖像。將來,這個方法可以廣泛用於商業製造程序和機器學習。
由於卷積過程涉及無源傳輸,光子處理核心的計算可以低功耗下進行,這對於像雲計算這種能源密集型應用程式來說意義重大。
研究結果表明,集成式並行光子計算在自動駕駛、實時視頻處理和下一代雲計算服務等數據量大的人工智慧應用中,可以發揮重要作用。
問題與挑戰
雖然上述兩者在光子計算的AI領域,取得了突破,證明了光子計算在AI領域的巨大潛能。
但是全光子計算的規模仍舊比較小。這因為計算效率受到光學元件的限制,電信號和光信號之間還要進行不斷轉換,所以還需要材料學、光子學、電子學不同領域的科學家協同研究工作。
還有一個發展方向就是開發非線性集成的光學計算結構,即通過集成電子電路和成百上千個光子處理器,開發出光子處理器和電子處理器的混合光電框架。
這個框架可能會給AI硬體領域帶來歷史性的變革。