大腦系統公司(Cerebras Systems)表示,CS-1能夠以任何基於CPU或gpu的系統都無法達到的速度解決大型模擬問題。
大腦系統公司(Cerebras Systems)基於有史以來最大的晶片製造了一款專門的人工智慧計算機,該公司正在突破其最初作為神經網絡訓練中心的角色,將其人才轉向更為傳統的科學計算。在一個有5億個變量的模擬中,CS-1打敗了世界上第69位最強大的超級計算機。
它還解決了燃煤電廠的燃燒問題——比它模擬的真實火焰更快。更重要的是,cerbras及其在美國國家能源技術中心的合作夥伴聲稱CS-1比當今任何基於CPU或gpu的超級計算機都要快。
這項研究在本周舉行的超級計算大會SC20上公布,它表明,Cerebras的人工智慧架構「不是只會一種技巧的小馬,」Cerebras執行長安德魯·費爾德曼(Andrew Feldman)表示。通過模擬「流體在空間中隨時間的運動」,天氣預報、飛機機翼的設計、核電站溫度的預測以及許多其他複雜的問題都得到了解決。該模擬將世界劃分為一組立方體,為這些立方體中的流體運動建模,並確定立方體之間的交互作用。可能有100萬個或更多這樣的立方體,它可以用50萬個變量來描述發生了什麼。
根據Feldman(安德魯·費爾德曼)的說法,解決這個問題需要一個擁有大量處理器核心的計算機系統,非常接近核心的大量內存,連接核心和內存的大量帶寬,以及連接核心的大量帶寬。很方便,這也是神經網絡訓練計算機所需要的。CS-1包含一塊單晶矽,400,000核,18g內存,9pb內存帶寬,以及每秒100pb核對核帶寬。
NETL的科學家們使用Cerebras CS-1和焦耳超級計算機模擬了發電廠的燃燒。焦耳超級計算機擁有84000個CPU核,消耗450千瓦。相比之下,大腦(CS-1)只需要20千瓦。焦耳在2.1毫秒內完成了計算。CS-1的速度是它的200多倍,用時6微秒。
費爾德曼認為,這種速度有兩個含義。一個是,在這個問題上,目前沒有任何cpu或甚至gpu的組合能夠擊敗CS-1。他通過指出模擬的本質來支持這一觀點——它不能很好地擴展。正如您可能有太多的廚師在廚房裡,向一個問題扔太多的核實際上會減慢計算速度。焦耳的速度在使用84000個核中的16384個核時達到峰值。
這種限制來自於內核之間以及內核與內存之間的連接。想像將體積模擬為370 x 370 x 370的立方體堆棧(包含370層的136,900個垂直堆棧)。大腦將這個問題映射到晶片規模的晶片上,將垂直堆棧數組分配給相應的處理器核心數組。由於這種安排,一個立方體對另一個立方體的影響通過在相鄰核之間傳輸數據來實現,這是最快的速度。當堆棧的每一層都被計算時,表示其他層的數據駐留在核心的內存中,可以快速地訪問它。
(大腦在訓練神經網絡時也利用了類似的幾何映射。(見側欄「大腦的軟體方面」,2020年1月)而且,由於模擬過程的完成速度比真實世界的燃燒過程要快,CS-1現在有了一項新的任務——在複雜機器的控制系統中發揮作用。
據費爾德曼報導,SC-1也在其最初建造的目的上有所突破。製藥商葛蘭素史克(GlaxoSmithKline)是已知的客戶,SC-1正在阿貢國家實驗室(Argonne National Laboratory)和匹茲堡超級計算中心勞倫斯利弗莫爾國家實驗室(Lawrence Livermore National Lab)進行人工智慧研究。他說,有幾個他無法說出名字的客戶來自軍方、情報部門和重工業。
下一代SC-1正在研製中。第一代使用的是臺積電的16納米處理器,但Cerebras已經有了7納米的版本,內存是原來的兩倍多,達到40gb, AI處理器核數達到85萬個。