勞倫斯·利弗莫爾國家實驗室(LLNL)和AI公司Cerebras Systems今天宣布,將1.2萬億塞雷布拉斯的晶圓級引擎(WSE)晶片集成到國家核安全局(NNSA)的23 petaflop拉森超級計算機中。拉森的仿真能力與Cerebras的機器學習計算系統,以及容納該晶片的CS-1加速器系統的結合,使LLNL「成為第一家將AI平臺與大型超級計算機集成在一起並創建全新類型的架構"。gC2ednc
gC2ednc
此次集成意味著Lassen系統(如圖所示)成為全球第一臺將人工智慧技術與高性能計算建模和仿真功能相結合的超級計算機。gC2ednc
勞倫斯利弗莫爾國家實驗室表示,該系統旨在實現所謂的「認知模擬」,讓研究人員可以研究用於預測建模的創新方法。該計劃有幾個目標,包括協助在美國國家點火設施進行融合內爆實驗、材料科學、以及通過「醫學治療研發計劃」快速開發用於治療新冠病毒和癌症的新藥。gC2ednc
Lassen超級計算機是目前全球排名第14的超級計算機,每秒浮點運算性能超過23 petaflops。勞倫斯利弗莫爾國家實驗室表示,該系統已經集成了Cerebras Systems的CS-1加速器硬體系統,後者基於Wafer Scale Engine專用AI晶片,尺寸是標準數據中心GPU的57倍,封裝了1.2萬億多個電晶體。gC2ednc
gC2ednc
去年Cerebras宣布,配置了40萬個處理核心的WSE晶片已經針對AI工作負載進行了優化,配備18 GB高速板載內存。gC2ednc
該項目得到了美國國家核安全局(NNSA)的高級仿真和計算計劃的資助,在該計劃下,這款增強的系統將在未來十年內用於加速美國能源部和美國國家安全任務的一系列應用。gC2ednc
勞倫斯利弗莫爾國家實驗室首席技術官Bronis R. de Supinski表示,該計劃是在對計算提出了更高需求的情況下孕育而生的。由於計算需求已經遠遠超過了摩爾定律(根據摩爾定律,晶片上的電晶體密度每兩年翻一番),因此已經無法通過常規手段提升計算性能了。gC2ednc
他說:「認知仿真是一種可以推動容量呈現指數級持續提升的方法,而像Cerebras CS-1這樣系統級的異構方法,是實現這一提升的一個重要組成部分。」gC2ednc
研究人員通過這種方法探索一種所謂「異構性」的新概念,在這個概念下,超級計算機的不同元素負責某個特定工作負載的不同方面。根據De Supinski的說法,這樣就可以運行數據生成和糾錯之類的操作,從而為各種科學問題提供了一種更高效、更具成本效益的解決方案。gC2ednc
勞倫斯利弗莫爾國家實驗室計算機科學家Ian Karlin表示:「異構的系統讓我們能夠確定,我們所使用的應用,其不同組成部分是可以同時執行各種任務的。對於我們的認知模擬工作負載來說,我們將在Cerebras硬體上運行機器學習負載,在GPU上運行高性能計算模擬負載,從而縮短了生成解決方案的時間。」gC2ednc
這意味著,研究人員可以跳過工作流程中很多不必要的處理,加速深度學習神經網絡,最大程度上減少了將某些問題「切片和切成小塊」的需要。gC2ednc
勞倫斯利弗莫爾國家實驗室計算機科學家Brian Van Essen表示:「我們可以在更短的計算時間內進行科學探索,也可以在科學不確定性更高的領域進行更深入的研究,在有了更多計算時間的同時,得到更好的答案。」gC2ednc
Van Essen正在領導一個研究小組,該小組選擇在CS-1系統上運行兩種AI模型,初步工作重點是從多達50億張模擬雷射內爆圖像中進行學習,優化用於國家點火裝置實驗的聚變目標,最終實現高能量輸出,以及更強大的核武器儲備管理應用聚變內爆。gC2ednc
與此同時,勞倫斯利弗莫爾國家實驗室和Cerebras將合作建立一個人工智慧卓越中心(Artificial Intelligence Center of Excellence),旨在確定認知模擬的最佳參數,這項研究可能會促使勞倫斯利弗莫爾國家實驗室向Lassen及其他超級計算機平臺中配置更多的CS-1。gC2ednc
作為該中心的負責人,Van Essen表示:「我是一名受過培訓的計算機架構師,因此有機會構建這樣的系統,並成為大規模部署這些系統的第一人,令人非常興奮。將其集成並耦合到像Lassen這樣的系統中,給我們提供了一個獨有的機會,讓我們能夠率先去探索這種框架。」gC2ednc
去年EDN電子技術設計姐妹媒體《電子工程專輯》也報導指出,開發出 WSE 系列 AI 晶片的 Cerebras Systems 是一家2016年才成立的新創 AI 晶片公司。公司資歷不長,但是卻經歷了三輪融資,分別是2016年5月份的2700萬美元的A輪融資,2017年1月2500萬美元的B輪融資,隨後不到一年時間裡,Cerebras Systems再次融資6000萬美元,彼時估值達到8.6億美元。gC2ednc
因為人工智慧產業也恰巧在那個時候開始盛行,Cerebras Systems也因此被許多人看好。而這家公司發展產品的邏輯不同於其他AI晶片公司,就是奉行一個路子:「簡單,粗暴」。為了滿足 AI 計算的高性能需求,放棄其他廠商晶片越小越好的思維,以儘可能生產大面積晶片為主。由於面積越大的晶片,其中能整合越多的核心與電晶體,其相對計算效能也越強,但同時也提升了生產成本。gC2ednc
2019 年 11 月份,該公司正式推出了 WSE 系列晶片的第一代,採用臺積電 16 納米工藝,並以整個 12 吋晶圓來打造一個龐大的 AI 晶片。所以,WSE 系列晶片的第一代就整合了40 萬個 AI 核心,1.2 萬億個電晶體,面積也高達 4.6 萬平方毫米。gC2ednc
當時其性能之強大,讓其他以大著稱的晶片甘拜下風。gC2ednc
比如英偉達的GV100晶片號稱最強GPU,211億電晶體,核心面積815平方毫米,而WSE晶片電晶體數量是GV100的60倍,面積則是它的56倍多。WSE與當時的CPU晶片相比同樣震撼,AMD 64核EPYC二代處理器才320億電晶體,封裝總面積也不過4410平方毫米,光是核心面積WSE就是EPYC二代處理器的10倍有餘。gC2ednc
從性能上來看,WES晶片帶寬超過100Pb/s,一般的計算晶片以Tb/s級別的單位都難以跟起比較。gC2ednc
在關於WSE介紹的白皮書中,有這麼一句話——「通過加速人工智慧計算,WSE清除了阻礙人工智慧進步的最大路障——時間。將訓練時間從幾個月縮減為幾分鐘,從幾周減少到幾秒。讓深度學習實踐者更快的驗證自己的假設,從而不用去擔心一些體系機構導致無法測試或者太大風險。WSE降低了好奇心的成本,加速了人工智慧新思想和新技術的到來。」gC2ednc
雖然 堪稱晶片工藝史上的一大「奇蹟」的WSE 晶片第一代之後被順利生產出來,但是其造價不斐,可以想見的是會採購的單位或企業更是少之又少。最後,還是美國勞倫斯利福摩爾國家實驗室(LLNL)把WSE集成到美國國家核安全管理局的拉森超級計算機中,再由美國政府旗下的美國國家科學基金會(NSF)出手相助,購買了兩套以 WSE晶片為主的超級計算機CS-1,總價約 500 萬美元。gC2ednc
gC2ednc
第一代的WSE(有一套電力傳輸和冷卻系統)gC2ednc
從整機價格推算,每片 WSE晶片的價格約為 200 萬美元(約合人民幣1384萬元),Cerebras創始人兼CEO 安德魯 · 費爾德曼(Andrew Feldman)也曾透露稱這種巨無霸晶片及系統的售價在幾百萬美元級別。gC2ednc
Cerebras Systems公司透露,這款WSE晶片,他們已經接到了十幾片的訂單。gC2ednc
gC2ednc
Cerebras Systems的聯合創始人兼執行長安德魯 · 費爾德曼(Andrew Feldman)gC2ednc
WSE 系列晶片第一代採用的是臺積電 16 納米工藝,現在新一代產品也問世。在日前舉辦的年度半導體盛會Hot Chips 2020 大會上,WSE2 AI 晶片正式發布。該公司表示,已經在實驗室中運行了新款晶片。gC2ednc
雖然具體細節還沒公布,但受到晶圓尺寸的限制,會與第一代採用相同的晶片面積。但是因為採用了新一代的臺積電 7 納米工藝,AI 核心數翻倍成長到了 85 萬個,而電晶體數量更是一口氣增加至 2.6 萬億個,相比之前的規格增加了一倍有餘,相信價格也會隨之提高。gC2ednc
gC2ednc
此外,預計該公司還將增加晶片內置的內存容量並加強晶片互連速率,以提高晶片內數據傳輸的帶寬。去年的第一代晶片具有9PB/s的內存帶寬,並且這樣一個晶片的TDP為15KW。gC2ednc
目前 7 納米工藝的最大晶片是英偉達(NVIDIA) 的 GA100 GPU,晶片面積達到 826 平方毫米,擁有 540 億個電晶體。比較之下,Cerebras Systems 新發布的 WSE2 AI 晶片無論從電晶體數,還是晶片面積都是龐然大物,預計售價也會非常高昂。gC2ednc
gC2ednc
WSE晶片尺寸達到了46225平方毫米,比最大的GPU核心要大56倍gC2ednc
晶圓級晶片除了像Cerebras這樣製作計算晶片的應用外,也有應用於存儲方面的研究。鎧俠(前東芝存儲)正在進行的新研究就是——通過跳過傳統快閃記憶體和SSD製造方法過程中所有切割,組裝,封裝等操作,直接生產晶圓級的SSD ,這樣可以極大地降低製造成本和交貨時間,並且得到高性能的大量數據存儲解決方案。gC2ednc
不過雖然鎧俠提出了「晶圓級固態硬碟」的概念,但是還處在早期開發階段,距離實際上市和應用還很早。目前受矚目的晶圓級晶片還是Cerebras WSE,而關於第二代Cerebras WSE的更多信息,還是得到該公司宣布最終產品時才能知道。gC2ednc
gC2ednc
本文綜合自Technews、超能網、電子工程專輯gC2ednc
責編:ChalleygC2ednc