採用全球最大AI晶片,Lassen超算系統集成Cerebras 1.2萬億電晶體

2020-12-08 EDN電子設計技術

勞倫斯·利弗莫爾國家實驗室(LLNL)和AI公司Cerebras Systems今天宣布,將1.2萬億塞雷布拉斯的晶圓級引擎(WSE)晶片集成到國家核安全局(NNSA)的23 petaflop拉森超級計算機中。拉森的仿真能力與Cerebras的機器學習計算系統,以及容納該晶片的CS-1加速器系統的結合,使LLNL「成為第一家將AI平臺與大型超級計算機集成在一起並創建全新類型的架構"。gC2ednc

超算Lassen

gC2ednc

此次集成意味著Lassen系統(如圖所示)成為全球第一臺將人工智慧技術與高性能計算建模和仿真功能相結合的超級計算機。gC2ednc

勞倫斯利弗莫爾國家實驗室表示,該系統旨在實現所謂的「認知模擬」,讓研究人員可以研究用於預測建模的創新方法。該計劃有幾個目標,包括協助在美國國家點火設施進行融合內爆實驗、材料科學、以及通過「醫學治療研發計劃」快速開發用於治療新冠病毒和癌症的新藥。gC2ednc

Lassen超級計算機是目前全球排名第14的超級計算機,每秒浮點運算性能超過23 petaflops。勞倫斯利弗莫爾國家實驗室表示,該系統已經集成了Cerebras Systems的CS-1加速器硬體系統,後者基於Wafer Scale Engine專用AI晶片,尺寸是標準數據中心GPU的57倍,封裝了1.2萬億多個電晶體。gC2ednc

gC2ednc

去年Cerebras宣布,配置了40萬個處理核心的WSE晶片已經針對AI工作負載進行了優化,配備18 GB高速板載內存。gC2ednc

該項目得到了美國國家核安全局(NNSA)的高級仿真和計算計劃的資助,在該計劃下,這款增強的系統將在未來十年內用於加速美國能源部和美國國家安全任務的一系列應用。gC2ednc

勞倫斯利弗莫爾國家實驗室首席技術官Bronis R. de Supinski表示,該計劃是在對計算提出了更高需求的情況下孕育而生的。由於計算需求已經遠遠超過了摩爾定律(根據摩爾定律,晶片上的電晶體密度每兩年翻一番),因此已經無法通過常規手段提升計算性能了。gC2ednc

他說:「認知仿真是一種可以推動容量呈現指數級持續提升的方法,而像Cerebras CS-1這樣系統級的異構方法,是實現這一提升的一個重要組成部分。」gC2ednc

研究人員通過這種方法探索一種所謂「異構性」的新概念,在這個概念下,超級計算機的不同元素負責某個特定工作負載的不同方面。根據De Supinski的說法,這樣就可以運行數據生成和糾錯之類的操作,從而為各種科學問題提供了一種更高效、更具成本效益的解決方案。gC2ednc

勞倫斯利弗莫爾國家實驗室計算機科學家Ian Karlin表示:「異構的系統讓我們能夠確定,我們所使用的應用,其不同組成部分是可以同時執行各種任務的。對於我們的認知模擬工作負載來說,我們將在Cerebras硬體上運行機器學習負載,在GPU上運行高性能計算模擬負載,從而縮短了生成解決方案的時間。」gC2ednc

這意味著,研究人員可以跳過工作流程中很多不必要的處理,加速深度學習神經網絡,最大程度上減少了將某些問題「切片和切成小塊」的需要。gC2ednc

勞倫斯利弗莫爾國家實驗室計算機科學家Brian Van Essen表示:「我們可以在更短的計算時間內進行科學探索,也可以在科學不確定性更高的領域進行更深入的研究,在有了更多計算時間的同時,得到更好的答案。」gC2ednc

Van Essen正在領導一個研究小組,該小組選擇在CS-1系統上運行兩種AI模型,初步工作重點是從多達50億張模擬雷射內爆圖像中進行學習,優化用於國家點火裝置實驗的聚變目標,最終實現高能量輸出,以及更強大的核武器儲備管理應用聚變內爆。gC2ednc

與此同時,勞倫斯利弗莫爾國家實驗室和Cerebras將合作建立一個人工智慧卓越中心(Artificial Intelligence Center of Excellence),旨在確定認知模擬的最佳參數,這項研究可能會促使勞倫斯利弗莫爾國家實驗室向Lassen及其他超級計算機平臺中配置更多的CS-1。gC2ednc

作為該中心的負責人,Van Essen表示:「我是一名受過培訓的計算機架構師,因此有機會構建這樣的系統,並成為大規模部署這些系統的第一人,令人非常興奮。將其集成並耦合到像Lassen這樣的系統中,給我們提供了一個獨有的機會,讓我們能夠率先去探索這種框架。」gC2ednc

簡單粗暴的產品邏輯

去年EDN電子技術設計姐妹媒體《電子工程專輯》也報導指出,開發出 WSE 系列 AI 晶片的 Cerebras Systems 是一家2016年才成立的新創 AI 晶片公司。公司資歷不長,但是卻經歷了三輪融資,分別是2016年5月份的2700萬美元的A輪融資,2017年1月2500萬美元的B輪融資,隨後不到一年時間裡,Cerebras Systems再次融資6000萬美元,彼時估值達到8.6億美元。gC2ednc

因為人工智慧產業也恰巧在那個時候開始盛行,Cerebras Systems也因此被許多人看好。而這家公司發展產品的邏輯不同於其他AI晶片公司,就是奉行一個路子:「簡單,粗暴」。為了滿足 AI 計算的高性能需求,放棄其他廠商晶片越小越好的思維,以儘可能生產大面積晶片為主。由於面積越大的晶片,其中能整合越多的核心與電晶體,其相對計算效能也越強,但同時也提升了生產成本。gC2ednc

2019 年 11 月份,該公司正式推出了 WSE 系列晶片的第一代,採用臺積電 16 納米工藝,並以整個 12 吋晶圓來打造一個龐大的 AI 晶片。所以,WSE 系列晶片的第一代就整合了40 萬個 AI 核心,1.2 萬億個電晶體,面積也高達 4.6 萬平方毫米。gC2ednc

當時其性能之強大,讓其他以大著稱的晶片甘拜下風。gC2ednc

比如英偉達的GV100晶片號稱最強GPU,211億電晶體,核心面積815平方毫米,而WSE晶片電晶體數量是GV100的60倍,面積則是它的56倍多。WSE與當時的CPU晶片相比同樣震撼,AMD 64核EPYC二代處理器才320億電晶體,封裝總面積也不過4410平方毫米,光是核心面積WSE就是EPYC二代處理器的10倍有餘。gC2ednc

從性能上來看,WES晶片帶寬超過100Pb/s,一般的計算晶片以Tb/s級別的單位都難以跟起比較。gC2ednc

除了貴,都挺好的

在關於WSE介紹的白皮書中,有這麼一句話——「通過加速人工智慧計算,WSE清除了阻礙人工智慧進步的最大路障——時間。將訓練時間從幾個月縮減為幾分鐘,從幾周減少到幾秒。讓深度學習實踐者更快的驗證自己的假設,從而不用去擔心一些體系機構導致無法測試或者太大風險。WSE降低了好奇心的成本,加速了人工智慧新思想和新技術的到來。」gC2ednc

雖然 堪稱晶片工藝史上的一大「奇蹟」的WSE 晶片第一代之後被順利生產出來,但是其造價不斐,可以想見的是會採購的單位或企業更是少之又少。最後,還是美國勞倫斯利福摩爾國家實驗室(LLNL)把WSE集成到美國國家核安全管理局的拉森超級計算機中,再由美國政府旗下的美國國家科學基金會(NSF)出手相助,購買了兩套以 WSE晶片為主的超級計算機CS-1,總價約 500 萬美元。gC2ednc

gC2ednc

第一代的WSE(有一套電力傳輸和冷卻系統)gC2ednc

從整機價格推算,每片 WSE晶片的價格約為 200 萬美元(約合人民幣1384萬元),Cerebras創始人兼CEO 安德魯 · 費爾德曼(Andrew Feldman)也曾透露稱這種巨無霸晶片及系統的售價在幾百萬美元級別。gC2ednc

Cerebras Systems公司透露,這款WSE晶片,他們已經接到了十幾片的訂單。gC2ednc

gC2ednc

Cerebras Systems的聯合創始人兼執行長安德魯 · 費爾德曼(Andrew Feldman)gC2ednc

二代產品電晶體數翻倍

WSE 系列晶片第一代採用的是臺積電 16 納米工藝,現在新一代產品也問世。在日前舉辦的年度半導體盛會Hot Chips 2020 大會上,WSE2 AI 晶片正式發布。該公司表示,已經在實驗室中運行了新款晶片。gC2ednc

雖然具體細節還沒公布,但受到晶圓尺寸的限制,會與第一代採用相同的晶片面積。但是因為採用了新一代的臺積電 7 納米工藝,AI 核心數翻倍成長到了 85 萬個,而電晶體數量更是一口氣增加至 2.6 萬億個,相比之前的規格增加了一倍有餘,相信價格也會隨之提高。gC2ednc

gC2ednc

此外,預計該公司還將增加晶片內置的內存容量並加強晶片互連速率,以提高晶片內數據傳輸的帶寬。去年的第一代晶片具有9PB/s的內存帶寬,並且這樣一個晶片的TDP為15KW。gC2ednc

目前 7 納米工藝的最大晶片是英偉達(NVIDIA) 的 GA100 GPU,晶片面積達到 826 平方毫米,擁有 540 億個電晶體。比較之下,Cerebras Systems 新發布的 WSE2 AI 晶片無論從電晶體數,還是晶片面積都是龐然大物,預計售價也會非常高昂。gC2ednc

gC2ednc

WSE晶片尺寸達到了46225平方毫米,比最大的GPU核心要大56倍gC2ednc

晶圓級晶片除了像Cerebras這樣製作計算晶片的應用外,也有應用於存儲方面的研究。鎧俠(前東芝存儲)正在進行的新研究就是——通過跳過傳統快閃記憶體和SSD製造方法過程中所有切割,組裝,封裝等操作,直接生產晶圓級的SSD ,這樣可以極大地降低製造成本和交貨時間,並且得到高性能的大量數據存儲解決方案。gC2ednc

不過雖然鎧俠提出了「晶圓級固態硬碟」的概念,但是還處在早期開發階段,距離實際上市和應用還很早。目前受矚目的晶圓級晶片還是Cerebras WSE,而關於第二代Cerebras WSE的更多信息,還是得到該公司宣布最終產品時才能知道。gC2ednc

 gC2ednc

本文綜合自Technews、超能網、電子工程專輯gC2ednc

責編:ChalleygC2ednc

相關焦點

  • 史上最大AI晶片誕生:462平方釐米、40萬核心、1.2萬億電晶體,創下4...
    WSE將邏輯運算、通訊和存儲器集成到單個矽片上,是一種專門用於深度學習的晶片。它創下了4項世界紀錄:電晶體數量最多的運算晶片:總共包含1.2萬億個電晶體。雖然三星曾造出2萬億個電晶體的晶片,卻是用於存儲的eUFS。晶片面積最大:尺寸約20釐米×23釐米,總面積46,225平方毫米。面積和一塊晶圓差不多。
  • 史上最大晶片誕生!1.2萬億電晶體超級巨無霸,專為AI設計
    文章經授權轉自公眾號:新智元(ID:AI_era),來源:venturebeat 編輯:小芹、大明面積42225 平方毫米, 擁有1.2 萬億個電晶體,400000 個核心,片上內存18 Gigabytes,內存帶寬19 PByte/s,fabric帶寬100 Pbit/s。
  • 世界最大晶片的CS-1超級計算機有何特別
    打開APP 世界最大晶片的CS-1超級計算機有何特別 辰辰 發表於 2019-12-08 11:19:43 公司將21.5釐米*21.5釐米的矽板命名為WSE,號稱是「世界上最大」的晶片。WSE開創性採用了晶圓級集成,電晶體數量達到了1.2萬億,裝載了40萬個內核。
  • 世界最大AI處理器升級!核心數翻倍,將採用7nm工藝
    世界最大的AI晶片要升級了!美國AI初創企業CerebrasSystems旗下的明星產品WES(Wafer Scale Engine)晶片即將進入新一代,在日前舉辦的Hotchips 32會議上,CerebrasSystems公布了WES 2代晶片的相關信息。
  • 2020年最值得關注的10家國外AI晶片初創公司
    Cerebras Systems執行長: Andrew FeldmanCerebras Systems表示,其Wafer Scale Engine(WSE)處理器是有史以來最大的晶片,電晶體數量為1.2萬億個,封裝了40萬個計算內核
  • 蘋果A13晶片參數:85億個電晶體 每秒可1萬億次運算
    來源:新浪科技相關新聞:直播2019年蘋果發布會(英文原聲+中文字幕)蘋果2019年秋季新品發布會:談色彩 致創新新浪科技訊 北京時間9月11日凌晨消息,蘋果2019秋季發布會今日凌晨舉行,蘋果發布的三款新一代iPhone搭載了A13仿生晶片
  • 全球首個手機AI晶片華為麒麟970是怎麼來的?有什麼用?
    官方表示,這款處理器每秒可處理 160 億個虛擬神經元,每秒峰值運算能力達 2 萬億虛擬突觸,性能比通用處理器高兩個數量級,功耗降低了一個數量級(僅有原來的 1/10)。同期接受《中國科學報》採訪時,陳天石透露,「寒武紀晶片在一年半左右的時間就會進入市場。」
  • 一文看全:全球99家AI晶片公司全景圖,中國正在崛起
    英偉達的DGX-2系統具有強大的人工智慧性能 英偉達於今年3月推出了第二代DGX系統。為了製造半精度2 petaflops 的DGX-2,英偉達必須首先設計並製造一種新的NVLink 2.0 Switch晶片,名為NVSwitch。
  • 蘋果A系列晶片的三年AI進化
    根據蘋果的介紹,A14 Bionic處理器是蘋果首款採用5nm工藝打造行動裝置晶片,電晶體數量相較於A13 Bionic處理器的7nm晶片增加了近40%,電晶體數量達到了驚人的118億顆。僅憑工藝製程的提升,A14在性能和功耗表現上自然會有一定的提升。官方宣稱,在性能比較上,CPU提升40%,全新GPU構架提升30%。
  • 臺積電研發負責人:電晶體還可縮小至0.1nm
    他甚至在自己的 PPT 中提及,到 2050 年,電晶體的特徵尺寸將到達 0.1nm。 Hotchips 國際大會是每年國際半導體晶片四大國際會議之一,大會主要聚焦於晶片架構、半導體製程以及晶片設計相關的技術。
  • 剛剛,黃仁勳發布全球最大GPU,超算級逆天算力,僅售39.9萬美元
    由16塊各32GB的Tesla V100 GPU組成,提供超算級算力,售價約250萬元。黃仁勳在熟悉的背景音樂中上場,GTC今年已經是第十年了。稱不上激昂,但顯然迫不及待要分享。全球最大GPU,核彈轟炸!!!接著,也是全場最重要揭幕了全球最大GPU——Quadro GV100,這是一個GPU工作站,2個GV100,使用NVLink相連,形成一個完整的工作站,軟體感覺不到切換。
  • 清華高濱:基於憶阻器的存算一體單晶片算力可能高達1POPs | CCF-G...
    計算的範式層面,存算一體也從布爾邏輯計算變成了基於物理定律的模擬計算,架構變成存算一體架構。」但新的計算系統因為憶阻器的穩定性、計算誤差累積等問題,2018年以前完整的存算一體晶片和系統並沒有突破。直到高濱所在的清華大學錢鶴、吳華強團隊通過憶阻器件、電路、架構、算法等層面的創新,設計出全球首款全系集成的憶阻器存算一體晶片,用130nm的工藝製造出計算精度與28nm樹莓派CPU相當的準確度,速度快20倍,能效也比GPU高3個數量級。展望未來,高濱教授希望通存算一體技術,可以使計算的能效有百倍到千倍的提升,使單晶片的算力達到500TOPs甚至1POPs。
  • 百萬美元一片 7nm工藝製造 巨無霸AI晶片二代長啥樣?
    在Hotchips 32大會上,CerebrasSystems公布了WES 2代晶片的相關信息,預示著CerebrasSystems的晶圓級別晶片即將進入下一代產品。據悉,WES 2代晶片核心數翻倍到了85萬個,電晶體數量翻倍到2.6萬億個,將從16nm工藝進入7nm工藝。
  • 高通5G晶片驍龍888是高通迄今為止最強悍的移動平臺
    歷代高通5G晶片產品都成了頂級5G手機的核心配置。如今,全新的高通5G晶片驍龍888正式推出,這款高通5G晶片集業界領先的5G、AI、以及影像等移動技術創新於一身,旨在為5G智慧型手機用戶帶來最極致的移動體驗。   高通5G晶片驍龍888採用目前最先進的5nm製程工藝,電晶體整體體積進一步縮小,產品功耗率大幅降低。
  • 新款 MBP 的 M1 晶片暴打 Intel?—— 這次的晶片有何不同
    CPU 只是 M1 晶片的一個組成部分。所謂 SoC 晶片,指的是系統級晶片(System on Chip),也稱片上晶片,是一個將電腦或其他電子系統集成到單一晶片的集成電路。SoC 集成的主要包括處理器(CPU,GPU 等)、基帶、各種接口控制模塊、各種互聯總線等,其典型代表為手機晶片。
  • 百萬美元一片,7nm工藝製造,這顆巨無霸AI晶片長啥樣?
    據悉,WES 2代晶片核心數翻倍到了85萬個,電晶體數量翻倍到2.6萬億個,將從16nm工藝升級採用7nm工藝製造。 WES一代晶片大小尺寸為21.5釐米*21.5釐米,採用臺積電16nm工藝製造,晶片裡面集成了1.2萬億個電晶體、40萬個AI核心。
  • 蘋果官方詳解 Mac 首款 SoC 晶片 M1 :CPU 速度提升最高 3.5 倍...
    Apple 今日正式發布 M1 晶片,它是 Apple 全新打造的強大晶片,也是第一款專為 Mac 設計的晶片。M1 晶片專門針對 Mac 系統在小尺寸和高能效上的嚴格要求而優化。作為一款 SoC 晶片,M1 將眾多強大技術集於一身,並且採用統一內存架構,為性能和能效帶來巨大的提升。
  • 全球超算Top500排行榜:日本蟬聯冠軍,中國排第幾?-虎嗅網
    日本超算富嶽Fugaku再次搭載ARM晶片奪冠!不過,雖然日本的Fugaku超算鞏固了它在榜單中的第一位置,但與此同時,本次排名榜單也反映了一個平坦的性能增長曲線。富嶽:以富士山的別名命名,搭載ARM晶片且創造新紀錄曾在2011年的時候,日本憑藉K超級計算機拿下了TOP500冠軍,是世界上第一臺每秒執行10萬億次運算的超級計算機,使用的是日本富士通研發的SPARC64處理器。去年,K超算退役。
  • 小小晶片竟然集成了18000個電晶體,怪不得很難製造出來
    晶片為什麼那麼難製造呢?很多時候會把晶片與原子彈在製造上用100比1來形容,也就是說晶片要比原子彈在製造難度上還要大100倍。其實這樣的說法並不誇張,晶片真的很難造出來,目前沒有任何一個國家能夠獨立製造出晶片,就連科技高度發達的美國也是需要與多個國家進行合作來完成晶片的製造,那麼製造晶片為什麼那麼困難呢?
  • 2nm技術的晶片開始沒落,下一代信息科技基石一定是光電晶片
    1.臺積電6納米半導體製程技術 臺積電6納米製程採用極紫外線光刻技術,與7納米製程相比,可將電晶體密度提高18%,而且其設計規則與7納米製程完全兼容,降低了升級成本。臺積電錶示,6納米製程技術應用於中高端行動網路、人工智慧、5G通信、高性能計算等領域半導體晶片的製造。