今天AMD揭開了MI100的神秘面紗,這是一款用於超級計算機的GPU,號稱是同類產品中速度最快的晶片,峰值性能超過10teraflops。
來源| siliconANGLE
超級計算機通常用於運行科學研究相關工作負載例如天氣預報模型和物理模擬,以前超級計算機主要是使用CPU搭建的。
但是,由於研究人員在科學計算中越來越多地使用機器學習,因此如今新型超級計算機也經常大量採用GPU,這個趨勢也進一步推動了市場對AMD MI100等晶片的需求不斷增長。
MI100晶片基於7納米製程工藝,在處理FP64數據時的最高性能可以達到11.5teraflops。(FP64是雙精度浮點格式的簡寫,是一種科學計算中經常使用的數據單元,很適合表示較大的數字)。
而當數據單元較小的時候,MI100也可以提供更高的速度。例如對於FP32數據來說,AMD預計在某些情況下峰值性能可以達到46.1teraflops。
MI100晶片令人印象深刻的性能表現,一部分要歸功於封裝中採用的Matrix Core技術。據AMD稱,這是一種針對AI優化的專用計算引擎,可以將神經網絡處理數據的速度提高近7倍。
AMD GPU的基本架構是流處理器,其作用類似於CPU的核心。MI100附帶了7680個此類流處理器,這些流處理器被整合成為120個較大計算單元,成為晶片的一個組成部分,此外支持32GB內存,MI100利用這些內存來存儲正在處理中的數據以加快訪問速度。
一臺超級計算機是由多臺伺服器組成的,每臺伺服器內部都可以配置多個GPU,具體要取決於對性能的要求。為了支持採用GPU的超算客戶,MI100集成了一項名為Infinity Fabric的技術,可以將多達4個GPU連結在一起,形成所謂的蜂巢。在這種配置下的MI100晶片可以更快地相互共享數據,從而更快地執行計算,因為Infinity Fabric所提供的峰值帶寬是通常用於晶片間連接的PCIe 4.0技術的2倍。
AMD推出MI100晶片正值超級計算機相關的支出不斷增加的時候,全球各國都在構建新一代「百億級」超級計算機,性能超過每秒10億次操作,是當今最快系統所能實現的速度的若干倍。AMD已經拿下了多個訂單,為即將上線的百億億次運算系統提供晶片,此次推出MI100,未來還將會給AMD帶來更多的訂單合同。
AMD對於MI100性能的大膽公布,可能意味著在這個重要的市場中,Nvidia將面臨更多競爭。上個月,Nvidia剛剛宣布已經被選為歐洲四套全新超級計算機系統的GPU提供商,其中的一套系統甚至有望成為全球性能最強大的AI超級計算機。
你與世界
只差一個
公眾號