自 AMD 推出 Zen 架構以來,外界一直期盼著它能夠今早殺入 Top 10 超算名單。畢竟 2012 年的時候,該公司的皓龍(Opteron)處理器曾助力 Titan 拿到過第一的成績,可惜又在 2019 年 6 月跌出了前十。 好消息是,2020 年 6 月的時候,基於 AMD Zen 2 處理器架構的新平臺,再次殺入了榜單第七的位置。
Top500 名單可為各個企業帶來巨大的名氣,基於皓龍 6274 CPU 和英偉達 K20x 加速卡的超算平臺,曾在 2012 年拿過第一(目前仍是第 12 位),具有 8.2 Mega Watts 的功耗和 17.6 PetaFLOPs 的算力。
隨著 AMD 更新了兩代霄龍(EPYC)處理器,該公司能夠為 HPC 的每個插槽提供多達 64 個高性能內核,輔以充沛的內存帶寬、以及用於存儲和附加設備的連接選項。
不過從技術上來講,其實是 AMD 合資的海光(Hygon)帶來了首臺基於 Zen 處理器架構的超算,其於 2018 年 11 月躋身 Top500 名單的第 38 位。
演示平臺配備了 5120 個 Hygon 32 核心 CPU,目前仍在榜單上排名第 58 位。
2019 年 11 月的時候,基於 AMD 霄龍的官方超算系統才正式亮相,包括兩套 Naples 和兩套 Rome 系統平臺。隨著 2020 年 6 月的最新公布,可知另外七套 AMD 超算平臺已經到來。
不過 Selene 更有趣的一點,是因為它使用了英偉達 A100 Ampere 加速卡,該公司甚至展示過 DGX A100「SuperPod」的概念,連結了 140 個 DGX A100 節點和 1120 個 A100 GPU,提供高達 700 PetaOP 的 AI 性能。
事實證明 SuperPOD 也恰好出現 Top500 超算列表的第 7 位,其使用更傳統的 LINPACK FP64 FLOP,每個 DGX A100 節點都包含兩顆 AMD EPYC CPU 和八個 A100 加速器。
在 1.3 兆瓦的功率下,其 FP64 吞吐性能達到了 27.6 PetaFLOPs 。據悉,Selene 使用了英偉達 Mellanox HDR Infiniband 進行連接,輔以 560 TiB 內存。
與早年基於皓龍 CPU 和 K20x 加速卡的 Titan 超算相比,其僅以 16% 的功耗、就將性能提升了 57%(能效提升近 10 倍)。
英偉達在發布會上表示,DGX A100 節點的售價為 19.9 萬美元,換算可知 Selene 的硬體部署成本(不含交換機和安裝布線)約為 2800 萬美元。
從技術上來講,它將 280 顆霄龍處理器和 1120 塊 A100 GPU 加速卡配對,一起構成了 277760 運算核。
值得一提的是,美國 Exascale 項目即將迎來兩套全新的 AMD 超算平臺。
包括由 Cray(HPE)為橡樹嶺設計的 30 MegaWatt 平臺,其採用了霄龍處理器和 AMD Radeon Instinct 加速卡,有望在 2021 年達成 1.5 exaFLOPs 的算力。
此外為勞倫斯·利弗莫爾國家實驗室打造的平臺,有望在 2023 年初達成 2.0 ExaFLOPs 的算力。
作為對比,美國 Aurora 項目計劃在 2021 下半年,為阿貢國家實驗室打造基於 英特爾 至強處理器和 Xe 加速卡的 1.0 Exaflops 算力平臺。
最後,如果一切順利,AMD 仍有望在 2020 年中達成讓霄龍佔據 10% 市場份額的目標。
【來源:cnBeta.COM】