—微軟宣布新型HBv3虛擬機將支持代號為「Milan」的下一代AMD EPYC處理器—
—首個使用AMD CDNA架構、專用於高性能計算(HPC)工作負載的加速顯卡AMD Instinct MI100—
在今年的SC20虛擬展會上,AMD展示了其在高性能計算(HPC)行業的領導地位,並發布了支持ROCm 4.0開源生態系統的AMD Instinct MI100加速顯卡,同時還公布了一份正在不斷增長的、支持AMD EPYC處理器以及AMD Instinct MI100加速顯卡的合作夥伴名單,並強調了與微軟Azure在雲計算中針對HPC的合作。在預期2021年第一季度公開發布基於「Zen 3」核心架構的第三代EPYC處理器、OEM同步上市之前,AMD將按計劃為部分HPC和雲計算客戶在本季度開始批量供貨。
全新AMD Instinct MI100加速顯卡為科研工作負載帶來了革命性的HPC性能,同時也是首個跨過10萬億次浮點運算(FP64)性能門檻的加速顯卡[i]。基於AMD全新CDNA架構的AMD Instinct MI100,在與第二代AMD EPYC處理器搭配使用時可為系統加速HPC和AI工作負載。有了戴爾、技嘉、HPE和Supermicro這些新加速計算平臺的支持,並與AMD EPYC處理器和ROCm 4.0開源軟體平臺相結合,MI100旨在推動百億億次級時代到來之前的科學新發現。
AMD高級副總裁兼數據中心和嵌入式解決方案業務總經理Forrest Norrod表示:「在HPC領域,沒有哪個客戶的需求是相同的,從內部小型機群到雲虛擬機,再到百億億次級超級計算機,AMD正在開啟一條通往代表著當今行業領先技術和能力的道路,這些技術和能力對支持他們的HPC工作負載至關重要。通過將AMD EPYC處理器和Instinct加速顯卡與關鍵應用軟體和開發工具相結合,AMD可為HPC工作負載提供業界領先的性能支持。」
AMD與微軟Azure賦能雲端HPC
Azure正在使用第二代AMD EPYC處理器為其HBv2虛擬機(VMs)提供HPC工作負載性能。相較第一代HB系列虛擬機,新一代虛擬機可提供高達2倍的性能[ii],支持多達80000核的MPI工作[iii],並很好地利用了第二代AMD EPYC處理器業內領先的超大內存帶寬優勢。
HBv2虛擬機擁有眾多用戶,其中包括伊利諾伊大學厄巴納-香檳分校的貝克曼高級科學技術研究所,該研究所僅用了86,400核就能構建了過去往往需要領先的超級計算機才能建模的植物病毒,美國海軍也通過該虛擬機快速部署並按需進行增強的氣候和海洋模型預測。基於第二代AMD EPYC處理器的HBv2虛擬機同樣也為微軟今年早些時候所宣布的OpenAI環境提供了大部分處理器計算能力。
AMD EPYC處理器還幫助HBv2虛擬機跨越了多個新的雲HPC裡程碑,例如使用NAMD創下了雲MPI擴展結果的新紀錄,躋身Graph500排行榜前二十名;以及成為了首個1TB/s雲HPC並行文件系統。通過這些記錄和其它應用基準測試可以看出,HBv2可以提供比任何現有公有雲都領先的擴展性。
除了現有的基於第二代AMD EPYC處理器的HBv2 HPC虛擬機外,Azure還宣布它將在未來支持代號為「Milan」的下一代AMD EPYC處理器,並將用在HB系列HPC虛擬機上。
AMD一直是HPC的絕佳選擇
AMD EPYC處理器和Instinct加速顯卡具備橫跨各種平臺、支持大量HPC工作負載的性能和能力。無論從研究中心的小型機群,到商用HPC、外部部署和雲計算,再到百億億次級計算,AMD將持續不斷的為HPC解決方案提供性能和選擇。
HPE與CSC芬蘭公司以及EuroHPC公司最近推出了一個名為LUMI的次百億億次級系統。該系統基於HPE Cray EX超級計算機架構,並將使用下一代AMD EPYC處理器和Instinct加速顯卡,預計2021年上線時將可提供552 petaflops的峰值性能,使其成為世界上首屈一指的超級計算機。
除了LUMI之外,基於AMD的HPC系統的名單還在不斷增長。自SC19以來,已經有超過15個超算系統宣布使用AMD EPYC處理器或Instinct加速顯卡,或兩者兼有。主要包括:
· Chicoma – 洛斯阿拉莫斯國家實驗室 – 該系統基於HPE Cray EX超級計算機架構,使用了第二代AMD EPYC處理器,並結合300 terabytes的系統內存用於COVID-19的研究工作。
· Corona - 勞倫斯利弗莫爾國家實驗室 – 該系統最近得到了來自《冠狀病毒援助、救濟和經濟安全法案》的資助並進行了升級,新增了近1000臺AMD Instinct MI50加速顯卡,使其最高性能超過11 petaFLOPs。
· Mammoth – 勞倫斯利弗莫爾國家實驗室 – 「大內存」集群使用了第二代AMD EPYC處理器進行研究COVID-19的科學家們所急需的基因組學分析和圖形分析。
· Northern Data – 這是一個位於歐洲的分布式計算系統,通過使用AMD EPYC處理器和Instinct加速顯卡進行大規模HPC應用,例如渲染、人工智慧和深度學習等。
· Pawsey超算中心 – 通過使用HPE Cray EX超級計算機架構以及未來的AMD EPYC處理器和AMD Instinct加速顯卡,屆時Pawsey超級計算機將成為澳大利亞頂尖的超級計算機。
此外,AMD還在為以下超級計算機提供支持:Anvil和Bell – 普渡大學,Big Red 200 – 印第安納大學,Bridges 2 – 匹茲堡超算中心,CERN、歐洲中期氣象預報中心、Expanse – 聖地牙哥超算中心,法蘭克福大學、IT4Innovations國家超算中心、Jetstream 2 – 印第安納大學,Mahti – CSC,Manqi – 明尼蘇達大學,國家海洋和大氣管理局、Red Raider – 德州理工大學,TinkerCliffs – 維吉尼亞理工大學。
聖地牙哥超算中心主任Michael Normam表示:「通過Expanse超級計算機,我們的目標是讓科學家和研究人員能夠像雲計算一樣來訪問高性能計算機,而它可以處理從天體物理學到動物學之間的所有事情。第二代AMD EPYC處理器幫助我們實現了非凡的性能,讓我們的研究人員可以做到更多的科學研究。我們與AMD也有著良好的合作關係,並一同為AMD HPC客戶創建了一個論壇,在那裡大家可以分享經驗、信息,以便更好地獲益於HPC研究。」
為百億億次級計算鋪平道路
為了幫助研究人員邁向通往百億億次級計算的道路,AMD已經向橡樹嶺國家實驗室提供了全新的AMD Instinct MI100加速顯卡,它在計算和互連性能上帶來了巨大的飛躍。從AMD的高性能計算到AI,Instinct MI100加速顯卡實現了一種新型的加速系統,同時還可提供真正的異構計算能力。該加速顯卡基於AMD Infinity架構,旨在可以與第二代AMD EPYC處理器進行互補,AMD Instinct MI100為AMD的HPC和AI計算提供了真正的異構計算能力。
橡樹嶺國家實驗室科學主任Bronson Messer表示:「與當今的系統相比,基於AMD的Frontier的計算能力有了巨大的提升,它可以幫助科學家們得到我們過去不可得知的答案。例如其模擬分子運行的能力不只是幾百萬個原子,而是多達幾十億個原子,它為科學提供了一個更真實的表現,並且能夠一次又一次地做到這一點很重要,這將為我們帶來很多重大發現。」
無論是幫助研究中心的學生、改善汽車製造商的空氣動力學效率,還是為醫學突破提供有價值的關鍵見解,AMD將會繼續為今天和未來的HPC工作負載提供所需的性能、能力和規模。
[i]Calculations conducted by AMD Performance Labs as of Sep 18, 2020 for the AMD Instinct MI100 (32GB HBM2 PCIe card) accelerator at 1,502 MHz peak boost engine clock resulted in 11.54 TFLOPS peak double precision (FP64), 46.1 TFLOPS peak single precision matrix (FP32), 23.1 TFLOPS peak single precision (FP32), 184.6 TFLOPS peak half precision (FP16) peak theoretical, floating-point performance. Published results on the NVidia Ampere A100 (40GB) GPU accelerator resulted in 9.7 TFLOPS peak double precision (FP64). 19.5 TFLOPS peak single precision (FP32), 78 TFLOPS peak half precision (FP16) theoretical, floating-point performance. Server manufacturers may vary configuration offerings yielding different results. MI100-03
[ii]Source: https://azure.microsoft.com/en-us/blog/introducing-the-new-hbv2-azure-virtual-machines-for-high-performance-computing/
[iii]Source: https://azure.microsoft.com/en-us/blog/azure-hbv2-virtual-machines-eclipse-80000-cores-for-mpi-hpc/