EPYC與Instinct MI100重新定義HPC和科研計算性能

2020-11-27 騰訊網

—微軟宣布新型HBv3虛擬機將支持代號為「Milan」的下一代AMD EPYC處理器—

—首個使用AMD CDNA架構、專用於高性能計算(HPC)工作負載的加速顯卡AMD Instinct MI100—

在今年的SC20虛擬展會上,AMD展示了其在高性能計算(HPC)行業的領導地位,並發布了支持ROCm 4.0開源生態系統的AMD Instinct MI100加速顯卡,同時還公布了一份正在不斷增長的、支持AMD EPYC處理器以及AMD Instinct MI100加速顯卡的合作夥伴名單,並強調了與微軟Azure在雲計算中針對HPC的合作。在預期2021年第一季度公開發布基於「Zen 3」核心架構的第三代EPYC處理器、OEM同步上市之前,AMD將按計劃為部分HPC和雲計算客戶在本季度開始批量供貨。

全新AMD Instinct MI100加速顯卡為科研工作負載帶來了革命性的HPC性能,同時也是首個跨過10萬億次浮點運算(FP64)性能門檻的加速顯卡[i]。基於AMD全新CDNA架構的AMD Instinct MI100,在與第二代AMD EPYC處理器搭配使用時可為系統加速HPC和AI工作負載。有了戴爾、技嘉、HPE和Supermicro這些新加速計算平臺的支持,並與AMD EPYC處理器和ROCm 4.0開源軟體平臺相結合,MI100旨在推動百億億次級時代到來之前的科學新發現。

AMD高級副總裁兼數據中心和嵌入式解決方案業務總經理Forrest Norrod表示:「在HPC領域,沒有哪個客戶的需求是相同的,從內部小型機群到雲虛擬機,再到百億億次級超級計算機,AMD正在開啟一條通往代表著當今行業領先技術和能力的道路,這些技術和能力對支持他們的HPC工作負載至關重要。通過將AMD EPYC處理器和Instinct加速顯卡與關鍵應用軟體和開發工具相結合,AMD可為HPC工作負載提供業界領先的性能支持。」

AMD與微軟Azure賦能雲端HPC

Azure正在使用第二代AMD EPYC處理器為其HBv2虛擬機(VMs)提供HPC工作負載性能。相較第一代HB系列虛擬機,新一代虛擬機可提供高達2倍的性能[ii],支持多達80000核的MPI工作[iii],並很好地利用了第二代AMD EPYC處理器業內領先的超大內存帶寬優勢。

HBv2虛擬機擁有眾多用戶,其中包括伊利諾伊大學厄巴納-香檳分校的貝克曼高級科學技術研究所,該研究所僅用了86,400核就能構建了過去往往需要領先的超級計算機才能建模的植物病毒,美國海軍也通過該虛擬機快速部署並按需進行增強的氣候和海洋模型預測。基於第二代AMD EPYC處理器的HBv2虛擬機同樣也為微軟今年早些時候所宣布的OpenAI環境提供了大部分處理器計算能力。

AMD EPYC處理器還幫助HBv2虛擬機跨越了多個新的雲HPC裡程碑,例如使用NAMD創下了雲MPI擴展結果的新紀錄,躋身Graph500排行榜前二十名;以及成為了首個1TB/s雲HPC並行文件系統。通過這些記錄和其它應用基準測試可以看出,HBv2可以提供比任何現有公有雲都領先的擴展性。

除了現有的基於第二代AMD EPYC處理器的HBv2 HPC虛擬機外,Azure還宣布它將在未來支持代號為「Milan」的下一代AMD EPYC處理器,並將用在HB系列HPC虛擬機上。

AMD一直是HPC的絕佳選擇

AMD EPYC處理器和Instinct加速顯卡具備橫跨各種平臺、支持大量HPC工作負載的性能和能力。無論從研究中心的小型機群,到商用HPC、外部部署和雲計算,再到百億億次級計算,AMD將持續不斷的為HPC解決方案提供性能和選擇。

HPE與CSC芬蘭公司以及EuroHPC公司最近推出了一個名為LUMI的次百億億次級系統。該系統基於HPE Cray EX超級計算機架構,並將使用下一代AMD EPYC處理器和Instinct加速顯卡,預計2021年上線時將可提供552 petaflops的峰值性能,使其成為世界上首屈一指的超級計算機。

除了LUMI之外,基於AMD的HPC系統的名單還在不斷增長。自SC19以來,已經有超過15個超算系統宣布使用AMD EPYC處理器或Instinct加速顯卡,或兩者兼有。主要包括:

· Chicoma – 洛斯阿拉莫斯國家實驗室 – 該系統基於HPE Cray EX超級計算機架構,使用了第二代AMD EPYC處理器,並結合300 terabytes的系統內存用於COVID-19的研究工作。

· Corona - 勞倫斯利弗莫爾國家實驗室 – 該系統最近得到了來自《冠狀病毒援助、救濟和經濟安全法案》的資助並進行了升級,新增了近1000臺AMD Instinct MI50加速顯卡,使其最高性能超過11 petaFLOPs。

· Mammoth – 勞倫斯利弗莫爾國家實驗室 – 「大內存」集群使用了第二代AMD EPYC處理器進行研究COVID-19的科學家們所急需的基因組學分析和圖形分析。

· Northern Data – 這是一個位於歐洲的分布式計算系統,通過使用AMD EPYC處理器和Instinct加速顯卡進行大規模HPC應用,例如渲染、人工智慧和深度學習等。

· Pawsey超算中心 – 通過使用HPE Cray EX超級計算機架構以及未來的AMD EPYC處理器和AMD Instinct加速顯卡,屆時Pawsey超級計算機將成為澳大利亞頂尖的超級計算機。

此外,AMD還在為以下超級計算機提供支持:Anvil和Bell – 普渡大學,Big Red 200 – 印第安納大學,Bridges 2 – 匹茲堡超算中心,CERN、歐洲中期氣象預報中心、Expanse – 聖地牙哥超算中心,法蘭克福大學、IT4Innovations國家超算中心、Jetstream 2 – 印第安納大學,Mahti – CSC,Manqi – 明尼蘇達大學,國家海洋和大氣管理局、Red Raider – 德州理工大學,TinkerCliffs – 維吉尼亞理工大學。

聖地牙哥超算中心主任Michael Normam表示:「通過Expanse超級計算機,我們的目標是讓科學家和研究人員能夠像雲計算一樣來訪問高性能計算機,而它可以處理從天體物理學到動物學之間的所有事情。第二代AMD EPYC處理器幫助我們實現了非凡的性能,讓我們的研究人員可以做到更多的科學研究。我們與AMD也有著良好的合作關係,並一同為AMD HPC客戶創建了一個論壇,在那裡大家可以分享經驗、信息,以便更好地獲益於HPC研究。」

為百億億次級計算鋪平道路

為了幫助研究人員邁向通往百億億次級計算的道路,AMD已經向橡樹嶺國家實驗室提供了全新的AMD Instinct MI100加速顯卡,它在計算和互連性能上帶來了巨大的飛躍。從AMD的高性能計算到AI,Instinct MI100加速顯卡實現了一種新型的加速系統,同時還可提供真正的異構計算能力。該加速顯卡基於AMD Infinity架構,旨在可以與第二代AMD EPYC處理器進行互補,AMD Instinct MI100為AMD的HPC和AI計算提供了真正的異構計算能力。

橡樹嶺國家實驗室科學主任Bronson Messer表示:「與當今的系統相比,基於AMD的Frontier的計算能力有了巨大的提升,它可以幫助科學家們得到我們過去不可得知的答案。例如其模擬分子運行的能力不只是幾百萬個原子,而是多達幾十億個原子,它為科學提供了一個更真實的表現,並且能夠一次又一次地做到這一點很重要,這將為我們帶來很多重大發現。」

無論是幫助研究中心的學生、改善汽車製造商的空氣動力學效率,還是為醫學突破提供有價值的關鍵見解,AMD將會繼續為今天和未來的HPC工作負載提供所需的性能、能力和規模。

[i]Calculations conducted by AMD Performance Labs as of Sep 18, 2020 for the AMD Instinct MI100 (32GB HBM2 PCIe card) accelerator at 1,502 MHz peak boost engine clock resulted in 11.54 TFLOPS peak double precision (FP64), 46.1 TFLOPS peak single precision matrix (FP32), 23.1 TFLOPS peak single precision (FP32), 184.6 TFLOPS peak half precision (FP16) peak theoretical, floating-point performance. Published results on the NVidia Ampere A100 (40GB) GPU accelerator resulted in 9.7 TFLOPS peak double precision (FP64). 19.5 TFLOPS peak single precision (FP32), 78 TFLOPS peak half precision (FP16) theoretical, floating-point performance. Server manufacturers may vary configuration offerings yielding different results. MI100-03

[ii]Source: https://azure.microsoft.com/en-us/blog/introducing-the-new-hbv2-azure-virtual-machines-for-high-performance-computing/

[iii]Source: https://azure.microsoft.com/en-us/blog/azure-hbv2-virtual-machines-eclipse-80000-cores-for-mpi-hpc/

相關焦點

  • 7倍AI性能提升,AMD Instinct MI100來了
    高校與科研方面則有:俄勒岡州立大學基因組研究和生物計算中心(CGRB)、勞倫斯·利弗莫爾國家實驗室的Sierra超級計算機、德州理工大學、聖母大學、烏爾姆大學、荷蘭國家亞原子物理研究所 (Nikhef)等等。2020年4月,AMD又順勢推出了三大系列7Fx2高主頻處理器,使其更加適合超融合、高性能計算、裸金屬等應用。
  • AI性能暴漲7倍,AMD昨夜發布Instinct MI100新卡,英偉達也祭出百億...
    ,內存比上一代提升一倍,能夠為研究人員和工程師們提供空前的速度和性能,助力實現新一輪AI和科學技術突破。  AMD 推出 Instinct MI100晶片,AI性能暴漲7倍  AMD 公司表示,MI100晶片是世界上最快的高性能計算處理器 GPU,也是第一個性能超過10萬億次浮點運算的 x86 伺服器 GPU。
  • AMD推出首款CDNA架構的計算加速卡Instinct MI100 一張卡就是一臺...
    ,根據AMD官方的說法,CDNA和RDNA分別針對HPC(高性能計算)和遊戲領域進行了針對性的優化、設計。AMD認為近年來的傳統GPU加速計算也已經顯露疲態,性能增長腳步有所放緩,必須實現全新的突破。AMD Instinct MI100是第一款FP64雙精度浮點運算性能超過10TFlops(每秒1億億次)的計算加速卡。得益於全新CDNA架構,它擁有120個計算單元,7680個流處理器,32GB HBM2顯存,帶寬高達1.23TB/s。
  • AMD推出Instinct MI100加速顯卡,將進一步逼近百億億次級計算時代
    打開APP AMD推出Instinct MI100加速顯卡,將進一步逼近百億億次級計算時代 佚名 發表於 2020-11-17 14:36:58
  • AMD發布CDNA架構Instinct MI100加速顯卡 加速百億億次級時代到來
    我們看到的趨勢是,工作負載的多樣性在不斷增加,高性能計算已經進入到很多領域,包括從傳統科研,氣象研究,生命科學,電子設計自動化到商業應用,從AI、機器學習到算法培訓等等,如何通過CPU和GPU方面的組合更好地服務於客戶、為客戶帶來更多單位成本性能和減少總體擁有成本,將是AMD極其重要的戰略之一。不過最令用戶之間關心的,相信還是本次發布的新品加速顯卡。
  • 英特爾最新一代10nm重新定義電晶體,Tiger Lake架構性能提升20%
    全新10nm SF工藝讓性能提高多達20%,技術可媲美節點轉換英特爾推出全新的 10nm SuperFin 電晶體技術,這是該公司有史以來最為強大的單節點內性能增強。首席架構師 Raja Koduri 表示,「經過多年對FinFET電晶體技術的改進,英特爾正在重新定義該技術,以實現其歷史上最強大的單節點內性能增強,帶來的性能提升可與完全節點轉換相媲美。」
  • 如何讓 Gaussian 計算飛起來?
    1.量化計算如何選擇硬體配置由於分子的類型、體系和模擬算法,以及各種應用和精度要求,都有不同的計算特點,對計算機硬體(CPU、內存、硬碟、GPU)配置要求有很大的差異,如何選擇好伺服器/工作站的硬體配置,提高計算速度,縮短求解時間,主要看用量子化學計算軟體的算法,及做什麼求解,因為算法和精度決定了計算特點和求解規模,合理的硬體配置,大大發揮機器性能,縮短求解時間。
  • HPC大計算:挑戰深度學習的計算力黑洞
    (HPC)、大數據和雲計算融合的「大計算」。很多人也提出需求:我有大數據的需求,能不能和HPC進行統一的整合給我提供管理?我在深度學習上遇到性能的問題,用HPC的技術能不能更好的解決和實現?實際上不同的計算方式給我們提出了挑戰。比如國內現在很多網際網路企業的採購單元已經從原來的單機變成了機櫃單元,下一步可以想像他的採購模式可能是要布滿傳感器。這就代表了在企業集團架構上的融合進化的趨勢。
  • 量子化學計算(Gausssian)工作站硬體配置
    量子化學計算由於分子的類型、體系和模擬算法,以及各種應用和精度要求,都有不同的計算特點,對計算機硬體(CPU、內存、硬碟、GPU)配置要求有很大的差異 ,那麼如何選擇好伺服器/工作站的硬體配置,提高計算速度,縮短求解時間
  • Oracle Database In-Memory:重新定義內存計算?
    對於全球擁有廣泛資料庫用戶基礎的Oracle而言,顯然希望改變當前內存計算的市場格局,為內存計算市場注入更多競爭活力。近日,Oralce公司正式推出了其Oracle Database In-Memory Option,Oracle表示其Database In-Memory能夠讓實時分析獲得一百倍性能提升,能夠更快的處理OLTP混合工作負載,並且易於部署而無需改變應用。
  • 遇見容器HPC——蘭州大學的高性能計算應用之路
    諾貝爾獎得主威爾遜曾經說: 「當今,科學研究可分為三種:實驗、理論和計算。」如果說,在科學的發展長河中,伽利略和牛頓奠定了實驗科學和理論科學的基石。學校先後在物理、化學、大氣學院等學院建設了高性能計算中心,給各學院的教師和學生提供了科研支撐。
  • 遇見容器HPC 蘭州大學的高性能計算應用之路
    「當今,科學研究可分為三種:實驗、理論和計算。」  ——諾貝爾獎得主,威爾遜  如果說,在科學的發展長河中,伽利略和牛頓奠定了實驗科學和理論科學的基石。那麼,計算機的發明,則把計算推上了人類科學活動的另一個前沿,此後,計算在科學活動中發揮著越來越重要的作用。
  • 改寫教科書:安培千克開爾文和摩爾四個基礎單位將被重新定義
    改寫教科書:安培千克開爾文和摩爾四個基礎單位將被重新定義 微信公眾號「Nature自然科研」 2017-11-28 15:13
  • 重新定義低功耗、小尺寸FPGA
    物聯網AI、嵌入式視覺、硬體安全、5G通信、工業和汽車自動化等新興應用正在重新定義開發人員設計網絡邊緣產品的硬體要求。為了支持這些應用,網絡邊緣設備的硬體方案需要具備下列特徵:JEtednc萊迪思的研發工程師幾年前就開始著手FPGA開發工藝的創新,旨在為客戶提供具備上述特性的硬體平臺。
  • 四方面提升 微軟HPC Server 2008推動高性能計算
    他認為,高性能計算最重要的是如何來提升機器性能,因此從作業系統的角度加以提高是非常關鍵的。微軟進入高性能計算領域已經多年,而經過不懈的努力,現在Windows HPC Server 2008 R2(編註:本文提到的R2均為測試版)在性能上已經不弱於其他系統,微軟關注的是如何讓客戶現有的投資重新利用起來,不管是軟體還是硬體,幫助客戶更好地管理高性能計算機的超級計算。
  • 為啥重新定義基本單位
    「秒」「米」「千克」「安培」「開爾文」「摩爾」「坎德拉」將全部以常數定義,全新的測量體系正式啟用。基本單位不再與實物關聯,計量精準度的躍遷更將開啟無限可能,帶來新的認知和機遇、催生新的技術和產業。 5月20日,全球將採用新的國際單位制,「千克」「秒」「米」等7個基本單位全部從實物原器改為常數定義,這是國際單位制自1963年創立以來最重大的變革。
  • 2018年計量國際單位制 將被重新定義
    原標題:2018年計量國際單位制 將被重新定義   1960年之前,「1米」被定義為地球一周的四千萬分之一,位於法國巴黎的國際計量局裡一根「穩定」的金屬鑄成的「米」的基準原器就是全世界最準的「1米」。1960年,「米」被定義為質子數為86的氪原子能級躍遷時輻射波長的倍數。1983年,「1米」再次被重新定義為「光在真空中3億分之一秒所走的距離」。一次次的變化,目的只有一個,讓這個長度單位越來越準。
  • 電流標準單位安培有望被重新精確定義
    本報訊(記者 馮衛東) 芬蘭與美國的一個研究小組研製出單電子電晶體(SET)它能將振蕩電壓轉換成非常精確的電流,這有望更精確重新定義電流的基本單位———安培。該項科研成果刊登在近期出版的《納米科學與技術在線資源》網站上。
  • 見證歷史:千克等單位被重新定義,國際單位制進入「量子時代」
    11月16日,第26屆國際度量衡大會經過60個成員國代表的投票表決,重新定義了千克,新定義以普朗克常數為基準,有一百多年歷史的國際千克原器「大K」即將退出舞臺。安培、開爾文和摩爾的定義也被更新,這是國際單位制於 1960 年正式公布以來最大的一次調整。
  • 「千克」「安培」「米」「秒」等計量單位重新定義
    「千克」「安培」「米」「秒」等計量單位重新定義 新定義的國際計量單位5月20日起正式使用 對日常生活沒有影響,將為科研插上翅膀 華聲在線5月20日訊(湖南日報·華聲在線記者 奉永成) 5月20日是第20