AMD發布CDNA架構Instinct MI100加速顯卡 加速百億億次級時代到來

2021-01-11 快科技

北京時間11月16日晚10點,AMD正式發布了首款基於全新CDNA架構的Instinct MI100加速顯卡,以及配套的ROCm 4.0生態系統

首次正式亮相的CDNA架構專門為高性能計算所打造,而基於該架構的AMD Instinct MI100加速顯卡將進一步逼近百億億次級計算時代,同時也是AMD向前方開拓新發展路徑的新旗艦產品。

AMD高級副總裁兼伺服器業務總經理Dan McNamara表示,在高性能計算方面,整個行業發展十分迅速。我們看到的趨勢是,工作負載的多樣性在不斷增加,高性能計算已經進入到很多領域,包括從傳統科研,氣象研究,生命科學,電子設計自動化到商業應用,從AI、機器學習到算法培訓等等,如何通過CPU和GPU方面的組合更好地服務於客戶、為客戶帶來更多單位成本性能和減少總體擁有成本,將是AMD極其重要的戰略之一。

不過最令用戶之間關心的,相信還是本次發布的新品加速顯卡。AMD平臺解決方案工程研發全球副總裁Brad Mccredie對此進行了全面解讀。

在整個過去20年裡,整個高性能計算經歷了三個階段,分別是TERASCALE、PETASCALE和現在的EXASCALE。在這個過程中我們需要一系列技術來支持EXASCALE這樣一個百億億次級計算。

作為一款針對高性能計算而專門設計的行業領先GPU產品,AMD Instinct MI100旨在為推動百億億次級計算時代到來,能夠實現10TF(十萬億次雙精度計算速度),具備Matrix核心技術。與AMD上一代產品相比有著巨大的性能提升,能夠實現高達70%的AI計算加強;而與競爭對手相比,在每單位性能上也是對方的兩倍。特別是在搭配第二代AMD EPYC處理器使用時,還可為系統提供更強的加速性能。

20年前ASCI White超級計算機進入超算領域,並率先突破10TF關卡。20年之後,現在單個GPU僅在6兆瓦的性能上就可實現這樣一個性能水平,這就是AMD Instinct MI100加速顯卡,可以說這就是20年後非常巨大的成就之一。

目前市面上的大部分GPU採用的都是通用架構,這意味著這個架構既用於遊戲圖形處理,也用於複雜數學方面的處理,實際上著很大的制約了向百億億次級計算的發展。而AMD選擇將這兩部分分離,為我們已經所熟知的針對遊戲行業的RDNA架構,以及針對超算計算的CDNA架構。這樣的分離可以幫助相關人員進一步針對領域內的工作負載進行優化。

以AMD Instinct MI100為例,CDNA架構可在同一晶片上放入了兩倍數量的計算單元,並可以嵌入微架構以更好的適應AI和高性能計算的工作負載。同時在16位浮點計算和混合精度計算方面也能實現7倍以上的性能提升,另外通過Infinity架構還可以將GPU的帶寬提升4倍、通過HBM2內存來實現20%的位寬提升。

上文中多次提到的AMD Instinct MI100加速顯卡正在進一步逼近百億億次級計算時代,而AMD Instinct MI100的雙精度計算性能可以達到11.5TF的水平,單精度計算水平會更高。

據介紹,橡樹嶺國家實驗室就通過使用MI100來進行相關工作負載,在分子動力學負載中,與v100加速顯卡相比速度提升3倍。而在Fluid Turbulence的工作負載中,也比v100加速顯卡有2.6倍的速度優勢。作為早期客戶使用的效果來看,這一數據十分具有說服力。

另外,AMD還強調既要有世界級硬體,也需要世界級生態來做配套。為此,還推出搭配使用的開源軟體站ROCm 4.0,為百億億次級計算提供了新基礎。

該平臺不僅相較上兩代產品,可實現MI100高達5-8倍的性能提升,還可為開發者們提供簡單快捷的代碼遷移功能,甚至最短1天就可完成某些代碼的遷移工作。

自代號為「羅馬」的第二代霄龍處理器發布以來,AMD在伺服器市場便收穫了不俗的成績,時至今日它仍是市面上行業領先的x86伺服器。根據Intersect360此前的調查顯示,從16年至今,用戶對霄龍處理器的前瞻性音箱和好感度增加了兩倍之多。

如今,AMD在MI100加速顯卡和ROCm 4.0開源平臺的推出後,除了進一步完善AMD在伺服器市場的產品布局外,相信也定將會為客戶們帶來更為優越的HPC工作基礎,推動百億億次級時代搶先到來!

相關焦點

  • AMD EPYC處理器與全新AMD Instinct MI100加速顯卡重新定義HPC和...
    2020年11月18日,加利福尼亞州聖克拉拉訊 ——在今年的SC20虛擬展會上,AMD(納斯達克股票代碼:AMD)展示了其在高性能計算(HPC)行業的領導地位,並發布了支持ROCm 4.0開源生態系統的AMD Instinct MI100加速顯卡,同時還公布了一份正在不斷增長的、支持AMD EPYC處理器以及AMD Instinct MI100加速顯卡的合作夥伴名單,並強調了與微軟
  • 加速計算新時代 AMD Fusion APU發布
    中關村在線1月4日消息:正在美國拉斯維加斯舉辦的國際消費電子展(CES2011)上,AMD公司發布了一款加速處理器(APU),其融聚的更強性能讓計算機歷史上任何單一處理器難以望其項背。  AMD Fusion系列APU將多核(x86)中央處理器、支持DX11標準的強大獨立顯卡性能以及高速總線融合在一塊單一晶片上,擁有並行處理引擎和專門的高清視頻加速模塊,並能實現數據在不同處理核心間的加速傳遞。
  • 性能超A100 AMD的Instinct MI100加速卡開賣:只要4.8萬元
    在推出7nm RDNA2架構的RX 6000系列遊戲卡之後,AMD前不久還推出了CDNA架構的Instinct MI100加速卡,主打高性能計算。CDNA架構跟遊戲用的RDNA架構分家了,重點強化了FP64雙精度運算,同時還增加了Matrix Core(矩陣核心),用於加速HPC、AI運算,號稱在混合精度和FP16半精度的AI負載上,性能提升接近7倍。
  • AMD:首款RDNA 2架構顯卡筆記本上半年發布
    IT之家 1 月 13 日消息 根據 AMD 官方的消息,首款 RDNA 2 架構顯卡筆記本將於 2021 年上半年發布,官方暫未公布新款移動顯卡的規格。IT之家了解到,桌面端 RDNA2 架構顯卡已經發布並上市,官方表示新架構 GPU 每瓦性能相比上代再提高 50%。
  • AMD:首款RDNA 2架構顯卡筆記本將於2021年上半年發布
    1 月 13 日消息 根據 AMD 官方的消息,首款 RDNA 2 架構顯卡筆記本將於 2021 年上半年發布,官方暫未公布新款移動顯卡的規格。IT之家了解到,桌面端 RDNA2 架構顯卡已經發布並上市,官方表示新架構 GPU 每瓦性能相比上代再提高 50%。
  • AMD Radeon Instinct MI100 加速卡曝光 搭載8192流處理器
    根據TechPowerUp的報導,AMD即將推出Radeon Instinct MI100加速卡,代號為Arcturus(大角星),搭載8192流處理器,32GB顯存。  TechPowerUp表示,該加速卡的BIOS確認搭載了32 GB HBM2顯存,顯存頻率為1000 MHz,如果位寬為4096bit的話,帶寬將達到1 TB/s。
  • 性能漲7倍,AMD發布Instinct MI100新卡,英偉達祭出超算時代神器
    【新智元導讀】AMD於昨晚正式發布了首款基於全新CDNA架構的Instinct MI100 GPU以及配套的ROCm 4.0生態系統,而英偉達也不甘示弱,於今日發布了 A100 80GB GPU,將支持NVIDIA HGX AI 超級計算平臺,內存比上一代提升一倍,能夠為研究人員和工程師們提供空前的速度和性能,助力實現新一輪AI和科學技術突破。
  • AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構
    [PConline 雜談]今天,AMD歷史性在同一天裡發布了全新的銳龍3000系列處理器及RX 5700系列顯卡,這是很少見的,只不過這兩類產品給人的感覺是不一樣的——銳龍3000處理器是AMD從優秀走向卓越的開始,而RX 57000系列顯卡則更像是剛補完課的學生,有進步,但還不至於能趕超學霸。
  • AMD 7nm旗艦顯卡開售:只要4.8萬元|amd 7nm|顯卡|加速卡|amd|pcie...
    AMD前不久還推出了CDNA架構的Instinct MI100加速卡,這是一張計算卡,主打高性能計算。相比目前RX 6900 XT最多80組CU核心,Instinct MI100加速卡集成了120組CU單元,7680個流處理器,搭配32GB HBM2,帶寬高達1.23TB/s,同時支持PCIe 4.0,集成Infinity Fabric x16高速互聯通道,峰值帶寬達276GB/s(相當於PCIe 4.0 x16的大約4倍),而整卡功耗控制在300W。
  • 從GPU誕生說起:AMD統一渲染架構回顧及展望-AMD,ATI,統一渲染,顯卡...
    Xenos與第一款統一渲染架構GPU不過對於很多GPU愛好者來說,第一次接觸統一渲染架構的概念並非來自桌面顯卡,而是當時還沒被收購的ATI於2005年與微軟合作發布的XBOX 360遊戲主機採用的Xenos圖形處理器。
  • AMD Radeon Instinct MI100加速卡曝光:32GB顯存 功耗僅200W
    曾經有傳聞稱,AMD Navi核心的下一代將是「Arcturus」(大角星),但後來得到AMD官方人士證實,這其實是一款針對伺服器專業加速卡產品的代號
  • 時光倒轉:重現2009年史無前例顯卡大戰!-顯卡,AMD,NVIDIA,DX11...
    喜的是N/A顯卡的競爭中,玩家們迎來了高端顯卡普遍降價的利好,高端顯卡終於走進了主流玩家群體,而且這一年3D立體技術、通用計算、物理加速、多屏輸出、高清解碼、DX11等等技術領域也頻頻傳來捷報,玩家們可以放眼更加清晰而逼真的遊戲世界。憂的又是什麼呢?
  • 英特爾加速實現 XPU 願景:發布 oneAPI Gold 版本和英特爾伺服器 GPU
    英特爾公司今日宣布多項重要的技術進展,這也是英特爾多年來一直致力於通過統一的軟體體驗打造跨架構解決方案的又一裡程碑。其中,英特爾 ® oneAPI Gold 工具包將於今年 12 月正式交付;英特爾軟體棧推出新功能,作為公司軟硬體聯合設計方法的一部分。同時,英特爾正式發布其首款數據中心獨立圖形顯卡。
  • 2019最好的顯卡 內附AMD及英偉達顯卡排名
    Vengeance「復仇」系列是Corsair發布的超頻內存,它支持XMP 2.0標準;它有「Gibbo」DDR4技術,大概的意思就是電壓開始在1.20V,它會自動按照需要睿頻加速至1.25-1.35v,自動滿足內存和系統平臺的需要。此款8G單條,規格DDR4 3000,時序CL16。
  • AMD發布年度顯卡驅動「腎上腺素版」:性能暴增20% 30項新功能
    AMD剛剛發布了可以說是整個公司歷史上飛躍幅度最大的一款顯卡驅動,並特意命名為「Radeon Software Adrenalin Edition」(腎上腺素版),擁有最多20%的性能提升,以及30多項全新或改進功能。你很難相信,如此多的改進居然能體現在一款驅動之中!
  • 更配GTX1060顯卡?性能參數對比
    E3 1230 V2處理器,雖然性能上來說不差,22nm工藝,第三代酷睿Ivy架構,而i3 8100採用的是14nm工藝,雖然工藝上了差一代,但是架構上卻差了5代,E3比i3的優勢在於,超線程,多了4個,超線程這個用處呢,說大不大,說小不小,綜合性能其實差不多。
  • AMD Radeon Pro全系列專業顯卡完全鑑賞
    自從2014年AMD發布基於GCN 1.x架構的W全系列專業顯卡以來,從W9100到W2100的FirePro專業顯卡就一直牢牢統治了AMD的專業顯卡市場,一晃近兩年多的時間都沒有任何的變化。在Radeon R9 300時代以及基於Fiji核心的Fury時代,AMD似乎都忘記了更新專業顯卡。
  • AMD統一渲染GPU架構 歷程回顧與評測_迪蘭恆進 HD5970 2G_顯卡評測...
    前言:NVIDIA公司歷經長時間醞釀的Fermi架構高端產品GTX480/GTX470發布已經結束,經歷了長達一個月的忙碌,我們已經了解到了這款產品的各項特性,眾多用戶和開發者組成顯卡圈最近也趨於平淡。如果別人問到我,了解NVIDIA和AMD兩家產品的性能後,你該做些什麼?
  • 超薄本的第二引擎 英特爾加速部署多類型Iris Xe
    另外,如架構圖左上角所示,十一代酷睿核心中集成了全新的IPU(Image Processing Unit,圖像處理單元)6,而這一功能在特定版本的產品中開放。 題外話,近來跑分牛哄哄的M1,也是通過這樣專用單元為特定應用加速。隨著Windows相關軟體開放對IPU6的加速特性,十一代酷睿本同樣快到起飛。
  • 英特爾Trish Damkroger:異構性將是加速高性能計算和AI融合關鍵
    今天,我要跟大家談一談擴展高性能計算邊界:多架構時代。在開始演講之前,我想感謝大家邀請我再度出席全國高性能計算學術年會,並發表演講。今年的情況和去年不太一樣,我沒能親自來到現場,而是在英特爾工作室與大家進行交流。全球疫情的爆發讓大多數人進入了新常態,我希望每個人都平安健康。對我而言,高性能計算一直是一個令人興奮的業務。