AMD CDNA計算卡架構揭秘:從零起步、三殺NVIDIA

2020-12-03 驅動之家

昨日晚間，AMD正式發布了新一代Instinct MI100計算卡，首次採用針對HPC高性能計算、AI人工智慧全新設計的CDNA架構，和遊戲向的RDNA架構截然不同。

Instinct MI100計算卡採用臺積電7nm工藝製造，集成120個計算單元、7680個流處理器，核心頻率最高1502MHz，並專門加入了Matrix Core(矩陣核心)，用於加速HPC、AI運算。

它整合封裝了32GB HBM2顯存，位寬4096-bit，頻率1.2GHz，帶寬1228.8GB/s，支持ECC。

該卡支持PCIe 4.0 x16，具備三條Infinity Fabric互連總線，峰值帶寬92GB/s，整卡熱設計功耗300W，雙8針輔助供電。

這塊卡的特殊之處還在於頂部設置了橋接金手指，通過橋接器可以將四塊卡綁定在一起，而搭配雙路的AMD霄龍處理器，可以實現八卡並行。

類似之前的計算卡，甚至是R9 Fury X、Vega 64/56這樣的遊戲卡，Instinct MI110也是將GPU晶片、HBM晶片整合封裝在了一起，不過如今的HBM2單顆容量已達8GB。

對比CDNA(上)、RDNA(下)架構圖，可以發現二者整體框架有些相似之處，但各種單元模塊和布局已經截然不同。

Infinity Fabric互連總線、顯存控制器、PCIe 4.0控制器、多媒體引擎、著色器引擎、ACE異步計算引擎等等都還在(當然也不完全一樣了)，而和圖形渲染輸出相關的都沒了，比如圖形指令處理器、幾何處理器、光柵器、顯示引擎、原語單元等等，同時增加了XGMI連接控制器用於多卡互連，一二級緩存也完全不同。

作為AMD GPU的最基本模塊，計算單元(CU)也完全不同了，現在叫做增強型計算單元(XCU)，組成模塊包括調度器、分支與信息單元、12.8KB ECC標量單元、512KB ECC標量寄存器、矢量寄存器、矢量ALU操作單元、矩陣數據操作單元、四個矢量/矩陣SIMD單元、64KB ECC本地數據共享單元、載入/存儲單元、16KB ECC一級緩存等等。

顯然，這一些都是為計算服務的，而用於圖形的著色器、紋理相關單元自然都不見了，即便有些單元名字一樣，規格和作用也不同了。

計算性能方面，FMA64/FP64雙精度為11.5TFlops(每秒1.15億億次)，FMA32/FP32單精度為23.1TFlops(每秒2.31億億次)，FP32 Matrix單精度矩陣計算為46.1TFlops(每秒4.61億億次)，FP16 Matrix半精度矩陣計算為184.6TFlops(每秒18.46億億次)，Bfloat16浮點為92.3TFlops(每秒9.23億億次)。

這樣的一塊卡，已經相當於20年前的世界頂級超級計算機，而體積、功耗都不可同日而語。

對比NVIDIA安培架構的最新計算卡A100，AMD也給出了一些對比數據，FP32單精度性能領先18.5％，FP64雙精度性能領先18.6％，AI與機器學習性能更是領先兩倍多，而且功耗低了足足100W。

而對比上代產品MI50，新卡的FP64雙精度、FP32單精度性能均提升74％，FP32矩陣性能提升接近2.5倍，AI負載性能更是幾乎7倍的飛躍。

當然，除了紙面計算性能優秀，軟體開發也必須跟上，尤其是這種計算性的產品。NVIDIA在這方面要強得多，生態更加穩固和豐富，AMD ROCm平臺正在奮起直追中。

相關焦點

NVIDIA安培有對手了!AMD官宣第一款CDNA架構計算卡

今年3月份，AMD宣布了全新的CDNA架構，面向高性能計算、AI人工智慧，而不再兼顧遊戲和圖形應用，這部分全交給RDNA架構，雙管齊下。這和NVIDIA的思路有些類似，比如後者的伏特架構、圖靈架構，就分別專供計算和遊戲。
AMD官宣CDNA架構計算卡下半年與安培競爭

AMD在3月份公布面向高性能計算、AI人工智慧的CDNA架構，遊戲和圖形應用將全部交給RDNA架構。在公布新架構三個多月後，AMD CTO Mark Papermaster公開確認，首款CDNA架構產品Radeon Instinct MI100將在下半年發布，面向高性能計算市場。
cdna - cdna_電子產品世界

今年3月份，AMD宣布了全新的CDNA架構，面向高性能計算、AI人工智慧，而不再兼顧遊戲和圖形應用，這部分全交給
AMD推出首款CDNA架構的計算加速卡Instinct MI100 一張卡就是一臺...

北京時間11月16日晚10點，AMD正式發布了其首款基於CDNA架構的計算加速卡——Instinct MI100，以及配套的ROCm(Radeon Open eCosystem)4.0生態系統。作為新一代面向高性能計算領域的產品，Instinct MI100是首款採用CDNA架構的計算加速卡，告別了以往和遊戲顯卡採用相同RDNA架構的方案
AMD全新GPU架構揭秘:從零起步 7nm工藝

近日，AMD正式發布了新一代Instinct MI100計算卡，首次採用針對HPC高性能計算、AI人工智慧全新設計的CDNA架構，和遊戲向的RDNA架構截然不同。Instinct MI100計算卡採用臺積電7nm工藝製造，集成120個計算單元、7680個流處理器，核心頻率最高1502MHz，並專門加入了Matrix Core(矩陣核心)，用於加速HPC、AI運算。它整合封裝了32GB HBM2顯存，位寬4096-bit，頻率1.2GHz，帶寬1228.8GB/s，支持ECC。
NVIDIA發布基於圖靈架構的計算用卡

在GTC 2018圖形技術大會日本站上，我們的黃教主發布了一款基於圖靈架構的全新計算卡：Telsa T4，一起來看一下。　　規格上，其搭配了2560個CUDA核心（基於圖靈架構），這個數字是小於RTX 2080的2944個的，但是高於RTX 2070的2304個。同時他還有320個Tensor核心用於AI計算，而關於RTX實時光線追蹤部分可能由於用途不同而被閹割。　　顯存位寬為16GB GDDR6，但帶寬卻只有320GB/s,目測降低了位寬或者頻率。
AMD宣布全新CDNA GPU架構:數據中心計算專用

而除了打遊戲、渲染圖形，GPU的另一項核心任務就是計算，尤其是隨著人工智慧、神經網絡、深度學習對於高性能計算的需求越來越苛刻，GPU也必須快速跟上。這方面，NVIDIA無疑是相當成功的，從架構到技術、從產品到市場都形勢良好，特別是架構上有專門的針對性設計，Tesla V100所用的「Volta」(伏特)就是最典型的。
AMD將於11月16日發布新款Instinct專業加速卡:CDNA架構首秀

: 超能網舉報　　據VideoCardz報導，AMD將於11月16日推出基於CDNA架構的新款專業加速卡
AMD公司CTO確認CDNA架構的Radeon Instinct MI100發布

AMD在2020年三月的財務分析日上，正式公布了其將在企業級市場推出為計算優化的全新CDNA架構，但並沒給出具體的時間表和產品信息。不過，就在今天早些時候傳來了新消息：AMD公司CTO Mark Papermaster在其社交媒體正式確認了首款採用CDNA架構的Radeon Instinct MI100加速卡將在2020年下半年發布。
AMD推出CDNA新顯卡架構面向數據計算中心

在近日的2020年金融分析師日活動中AMD帶來了全系的GPU架構：CDNA，與面向遊戲優化的RDNA機構不同，CDNA專門給數據計算中心提供支持，特別是Radeon Instinct加速器等。此外，CDNA將會使用Zen 2架構的Infinity Fabric互聯技術，而且對計算和張量操做出優化，這將會提高產品的學習和計算能力。據悉，CDNA將使用7nm工藝，預計亮相時間是2020年-2021年，而CDNA2機構還沒有確定工藝，只公布了路線圖。
Nvidia 發布全新計算卡 Tesla P40/P4:完整版 Pascal 架構

IT之家訊 9月14日消息，Nvidia CEO黃仁勳在北京舉行的GTC 2016大會上正式公布了新一代高性能計算卡Tesla P40、Tesla P4，將會專注於人工智慧、深度學習、神經網絡推演。
AMD發布首款CDNA架構GPU;PS5運行《原神》略勉強

舉報　　【科技犬】　　AMD 今天發布了 INSTINCT MI100 加速卡，
NVIDIA革命性新GPU架構「帕斯卡」:兩個新技術絕了!-NVIDIA,Pascal...

GeForce GTX Titan Z是克卜勒架構的登峰造極之作，麥克斯韋架構即將進入Tegra移動產品線，NVIDIA的下一代GPU架構也已經呼之欲出了，這就是劃時代的「Pascal」(帕斯卡)。根據路線圖，它將在2016年推出，仍然是兩年一代的節奏。
NVIDIA發布麥克斯韋計算卡Tesla M60:雙芯

舊金山舉行的年度虛擬化盛會VMware VMworld上，NVIDIA藉機發布了主要面向VDI虛擬桌面架構的新一代GRID 2.0雲圖形系統，和配套的新一代計算卡。NVIDIA 2012年推出了第一代GRID，當時其中的計算卡是基於克卜勒架構的Tesla K1/K2，分別基於GK104、GK107核心，而現在自然要升級到麥克斯韋架構了。
RTX 2080TI顯卡的圖靈架構是什麼?

性能的大幅升級之外，新一代顯卡最大的變化還是架構的更新。全新的圖靈架構，是新款顯卡的秘密武器。用老黃的話說：「圖靈架構是nvidia近十年來最偉大的發明之一」，不難看出圖靈架構的重要性。那麼什麼是圖靈架構呢？
老黃確認:英偉達新款遊戲卡和計算卡全部採用安培架構

IT之家5月14日消息根據外媒VideoCardz的消息，黃仁勳確認新款安培架構將用於遊戲卡和計算卡，而上一代的計算卡和遊戲卡架構是不同的，分別是伏特和圖靈。黃仁勳表示，這將簡化英偉達GPU陣容。在高性能計算(雙精度運算)方面，新款GPU將會達老款2.5倍。
AMD發布CDNA架構Instinct MI100加速顯卡加速百億億次級時代到來

北京時間11月16日晚10點，AMD正式發布了首款基於全新CDNA架構的Instinct MI100加速顯卡，以及配套的ROCm 4.0生態系統首次正式亮相的CDNA架構專門為高性能計算所打造，而基於該架構的AMD Instinct MI100
Volta 架構強化版?NVIDIA 圖靈架構將搶佔專業市場先機

根據老黃的說法，新架構具備極為強大的計算能力，把光線追蹤、Tensor Core 以及 RT Core 完全整合進架構當中，整體計算性能也要遠超過上一代遊戲與專業卡架構 Pascal，不過這次發表的圖靈架構暫時只有針對專業繪圖市場的產品發布。面向消費性娛樂市場的的產品可能要一周後的科隆遊戲展才會揭露。
Hotchips 31國際會議:AMD深度揭秘7nm Zen2及Navi架構

2019年的Hotchips國際大會將於8月18日在美國史丹福大學舉行，這是每年國際半導體晶片四大國際會議之一，主要聚焦於晶片架構今年在國際會議及活動上大出風頭，CEO蘇姿豐博士連續多次擔任主題演講嘉賓，這次的Hotchips也不例外，兩場主題演講中除了臺積電Philip Wong博士介紹新一代製程工藝之外，蘇姿豐也會發表《利用系統、軟體及矽晶片協同優化的高性能計算未來

AMD CDNA計算卡架構揭秘:從零起步、三殺NVIDIA

相關焦點

NVIDIA安培有對手了!AMD官宣第一款CDNA架構計算卡

AMD官宣CDNA架構計算卡 下半年與安培競爭

cdna - cdna_電子產品世界

AMD推出首款CDNA架構的計算加速卡Instinct MI100 一張卡就是一臺...

AMD全新GPU架構揭秘:從零起步 7nm工藝

NVIDIA發布基於圖靈架構的計算用卡

AMD宣布全新CDNA GPU架構:數據中心計算專用

AMD將於11月16日發布新款Instinct專業加速卡:CDNA架構首秀

AMD公司CTO確認CDNA架構的Radeon Instinct MI100發布

AMD推出CDNA新顯卡架構 面向數據計算中心

Nvidia 發布全新計算卡 Tesla P40/P4:完整版 Pascal 架構

AMD發布首款CDNA架構GPU;PS5運行《原神》略勉強

NVIDIA革命性新GPU架構「帕斯卡」:兩個新技術絕了!-NVIDIA,Pascal...

NVIDIA發布麥克斯韋計算卡Tesla M60:雙芯

RTX 2080TI顯卡的圖靈架構是什麼?

老黃確認:英偉達新款遊戲卡和計算卡全部採用安培架構

AMD發布CDNA架構Instinct MI100加速顯卡 加速百億億次級時代到來

Volta 架構強化版?NVIDIA 圖靈架構將搶佔專業市場先機

Hotchips 31國際會議:AMD深度揭秘7nm Zen2及Navi架構

AMD官宣CDNA架構計算卡下半年與安培競爭

AMD推出CDNA新顯卡架構面向數據計算中心

AMD發布CDNA架構Instinct MI100加速顯卡加速百億億次級時代到來