AI性能暴漲7倍,AMD發布新卡,英偉達祭出超算時代神器

2020-11-19 網易新聞

  【新智元導讀】AMD於昨晚正式發布了首款基於全新CDNA架構的Instinct MI100 GPU以及配套的ROCm 4.0生態系統,而英偉達也不甘示弱,於今日發布了 A100 80GB GPU,將支持NVIDIA HGX AI 超級計算平臺,內存比上一代提升一倍,能夠為研究人員和工程師們提供空前的速度和性能,助力實現新一輪AI和科學技術突破。

  AMD (超微半導體公司)昨夜正式推出其 AMD Instinct MI100 加速GPU晶片,這是一款新的圖形處理器處理器(GPU) ,在科學研究計算方面起著專門的加速器作用。

  這種 7nm GPU 加速器使用 AMD 的 CDNA 結構來處理高性能計算(HPC)和人工智慧任務,這樣科學家們就可以從事重負荷的計算任務,比如冠狀病毒研究。

  AMD 推出 Instinct MI100晶片,AI性能暴漲7倍

  AMD 公司表示,MI100晶片是世界上最快的高性能計算處理器 GPU,也是第一個性能超過10萬億次浮點運算的 x86 伺服器 GPU。

  

  該設備支持新的加速計算包括 AMD 的客戶:戴爾,技嘉,惠普和超微。

  

  AMD高級副總裁丹 · 麥克納馬拉在新聞發布會上說: 「高性能計算機在分析感染冠狀病毒、開發疫苗以及各種生命科學應用的可能性方面確實發揮了非常重要的作用」。

  MI100與第二代 AMD Epyc 處理器和 ROCm 4.0開放軟體相結合,旨在幫助科學家取得科學突破。

  用於圖形和企業的GPU

  今年3月,AMD發布了其首個專門針對數據中心高性能計算而設計的CDNA架構,與其Radeon的 RDNA 遊戲架構分道揚鑣。二者雖然還有一些共通點,但在設計、優化上已經在各自的領域裡有了不同的特色。

  Brad McCredie 在新聞發布會上說,有充足的證據顯示數據中心應用程式的 CPU 進度相對於 GPU 的進度已經放慢,而最近,通用的 GPU 也開始放慢它們的進度。

  這就是為什麼 AMD 將其設計工作分為消費者圖形處理器和企業/伺服器圖形處理器,因為圖形處理和人工智慧處理的需求可能非常不同。這種獨立的架構方法與英偉達僅使用一種架構的方法形成了鮮明的對比。

  

  AMD的內部人士也稱,不同的任務處理實際上並不需要共存,沒有必要用一個晶片去玩steam遊戲的同時也可以進行高級分子模擬、抗震分析或天體物理模擬。

  

  在命名方面,AMD也放棄了Radeon字樣,不再叫做Radeon Instinct,而是簡單改成 Instinct。

  

  Instinct MI100 是 AMD 史上性能最高的HPC GPU,FP64 雙精度浮點性能達到了 11.5 TFlops(也就是每秒1.15億億次),並在架構設計上專門加入了 Matrix Core(矩陣核心),用於加速HPC、AI運算。

  

  AMD稱其在混合精度和FP16半精度的AI負載上,性能提升接近7倍,為 AI 和機器學習工作負載提供 FP32 Matrix 單精度矩陣計算為 46.1TFlops(每秒4.61億億次),FP16 Matrix 半精度矩陣計算為 184.6TFlops(每秒18.46億億次),Bfloat16 浮點為92.3TFlops(每秒9.23億億次)的性能。

  

  軟體開放平臺ROCm 4.0

  AMD的 ROCm 開發者軟體為百萬兆等級的運算提供了基礎,ROCm 4.0已經進行了優化,以便為基於 MI100的系統提供大規模的性能。

  

  2018年AMD發布了 ROCm 的2.0版本,到2019年又發布了專注於機器學習和深度學習的3.0版本,再到昨晚最新發布的4.0版本,ROCm 已經打造成了完整的針對機器學習和高性能計算的開發方案,漸漸形成了一個完整的生態,用於各個領域的高性能計算。

  

  既然AMD發布了MI100,那老對手自然也不會缺席。

  AMD這款晶片的競爭對手是80GB 版本的 Nvidia A100 GPU,該GPU也於今天發布。

  英偉達 A100 80GB新卡,與AMD新品正面剛

  該晶片基於英偉達的 Ampere 圖形架構,旨在通過實現更好的實時數據分析,幫助企業和政府實驗室更快地做出關鍵決策。

  

  A100 80GB 版本的內存是六個月前推出的上一代的兩倍。

  Nvidia 高管帕雷什卡亞(Paresh Kharya)在新聞發布會上表示: 英偉達已經將這個系統的所有功能加倍,以便更有效地為客戶服務。

  同時他還說道,世界上90% 的數據是在過去兩年中創建的

  A100 晶片為研究人員和工程師提供了更快的速度和更高的性能,用於人工智慧和科學應用。它提供超過每秒2 terabytes的內存帶寬,這使得系統能夠更快地將數據提供給 GPU。

  「超級計算已經發生了深刻的變化,從專注於模擬擴展到人工智慧超級計算,數據驅動的方法現在正在補充傳統的模擬,」 Kharya 說,他還補充說道,「Nvidia 的端到端的超級計算方法,從模擬的工作流到人工智慧,是必要的保持進步」。

  

  Nvidia A100 80GB GPU 可在 Nvidia DGX A100和 Nvidia DGX Station 系統上使用,預計將在本季度出貨。

  Nvidia今天還宣布,新晶片將與 AMD 新推出的 Instinct MI100 GPU 競爭。與 AMD 相比,Nvidia 有一個單一的 GPU 架構,既可用於人工智慧,又可用於圖形處理。

  有國外的分析師認為,AMD GPU 的性能比 Nvidia 最初的40GB A100提高了18% 。但他說真正的應用程式可能會受益於80GB 的 Nvidia 版本。同時他還表示,雖然價格敏感的客戶可能青睞 AMD,但他認為 AMD 在人工智慧性能方面無法與 Nvidia 抗衡。

  在人工智慧領域,英偉達再次提高了門檻,幾乎沒有任何競爭對手能夠跨越這一障礙。

  

  對於AI 訓練,像 DLRM 這樣的推薦系統模型擁有代表數十億用戶和數十億產品的大型表格。A100 80gb 提供了高達3倍的加速,因此企業可以迅速重新訓練這些模型,以提供高度準確的建議。A100 80GB 還可以在單個 HGX 驅動的伺服器上訓練最大的模型,比如 GPT-2等。

  Nvidia 說,A100 80GB 消除了對數據或模型並行體系結構的需求,這些體系結構實現起來很費時間,跨多個節點運行起來很慢。

  通過其多實例 GPU (MIG)技術,A100可以被劃分為多達7個 GPU 實例,每個實例擁有10GB 的內存。這提供了安全的硬體隔離,並最大限度地利用 GPU 的各種較小的工作負載。

  而A100 80GB 與AMD的晶片一樣,同樣可以為科學應用提供加速,比如天氣預報和量子化學。

  GPU的新系統DGX

  Nvidia 還發布了第二代人工智慧計算系統,命名為 Nvidia DGX Station A100,該公司稱其為「盒子中的數據中心」。DGX 提供了2.5千兆次的AI性能,有4個A100的張量核心GPU。總而言之,它有高達320GB的GPU內存。

  

  Nvidia 副總裁 Charlie Boyle 在一次新聞發布會上說,該系統提供了多達28個不同的 GPU 實例來運行並行作業。

  使用 DGX Station 平臺的客戶遍及教育、金融服務、政府、醫療保健和零售業。其中包括寶馬集團、德國 DFKI 人工智慧研究中心、洛克希德 · 馬丁公司、 NTT Docomo 和太平洋西北國家實驗室。本季度將提供 Nvidia DGX Station A100和 Nvidia DGX A100 640GB 系統。

  Mellanox網絡

  

  最後,Nvidia 發布了 Mellanox 400G Infiniband 網絡,用於 exascale AI 超級計算機。2019年,Nvidia 以68億美元收購了 Mellanox。

  這已經是第七代 Mellanox InfiniBand 技術,數據傳輸速度為每秒400千兆比特,而第一代技術為每秒10千兆比特。

  InfiniBand 技術提供的網絡吞吐量為每秒1.64 petabits,是上一代的5倍。Nvidia 高級副總裁 Gilad Shainer 在新聞發布會上說,Mellanox 的技術將使從超級計算機到自動駕駛汽車的所有東西都能更快地聯網。

  比爾蓋茨在微軟創立之初曾說希望每個家庭都能有一臺PC,或許通過AMD和英偉達不斷推進的研發,未來的每個家庭都能有自己的一個「超算中心」。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關焦點

  • 性能漲7倍,AMD發布Instinct MI100新卡,英偉達祭出超算時代神器
    【新智元導讀】AMD於昨晚正式發布了首款基於全新CDNA架構的Instinct MI100 GPU以及配套的ROCm 4.0生態系統,而英偉達也不甘示弱,於今日發布了 A100 80GB GPU,將支持NVIDIA HGX AI 超級計算平臺,內存比上一代提升一倍,能夠為研究人員和工程師們提供空前的速度和性能,助力實現新一輪AI和科學技術突破。
  • 用「AI核彈」飽和攻擊的英偉達,如何贏下AI計算新賽場?
    在此之前,深度學習「如何出圈」的一大挑戰,就是深度神經網絡訓練面臨算力不足的難題。而讓AlexNet實現算力突破的關鍵,就在於當時研究者使用了英偉達的GPU。GPU一戰成名,成為伴隨AI技術一同進化的基礎設施。英偉達也同時抓住了AI計算的新增長機遇。隨著AI算力要求的爆炸式增長,英偉達GPU產品系列也經歷了多輪的升級。
  • AI時代的摩爾定律?黃氏定律預測AI性能將逐年翻倍
    英偉達稱,MAGNet生成的AI推理加速器在模擬測試中,能夠達到每瓦 100 tera ops 的推理能力,比目前的商用晶片高出一個數量級。之所以能夠實現數量級的性能提升,主要是因為MAGNet採用了一系列新技術來協調並控制通過設備的信息流,最大限度地減少數據傳輸。
  • 業界 英偉達正式發布GeForce GTX 1080Ti:性能提升35%
    今天,英偉達正式發布了 GeForce GTX 1080TI 顯卡,其 Pascal 架構產品線又增添了一個新成員。
  • 系統功耗吊打英偉達T4!賽靈思發布U30加速器卡,主打視頻直播
    本周三,賽靈思推出了適應於視頻轉碼的實時伺服器一體機參考架構,同時發布了一款全新加速器卡Alveo U30,U30作為賽靈思Alveo系列加速器卡的最新產品,注重實現高通道密度,這也是自賽靈思提出「數據中心優先」戰略以來的又一次突破。
  • 超越英偉達的,不會是另一款GPU——鯤雲數據流架構AI晶片利用率...
    第三方測試數據顯示僅用1/3的峰值算力,CAISA晶片可以實現英偉達T4最高3.91倍的實測性能。鯤雲科技的定製數據流技術不依靠更大的晶片面積和製程工藝,通過數據流動控制計算順序來提升實測性能,為用戶提供了更高的算力性價比。
  • 英偉達發布新一代旗艦顯卡Titan V:Volta架構,售價3000美元
    在今天 NIPS 2017 大會的活動中,英偉達 CEO 黃仁勳發布了最新一代 Titan 顯卡 Titan V,售價 3000 美元。NVIDIA Titan V 集成了英偉達最新一代 GPU 技術,採用 Volta GPU 架構 GV100,製程進入 12nm,同時擁有 12 GB 的 HBM2 顯存。
  • WSJ:AMD就收購賽靈思進行深入談判
    晶片設計方面頻頻出現的問題導致新產品延遲發布,AMD的市場份額、收入和利潤節節下降,使償還ATI交易產生的債務變得越來越困難。 2014年蘇姿豐接手時,AMD的股價只有大約為2美元,2015年甚至跌落歷史最低點1.61美元,分析人士一度懷疑AMD是否可以生存下去。
  • 英偉達推出RTX 30系列顯卡,性能翻倍,價格亮了
    作者 | 吳優經歷了漫長的等待,終於在今天,英偉達CEO黃仁勳在自己廚房發布了英偉達最新一代GeForce RTX 30系列顯卡,包括GeForce RTX 3070、RTX 3080和RTX 3090。
  • 性能超A100 AMD的Instinct MI100加速卡開賣:只要4.8萬元
    在推出7nm RDNA2架構的RX 6000系列遊戲卡之後,AMD前不久還推出了CDNA架構的Instinct MI100加速卡,主打高性能計算。CDNA架構跟遊戲用的RDNA架構分家了,重點強化了FP64雙精度運算,同時還增加了Matrix Core(矩陣核心),用於加速HPC、AI運算,號稱在混合精度和FP16半精度的AI負載上,性能提升接近7倍。
  • AMD、英特爾、英偉達、高通震撼對決
    AMD「史上最強」Ryzen Mobile 4000:臺積電7nm,能效翻倍AMD CEO蘇姿豐亮相CES 2020, 發布新一代7納米移動處理器CPU核心數量是上一代Ryzen 3000的2倍,不過CU數量減少了3個,但是AMD有減少的原因,並表示由於處理節點的改進,新系列的8個CU的性能可以優於去年的11個CU。 按照TDP的差異,Ryzen Mobile 4000分為兩個系列,都基於相同的8核晶片,分為15W低壓(U系列)和45 W標壓(H系列)。
  • 直擊現場丨三個月股票暴跌40%,英偉達CEO黃仁勳在蘇州是這樣回應的......
    英偉達因為AI時代到來股價「一飛沖天」,在過去的三年裡股價暴漲了10倍,現在的暴跌是否意味著英偉達的輝煌時代過去了嗎?黃教主將給業界什麼樣的答案,備受關注。GTC CHINA 2018舉行三天,共辦70餘場專業的技術講座,與會人數預計將超過8000人,主要圍繞深度學習與 AI 框架與研究、開發工具、加速數據科學、數據中心和雲計算基礎架構、HPC 和超算、智能機器與物聯網和機器人、自動駕駛、專業圖形應用、工業製造與建築工程等領域的最新研究成果和創新發現,以及電信、醫療、金融等戰略產業中的最新實踐經驗和解決方案。
  • 桌上型電腦CPU性能天梯圖 AMD性能首次反超intel
    不過就總體性能來說,還是桌上型電腦性能更強悍。桌上型電腦以更強悍的性能,更大的屏幕顯示器,在辦公和遊戲方面,仍然是主力。特別是遊戲體驗方面,桌上型電腦比手機平板的體驗,更出色。經典的桌上型電腦遊戲也是層出不窮,如生化危機2重製版、只狼:影逝二度、怪物獵人世界:冰原、部落與彎刀、使命召喚16:現代戰爭、極品飛車21:熱度等。眾多的精彩遊戲,同時也讓桌上型電腦更受關注。
  • 美國的最新禁運,會讓中國下代超算遭致命打擊?告訴你實情!
    要知道,在僅僅一年前的2018年6月,中國在TOP500中的超算總數還是206臺,美國還是124臺。這一年中,中國又有了進步,美國又在退步。從趨勢來看,中國的優勢會越來越大。由於超算在軍事,科研和經濟中的巨大作用,美國心裡的焦慮是可以理解的。他們急於抑制住中國的發展勢頭,於是就把商業誠信和公平貿易原則仍進下水道,祭出了禁運大法。
  • GPU大廠英偉達的AI造夢空間
    1993年英偉達成立,瞄準遊戲晶片市場,以GPU為鉚點,不斷發展圖形渲染能力,並在之後的幾年,成長為遊戲顯卡界的巨擎。 與此同時,GPU的出現為AI計算帶來了新的動力。英偉達通過一系列手段支持AI技術發展,打造性能、構架更高效的GPU,即「通用AI處理器」。近十年來,GPU長足發展,其在深度學習領域擁有的數據處理能力,極大拓展了AI的應用場景。 AI江湖,硝煙四起。
  • 英偉達扔出20枚「AI核彈」!540億個電晶體的GPU,一個機櫃秒數據中心
    20、法拉第未來將在其旗艦超豪華FF 91電動車上部署NVIDIA DRIVE AGX Xavier平臺。下面來看這20處新訊具體有哪些亮點。▲NVIDIA計算卡進化歷程一、安培新卡:一統訓練、推理和數據分析!
  • 英偉達Volta架構深度解讀:專為深度學習而生的Tensor Core到底是什麼?
    在 2017 GPU 技術大會(GTC 2017)上,英偉達 CEO 黃仁勳正式發布了新一代處理器架構 Volta,以及使用新架構的第一款設備——適用於深度學習任務的加速卡 Tesla V100,英偉達將這塊顯卡稱為全球最先進的數據中心 GPU。
  • Netflix 將拍《三體》,吳宇森聯合製片;英偉達「新核彈」3899 起;Zoom 股價暴漲,市值超 IBM | 極客早知道
    英偉達發布新 RTX 30 系顯卡:全新安培架構,支持 8K60 幀遊戲 北京時間 9 月 2 日凌晨,NVIDIA 正式發布了全新一代基於 Ampere 安培架構的 GeForce RTX 30 系列顯卡,首發包括 RTX
  • Ampere架構新特性解析:全方位升級帶來性能暴漲
    [PConline 雜談]隨著RTX 3080顯卡的性能解禁,關於NVIDIA Ampere架構和RTX 30系列顯卡的相關信息也可以更多地披露出來,今天我們就根據我們實測和官方提供的信息,跟大家一起剖析一下新架構顯卡性能暴漲的秘密。
  • 聯手英特爾、英偉達、AMD 順網科技或成國內雲電腦第一平臺
    進入z世代,英偉達、AMD和英特爾之間競爭日益激烈,圍繞著下一代的CPU和GPU,展開了一場高度戰略性的競爭。AMD於今年推出了銳龍4000系列處理器,當用戶們「AMD,YES!」的口號甚囂塵上,老黃的刀法與英特爾的牙膏似乎再也不能有恃無恐。隨即英偉達發布RTX 30系列的三款顯卡,英特爾踩爆了牙膏,發布第11代酷睿處理器,宣告三方競爭進入白熱化。