NVIDIA在最新MLPerf基準測試中打破16項AI性能紀錄

2020-11-26 同花順金融服務網

  圖註:在不到一個月的時間裡,內置超過2,000個NVIDIA A100 GPU的NVIDIA全新DGX SuperPOD(上圖為藝術渲染圖)就在市售商用產品中脫穎而出,並在各項針對大規模計算性能的MLPerf基準測試中均取得了優異成績。

  飛象網訊(源初/文)根據昨日發布的MLPerf基準測試結果顯示,NVIDIA在全球市售商用產品中,具備全球最快的AI訓練性能。

  A100 Tensor Core GPU在加速器的全部八項MLPerf基準測試中展現了最快的性能。在實現總體最快的大規模解決方案方面,利用HDR InfiniBand實現多個DGX A100 系統互聯的龐大集群--DGX SuperPOD系統在性能上,也開創了八項全新裡程碑。當今,能夠藉助這些高性能的AI技術來更快速、更具成本效益地實現業務轉型的客戶,將成為最終的獲益者。

  行業基準測試組織MLPerf成立於2018年5月。此次已是NVIDIA在MLPerf訓練測試中連續第三次展現了最強勁的性能。2018年12月,NVIDIA首次在MLPerf訓練基準測試中創下了六項紀錄,次年7月NVIDIA再次創下八項紀錄。

  NVIDIA在客戶最關心的市售商用產品類別中創下了紀錄。NVIDIA在測試中用到的產品基於最新NVIDIA Ampere架構以及Volta架構。

  圖註:NVIDIA DGX SuperPOD系統為大規模AI訓練樹立全新裡程碑。

  NVIDIA是唯一一家在所有測試中均採用市售商用產品的公司。其他大多數提交使用的要麼是預覽類別(preview category),其所用的產品預計需要幾個月後才會面市,要麼使用的是研究類別的產品,更是較長一段時間內都不會面市。

  NVIDIA Ampere市場採用速度刷新紀錄

  A100是首款基於NVIDIA Ampere架構的處理器。它不僅打破了性能紀錄,其進入市場的速度也比以往任何NVIDIA GPU更快。A100在發布之初用於NVIDIA的第三代DGX系統。正式發布僅六周後,A100就正式登陸了Google Cloud 。

  為助力滿足市場的強勁需求,AWS、百度雲、微軟Azure和騰訊雲等全球領先的雲提供商,以及Dell Technologies、HPE、浪潮和超微等數十家主要伺服器製造商,均採用了A100。

  全球用戶都在使用A100以應對AI、數據科學和科學計算中最為複雜的挑戰。

  其中有些正在賦能新一代的推薦系統或對話式AI應用,或進一步探索COVID-19的治療方法,這些都在受益第八代NVIDIA GPU所帶來的迄今為止幅度最大的性能提升。

  圖註:NVIDIA Ampere架構在市售商用加速器的全部八項測試中名列前茅。

  一年半內實現4倍性能提升

  最新結果表明,NVIDIA聚焦於不斷發展跨處理器、網絡、軟體和系統的AI平臺。

  例如,測試結果顯示,相較於首輪MLPerf訓練測試中使用的基於V100 GPU的系統,如今的DGX A100系統能夠以相同的吞吐率,實現高達4倍的性能提升。同時,得益於最新的軟體優化,基於NVIDIA V100的DGX-1 系統亦可實現高達2倍的性能提升。

  不到兩年,整個AI平臺的創新就取得了如此優異的成績。如今,NVIDIA A100 GPU搭配CUDA-X庫的軟體更新,為通過Mellanox HDR 200Gb/s InfiniBand網絡構建的擴展集群注入了強勁動力。

  HDR InfiniBand可實現極低的延遲和高數據吞吐量,同時通過可擴展分層聚合和縮減協議(SHARP)技術,提供智能深度學習計算加速引擎。

  圖註:NVIDIA持續通過全新GPU、軟體升級和不斷擴展的系統設計,以提升AI性能。

  NVIDIA在推薦系統、對話式AI、強化學習領域大放異彩

  MLPerf基準測試得到了亞馬遜、百度、Facebook、谷歌、哈佛大學、英特爾、微軟和史丹福大學等機構的支持,並跟隨AI的發展步伐持續演進。

  最新基準測試包含兩項新的測試和一項經大幅修訂的測試。NVIDIA在這三項測試中均取得了優異的成績。其中,一項基準測試對推薦系統的性能進行了排名。推薦系統是日益普及的一項AI任務。另一項基準測試對使用BERT的對話式AI進行了測試。BERT是現有最複雜的神經網絡模型之一。最後,強化學習測試中使用了Mini-go和全尺寸19x19 圍棋棋盤。該測試是本輪最複雜的測試,內容涵蓋從遊戲到訓練的多項操作。

  圖註:使用面向對話式AI和推薦系統的NVIDIA AI解決方案的客戶。

  各大公司在這些戰略性的AI應用領域已經受益於NVIDIA帶來的強大性能。

  阿里巴巴在11月的「雙十一」期間創造了380億美元的銷售紀錄,其推薦系統使用了NVIDIA GPU,使每秒查詢量達到了CPU的100倍以上。而對話式AI自身也成為了業界關注的焦點,推動從金融到醫療健康等行業的業務發展。

  NVIDIA不僅能為這些龐大工作的運轉提供所需的性能,還使其易於使用。

  軟體為AI的戰略發展鋪平道路

  今年五月,NVIDIA發布了兩個應用框架――用於對話式AI的Jarvis和用於推薦系統的Merlin。 Merlin中包含了助力最新MLPerf基準測試結果的HugeCTR訓練框架。

  這些應用框架僅僅是一部分。在不斷壯大的應用框架中,還有面向汽車行業市場的NVIDIA DRIVE,面向醫療健康市場的Clara,面向機器人技術市場的Isaac,以及面向零售/智能城市市場的Metropolis。

  圖註:NVIDIA應用框架簡化了企業級AI的開發和部署。

  DGX SuperPOD架構兼顧速度與規模

  NVIDIA在Selene上運行了系統的MLPerf測試,Selene是基於DGX SuperPOD的內部集群。DGX SuperPOD是針對大規模GPU集群的公共參考架構,可在數周內完成部署。該架構基於DGX POD的設計原理和最佳實踐進行了擴展,致力於解決當今AI領域最具挑戰性的難題。

  Selene最近在TOP500榜單中首次亮相,憑藉百億億次(exaflops)級別的AI性能,成為美國最快的工業系統。它也是Green500榜單中全球第二大節能系統。

  客戶已經採用這些參考架構來構建自身的DGX POD和DGX SuperPOD。其中包括美國最快的學術領域AI超級計算機HiPerGator,該超級計算機也將成為佛羅裡達大學跨學科AI創新的基石。

  同時,全球領先的超算中心Argonne國家實驗室正在使用DGX A100,尋找抗擊COVID-19疫情的方法。Argonne國家實驗室是六個首批採用A100 GPU的高性能計算中心中的先行者之一。

  圖註:NVIDIA DGX POD的廣泛採用。

  DGX SuperPOD現已助力汽車領域的大陸集團、航空航天領域的Lockheed Martin和雲計算服務領域的微軟等公司取得了良好的業務成果。

  這些系統的順利運轉,部分得益於其廣泛的生態系統對於NVIDIA GPU和DGX支持。

  NVIDIA生態系統在MLPerf基準測試中展示傲人成績

  在提交結果的九家公司中,除NVIDIA外還有六家公司提交了基於NVIDIA GPU的測試結果,其中包括三家雲服務提供商(阿里雲、谷歌雲和騰訊雲)和三家伺服器製造商(戴爾、富士通和浪潮),凸顯了NVIDIA生態系統的優勢。

  圖註:採用NVIDIA AI平臺參與基準測試的合作夥伴。

  這些合作夥伴大多採用了NVIDIA軟體中心NGC中的容器,以及用於參賽的公開框架。

  包括這些MLPerf合作夥伴在內的近二十家雲服務提供商和OEM組成的生態系統,已採用或計劃採用NVIDIA A100 GPU來打造在線實例、伺服器和PCIe卡。

  經測試驗證的軟體現可從NGC獲取

  現在,大多數NVIDIA及其合作夥伴在最新MLPerf基準測試中使用的軟體,已可通過NGC獲取。

  NGC中包括多個GPU優化的容器、軟體腳本、預訓練模型和SDK,可助力數據科學家和開發者在TensorFlow和PyTorch等常用框架上加速AI工作流程。

  各機構都在大力採用容器,以加速實現業務成果。畢竟,業務成果才是最終的「基準」。

關注同花順財經(ths518),獲取更多機會

責任編輯:jdm

相關焦點

  • 驍龍888官方基準測試成績出爐,整體性能同麒麟9000相當
    高通表示,根據高通公司對綜合基準測試結果的長期觀察發現,基準測試僅能測試部分用例,無法全方位反應驍龍移動平臺支持的包括連接、拍照、音頻、電池續航和充電速度等在內的其他體驗,而且第三方終端測試人員無法使用最新旗艦移動平臺參考設計進行實測,所以高通自己整理了部分測試結果,且每一項結果都是在驍龍888參考設計上實際運行,最終分數取三次測試結果的平均值。
  • 連續打破16項世界紀錄!淺談永遠的「鬼怪II」——F-4
    改進後的F-4「鬼怪II」,性能達到了日本航空自衛隊的要求,以至於即使新的F-2戰鬥機不斷服役之後,日本仍然保有大批的F-4 EJ機隊,也並不急於一時將其全部退役,直到前不久最後一架F-4「鬼怪」退出現役,F-4已經成為日本航空自衛隊中服役時長最久的戰鬥機。
  • AI時代的摩爾定律?黃氏定律預測AI性能將逐年翻倍
    AI性能將逐年翻倍受疫情影響,一年一度展示英偉達最新技術、產品和中國合作夥伴成果的GTC China改為線上舉行,黃仁勳缺席今年的主題演講,由英偉達首席科學家兼研究院副總裁Bill Dally進行分享。
  • OpenAI追蹤AI模型效率:每16個月翻一番!超越摩爾定律
    編 | 儲信儀導語:OpenAI提出衡量機器學習算法進展的基準測試方法,算法效率每16月翻一番,智東西5月6日消息,昨日,OpenAI宣布將開始追蹤效率最高的機器學習模型,該舉措推出了新的評價指標,可用以量化模型的擴展規模和整體性能,從而可實時公示效率最高的模型,為行業提供參考。
  • 華碩伺服器勇創578項SPEC記錄
    近日,經標準效能評估公司(SPEC,www.spec.org)確認,華碩伺服器創下578項新紀錄的基準測試結果,在運算效能領域處於前列。同時華碩擁有的紀錄比其他廠商都多出30%以上,成為SPEC CPU® 2017基準測試的單插槽(1P)與雙插槽(2P)領域擁有多項紀錄的廠商。
  • OpenAI官宣AI算法效率每16個月翻一番
    報告分析顯示,自2012年以來,要訓練一個人工智慧模型在基準測試ImageNet圖像分類任務中達到同等的分類效果,所需的算力每16個月就會減少1/2。    重要的是要找到方法,闡明整個算法演進的過程,儘管這比衡量計算趨勢更難,」OpenAI 在官網文章中寫道。提升算法效率,可以定義為減少訓練算法完成某項任務所需的算力。在很多其他領域都可以對效率進行比較,比如 DNA 測序(每10個月翻一番)、能源再生(每6年翻一番)和電晶體密度(每2年翻一番)。
  • 《復仇者聯盟4》在臺熱映 臺媒:5天打破臺灣影史16項紀錄
    【環球網報導 記者 付國豪】美國好萊塢電影《復仇者聯盟4:終局之戰》(下稱《復仇者聯盟4》)在大陸票房「坐火箭」,打破多項票房紀錄。在臺灣,該片24日上映後也熱度狂飆5天內連破了臺灣地區的16項影史紀錄。
  • AI在這張「問卷」上首次超越人類,SuperGLUE被微軟谷歌「攻破」
    在最新的NLU測試基準SuperGLUE中,人類首次被AI超越了。SuperGLUE相比「前輩」GLUE大大提升了問題的難度,提出一年多以來,人類一直處於第一位。現如今,人類一下子被兩家AI超越。一個是來自微軟的DeBERTa,一個是來自谷歌的T5+Meena。
  • 英特爾Rocket Lake Core i9-11900 8核CPU基準測試成績再次曝光
    目前Bilibili(通過Videocardz)已經洩露了該CPU的最新基準測試,展示了單線程領先於當前英特爾產品。英特爾Corei9-11900是眾多Rocket Lake臺式機CPU中的一員,將出現在11代產品線中。Core i9-11900是Core i9-11900K的低TDP變種。
  • 驍龍888機和A14基準測試 差距之大讓人驚訝
    打開APP 驍龍888機和A14基準測試 差距之大讓人驚訝 玩機小子 發表於 2020-12-20 09:44:51 在月初高通發布驍龍888之後,首批安卓廠商都開始忙碌了起來,沒出現在名單中的三星近日也官宣了,作為安卓陣營新一代旗艦晶片,驍龍888不管是在功耗控制,還是在性能方面都有了較大改進,並且集成了高通最新X60基帶,這點比iPhone 12上的X55基帶更先進。
  • 英偉達RTX 3060 Ti官方性能基準測試洩露 將於12月2日推出
    11 月 17 日消息 英偉達官方的 GeForce RTX 3060 Ti 顯卡性能基準測試被外媒 Videocardz 洩露了出來。數據顯示,GeForce RTX 3060 Ti 在各方面的表現似乎都比基於圖靈的 GeForce RTX 2080 SUPER 要好,這將使它成為一款相當不錯的 1080p 甚至 1440p 遊戲顯卡。
  • 9項可能永遠不會被打破的世界紀錄
    當觀看體育比賽的時候,你或許已經習慣紀錄被打破的情況發生了。但是人類對於極限的追求可不僅僅只在於體育項目,這就是金氏世界紀錄存在的原因。在世界各地,有著很多看起來很奇怪的世界紀錄。這一次,我們就要介紹,9項可能永遠不會被打破的世界紀錄。
  • Zen3超頻神器 ROG C8DH主板獲15項全球第一
    一舉打破1項世界紀錄,斬獲15項全球第一,並將16核心的AMD銳龍9 5950X處理器成功超頻至全核6075MHz,可以說是新一代Zen3處理器當之無愧的超頻神器!    超頻團隊safedisk使用ROG C8DH主板搭載AMD 銳龍9 5950X處理器,在液氮環境中打破GeekBench 4單核世界紀錄,同時在進行GPUPI 3.2 1B測試時創下了16核心全核6075MHz的超頻紀錄
  • 打破吉尼斯紀錄,200+小時不熄火,長安憑啥「鯨」動世界?
    不過,長安想到了一個好辦法,在12月16日,就以「鯨動世界」長安藍鯨發動機挑戰金氏世界紀錄為主題,進行了一場直播活動。打算用超出日常使用範疇的超長持續時間和超高強度,模擬出長期高公裡數後的發動機狀態,來證明自己。
  • 打破9項全國紀錄 超3項世界紀錄 男子舉重全錦賽佳績搶眼
    打破9項全國紀錄 超3項世界紀錄 男子舉重全錦賽佳績搶眼 2020年10月30日09:37 來源:人民網-人民日報 作者:牛夢彤 王恆志   10月25日,為期4
  • 打破吉尼斯紀錄,200+小時不熄火,長安發動機憑啥「鯨」動世界?
    不過,長安想到了一個好辦法,在12月16日,就以「鯨動世界」長安藍鯨發動機挑戰金氏世界紀錄為主題,進行了一場直播活動。打算用超出日常使用範疇的超長持續時間和超高強度,模擬出長期高公裡數後的發動機狀態,來證明自己。
  • MacBook Air M1詳細基準與性能評測:最適合大多數人使用的Mac
    毫無疑問,您已經看到了在過去幾天中出現的一些基準,這些基準讓社區中的許多人大吃一驚。雖然蘋果確實在自己的媒體上大肆宣傳了業績,但如果沒有更具體的基準,就很容易低估這些數字。我們已經把對這三個系統的測試分到了三個編輯器中,可以很有把握地說,我們被這三個系統所能做的事情震驚了。
  • 中國人保持的田徑世界紀錄還有幾項?有一恐怖紀錄27年無人打破
    其次是因為在綜合性大賽中,田徑的金牌是最多的。1978年國際田聯恢復了中國田徑協會在該會的合法地位以來,中國田徑也湧現出許多世界名將,第一個打破世界跳高記錄的朱建華,第一個拿到田徑金牌心理陳躍玲,震驚全球的「馬家軍」,110米世界冠軍劉翔等等。田徑史上,一些紀錄塵封多年,創造了它們的運動員們成為傳奇。今天,盤點一下,中國人保持的田徑世界紀錄還有哪幾項。
  • NVIDIA TITAN V遊戲性能首曝 比1080Ti提升27%
    昨天NVIDIA公布的新顯卡TITAN V讓業界又驚又喜,大家都迫切希望知道這張售價2萬元的「核彈」有著怎樣的表現,今天Reddit論壇的成員MrOmgWtfHaxor分享了關於TITAN V的首個遊戲測試
  • 蘋果A6性能測試
    性能測試上也可以看出。   第二項是Sunspider JS Benchmark測試,該工具目前最流行的JavaScript測試工具之一 。   接下來到GPU部分,Anandtec表示蘋果16晶片的GPU圖形處理性能幾乎與iPad 3持平。