NVIDIA在最新MLPerf基準測試中打破16項AI性能紀錄

2020-11-26 同花順金融服務網

　　圖註：在不到一個月的時間裡，內置超過2,000個NVIDIA A100 GPU的NVIDIA全新DGX SuperPOD（上圖為藝術渲染圖）就在市售商用產品中脫穎而出，並在各項針對大規模計算性能的MLPerf基準測試中均取得了優異成績。

　　飛象網訊（源初/文）根據昨日發布的MLPerf基準測試結果顯示，NVIDIA在全球市售商用產品中，具備全球最快的AI訓練性能。

　　A100 Tensor Core GPU在加速器的全部八項MLPerf基準測試中展現了最快的性能。在實現總體最快的大規模解決方案方面，利用HDR InfiniBand實現多個DGX A100 系統互聯的龐大集群--DGX SuperPOD系統在性能上，也開創了八項全新裡程碑。當今，能夠藉助這些高性能的AI技術來更快速、更具成本效益地實現業務轉型的客戶，將成為最終的獲益者。

　　行業基準測試組織MLPerf成立於2018年5月。此次已是NVIDIA在MLPerf訓練測試中連續第三次展現了最強勁的性能。2018年12月，NVIDIA首次在MLPerf訓練基準測試中創下了六項紀錄，次年7月NVIDIA再次創下八項紀錄。

　　NVIDIA在客戶最關心的市售商用產品類別中創下了紀錄。NVIDIA在測試中用到的產品基於最新NVIDIA Ampere架構以及Volta架構。

　　圖註：NVIDIA DGX SuperPOD系統為大規模AI訓練樹立全新裡程碑。

　　NVIDIA是唯一一家在所有測試中均採用市售商用產品的公司。其他大多數提交使用的要麼是預覽類別（preview category），其所用的產品預計需要幾個月後才會面市，要麼使用的是研究類別的產品，更是較長一段時間內都不會面市。

　　NVIDIA Ampere市場採用速度刷新紀錄

　　A100是首款基於NVIDIA Ampere架構的處理器。它不僅打破了性能紀錄，其進入市場的速度也比以往任何NVIDIA GPU更快。A100在發布之初用於NVIDIA的第三代DGX系統。正式發布僅六周後，A100就正式登陸了Google Cloud 。

　　為助力滿足市場的強勁需求，AWS、百度雲、微軟Azure和騰訊雲等全球領先的雲提供商，以及Dell Technologies、HPE、浪潮和超微等數十家主要伺服器製造商，均採用了A100。

　　全球用戶都在使用A100以應對AI、數據科學和科學計算中最為複雜的挑戰。

　　其中有些正在賦能新一代的推薦系統或對話式AI應用，或進一步探索COVID-19的治療方法，這些都在受益第八代NVIDIA GPU所帶來的迄今為止幅度最大的性能提升。

　　圖註：NVIDIA Ampere架構在市售商用加速器的全部八項測試中名列前茅。

　　一年半內實現4倍性能提升

　　最新結果表明，NVIDIA聚焦於不斷發展跨處理器、網絡、軟體和系統的AI平臺。

　　例如，測試結果顯示，相較於首輪MLPerf訓練測試中使用的基於V100 GPU的系統，如今的DGX A100系統能夠以相同的吞吐率，實現高達4倍的性能提升。同時，得益於最新的軟體優化，基於NVIDIA V100的DGX-1 系統亦可實現高達2倍的性能提升。

　　不到兩年，整個AI平臺的創新就取得了如此優異的成績。如今，NVIDIA A100 GPU搭配CUDA-X庫的軟體更新，為通過Mellanox HDR 200Gb/s InfiniBand網絡構建的擴展集群注入了強勁動力。

　　HDR InfiniBand可實現極低的延遲和高數據吞吐量，同時通過可擴展分層聚合和縮減協議（SHARP）技術，提供智能深度學習計算加速引擎。

　　圖註：NVIDIA持續通過全新GPU、軟體升級和不斷擴展的系統設計，以提升AI性能。

　　NVIDIA在推薦系統、對話式AI、強化學習領域大放異彩

　　MLPerf基準測試得到了亞馬遜、百度、Facebook、谷歌、哈佛大學、英特爾、微軟和史丹福大學等機構的支持，並跟隨AI的發展步伐持續演進。

　　最新基準測試包含兩項新的測試和一項經大幅修訂的測試。NVIDIA在這三項測試中均取得了優異的成績。其中，一項基準測試對推薦系統的性能進行了排名。推薦系統是日益普及的一項AI任務。另一項基準測試對使用BERT的對話式AI進行了測試。BERT是現有最複雜的神經網絡模型之一。最後，強化學習測試中使用了Mini-go和全尺寸19x19 圍棋棋盤。該測試是本輪最複雜的測試，內容涵蓋從遊戲到訓練的多項操作。

　　圖註：使用面向對話式AI和推薦系統的NVIDIA AI解決方案的客戶。

　　各大公司在這些戰略性的AI應用領域已經受益於NVIDIA帶來的強大性能。

　　阿里巴巴在11月的「雙十一」期間創造了380億美元的銷售紀錄，其推薦系統使用了NVIDIA GPU，使每秒查詢量達到了CPU的100倍以上。而對話式AI自身也成為了業界關注的焦點，推動從金融到醫療健康等行業的業務發展。

　　NVIDIA不僅能為這些龐大工作的運轉提供所需的性能，還使其易於使用。

　　軟體為AI的戰略發展鋪平道路

　　今年五月，NVIDIA發布了兩個應用框架――用於對話式AI的Jarvis和用於推薦系統的Merlin。 Merlin中包含了助力最新MLPerf基準測試結果的HugeCTR訓練框架。

　　這些應用框架僅僅是一部分。在不斷壯大的應用框架中，還有面向汽車行業市場的NVIDIA DRIVE，面向醫療健康市場的Clara，面向機器人技術市場的Isaac，以及面向零售/智能城市市場的Metropolis。

　　圖註：NVIDIA應用框架簡化了企業級AI的開發和部署。

　　DGX SuperPOD架構兼顧速度與規模

　　NVIDIA在Selene上運行了系統的MLPerf測試，Selene是基於DGX SuperPOD的內部集群。DGX SuperPOD是針對大規模GPU集群的公共參考架構，可在數周內完成部署。該架構基於DGX POD的設計原理和最佳實踐進行了擴展，致力於解決當今AI領域最具挑戰性的難題。

　　Selene最近在TOP500榜單中首次亮相，憑藉百億億次（exaflops）級別的AI性能，成為美國最快的工業系統。它也是Green500榜單中全球第二大節能系統。

　　客戶已經採用這些參考架構來構建自身的DGX POD和DGX SuperPOD。其中包括美國最快的學術領域AI超級計算機HiPerGator，該超級計算機也將成為佛羅裡達大學跨學科AI創新的基石。

　　同時，全球領先的超算中心Argonne國家實驗室正在使用DGX A100，尋找抗擊COVID-19疫情的方法。Argonne國家實驗室是六個首批採用A100 GPU的高性能計算中心中的先行者之一。

　　圖註：NVIDIA DGX POD的廣泛採用。

　　DGX SuperPOD現已助力汽車領域的大陸集團、航空航天領域的Lockheed Martin和雲計算服務領域的微軟等公司取得了良好的業務成果。

　　這些系統的順利運轉，部分得益於其廣泛的生態系統對於NVIDIA GPU和DGX支持。

　　NVIDIA生態系統在MLPerf基準測試中展示傲人成績

　　在提交結果的九家公司中，除NVIDIA外還有六家公司提交了基於NVIDIA GPU的測試結果，其中包括三家雲服務提供商（阿里雲、谷歌雲和騰訊雲）和三家伺服器製造商（戴爾、富士通和浪潮），凸顯了NVIDIA生態系統的優勢。

　　圖註：採用NVIDIA AI平臺參與基準測試的合作夥伴。

　　這些合作夥伴大多採用了NVIDIA軟體中心NGC中的容器，以及用於參賽的公開框架。

　　包括這些MLPerf合作夥伴在內的近二十家雲服務提供商和OEM組成的生態系統，已採用或計劃採用NVIDIA A100 GPU來打造在線實例、伺服器和PCIe卡。

　　經測試驗證的軟體現可從NGC獲取

　　現在，大多數NVIDIA及其合作夥伴在最新MLPerf基準測試中使用的軟體，已可通過NGC獲取。

　　NGC中包括多個GPU優化的容器、軟體腳本、預訓練模型和SDK，可助力數據科學家和開發者在TensorFlow和PyTorch等常用框架上加速AI工作流程。

　　各機構都在大力採用容器，以加速實現業務成果。畢竟，業務成果才是最終的「基準」。

關注同花順財經（ths518），獲取更多機會

責任編輯：jdm

NVIDIA在最新MLPerf基準測試中打破16項AI性能紀錄

相關焦點

驍龍888官方基準測試成績出爐,整體性能同麒麟9000相當

連續打破16項世界紀錄!淺談永遠的「鬼怪II」——F-4

AI時代的摩爾定律?黃氏定律預測AI性能將逐年翻倍

OpenAI追蹤AI模型效率:每16個月翻一番!超越摩爾定律

華碩伺服器勇創578項SPEC記錄

OpenAI官宣AI算法效率每16個月翻一番

《復仇者聯盟4》在臺熱映臺媒:5天打破臺灣影史16項紀錄

AI在這張「問卷」上首次超越人類,SuperGLUE被微軟谷歌「攻破」

英特爾Rocket Lake Core i9-11900 8核CPU基準測試成績再次曝光

驍龍888機和A14基準測試差距之大讓人驚訝

英偉達RTX 3060 Ti官方性能基準測試洩露將於12月2日推出

9項可能永遠不會被打破的世界紀錄

Zen3超頻神器 ROG C8DH主板獲15項全球第一

打破吉尼斯紀錄,200+小時不熄火,長安憑啥「鯨」動世界?

打破9項全國紀錄超3項世界紀錄男子舉重全錦賽佳績搶眼

打破吉尼斯紀錄,200+小時不熄火,長安發動機憑啥「鯨」動世界?

MacBook Air M1詳細基準與性能評測:最適合大多數人使用的Mac

中國人保持的田徑世界紀錄還有幾項?有一恐怖紀錄27年無人打破

NVIDIA TITAN V遊戲性能首曝比1080Ti提升27%

蘋果A6性能測試

NVIDIA在最新MLPerf基準測試中打破16項AI性能紀錄

相關焦點

驍龍888官方基準測試成績出爐,整體性能同麒麟9000相當

連續打破16項世界紀錄!淺談永遠的「鬼怪II」——F-4

AI時代的摩爾定律?黃氏定律預測AI性能將逐年翻倍

OpenAI追蹤AI模型效率:每16個月翻一番!超越摩爾定律

華碩伺服器勇創578項SPEC記錄

OpenAI官宣AI算法效率每16個月翻一番

《復仇者聯盟4》在臺熱映 臺媒:5天打破臺灣影史16項紀錄

AI在這張「問卷」上首次超越人類,SuperGLUE被微軟谷歌「攻破」

英特爾Rocket Lake Core i9-11900 8核CPU基準測試成績再次曝光

驍龍888機和A14基準測試 差距之大讓人驚訝

英偉達RTX 3060 Ti官方性能基準測試洩露 將於12月2日推出

9項可能永遠不會被打破的世界紀錄

Zen3超頻神器 ROG C8DH主板獲15項全球第一

打破吉尼斯紀錄,200+小時不熄火,長安憑啥「鯨」動世界?

打破9項全國紀錄 超3項世界紀錄 男子舉重全錦賽佳績搶眼

打破吉尼斯紀錄,200+小時不熄火,長安發動機憑啥「鯨」動世界?

MacBook Air M1詳細基準與性能評測:最適合大多數人使用的Mac

中國人保持的田徑世界紀錄還有幾項?有一恐怖紀錄27年無人打破

NVIDIA TITAN V遊戲性能首曝 比1080Ti提升27%

蘋果A6性能測試

《復仇者聯盟4》在臺熱映臺媒:5天打破臺灣影史16項紀錄

驍龍888機和A14基準測試差距之大讓人驚訝

英偉達RTX 3060 Ti官方性能基準測試洩露將於12月2日推出

打破9項全國紀錄超3項世界紀錄男子舉重全錦賽佳績搶眼

NVIDIA TITAN V遊戲性能首曝比1080Ti提升27%