圖註:在不到一個月的時間裡,內置超過2,000個NVIDIA A100 GPU的NVIDIA全新DGX SuperPOD(上圖為藝術渲染圖)就在市售商用產品中脫穎而出,並在各項針對大規模計算性能的MLPerf基準測試中均取得了優異成績。
飛象網訊(源初/文)根據昨日發布的MLPerf基準測試結果顯示,NVIDIA在全球市售商用產品中,具備全球最快的AI訓練性能。
A100 Tensor Core GPU在加速器的全部八項MLPerf基準測試中展現了最快的性能。在實現總體最快的大規模解決方案方面,利用HDR InfiniBand實現多個DGX A100 系統互聯的龐大集群--DGX SuperPOD系統在性能上,也開創了八項全新裡程碑。當今,能夠藉助這些高性能的AI技術來更快速、更具成本效益地實現業務轉型的客戶,將成為最終的獲益者。
行業基準測試組織MLPerf成立於2018年5月。此次已是NVIDIA在MLPerf訓練測試中連續第三次展現了最強勁的性能。2018年12月,NVIDIA首次在MLPerf訓練基準測試中創下了六項紀錄,次年7月NVIDIA再次創下八項紀錄。
NVIDIA在客戶最關心的市售商用產品類別中創下了紀錄。NVIDIA在測試中用到的產品基於最新NVIDIA Ampere架構以及Volta架構。
圖註:NVIDIA DGX SuperPOD系統為大規模AI訓練樹立全新裡程碑。
NVIDIA是唯一一家在所有測試中均採用市售商用產品的公司。其他大多數提交使用的要麼是預覽類別(preview category),其所用的產品預計需要幾個月後才會面市,要麼使用的是研究類別的產品,更是較長一段時間內都不會面市。
NVIDIA Ampere市場採用速度刷新紀錄
A100是首款基於NVIDIA Ampere架構的處理器。它不僅打破了性能紀錄,其進入市場的速度也比以往任何NVIDIA GPU更快。A100在發布之初用於NVIDIA的第三代DGX系統。正式發布僅六周後,A100就正式登陸了Google Cloud 。
為助力滿足市場的強勁需求,AWS、百度雲、微軟Azure和騰訊雲等全球領先的雲提供商,以及Dell Technologies、HPE、浪潮和超微等數十家主要伺服器製造商,均採用了A100。
全球用戶都在使用A100以應對AI、數據科學和科學計算中最為複雜的挑戰。
其中有些正在賦能新一代的推薦系統或對話式AI應用,或進一步探索COVID-19的治療方法,這些都在受益第八代NVIDIA GPU所帶來的迄今為止幅度最大的性能提升。
圖註:NVIDIA Ampere架構在市售商用加速器的全部八項測試中名列前茅。
一年半內實現4倍性能提升
最新結果表明,NVIDIA聚焦於不斷發展跨處理器、網絡、軟體和系統的AI平臺。
例如,測試結果顯示,相較於首輪MLPerf訓練測試中使用的基於V100 GPU的系統,如今的DGX A100系統能夠以相同的吞吐率,實現高達4倍的性能提升。同時,得益於最新的軟體優化,基於NVIDIA V100的DGX-1 系統亦可實現高達2倍的性能提升。
不到兩年,整個AI平臺的創新就取得了如此優異的成績。如今,NVIDIA A100 GPU搭配CUDA-X庫的軟體更新,為通過Mellanox HDR 200Gb/s InfiniBand網絡構建的擴展集群注入了強勁動力。
HDR InfiniBand可實現極低的延遲和高數據吞吐量,同時通過可擴展分層聚合和縮減協議(SHARP)技術,提供智能深度學習計算加速引擎。
圖註:NVIDIA持續通過全新GPU、軟體升級和不斷擴展的系統設計,以提升AI性能。
NVIDIA在推薦系統、對話式AI、強化學習領域大放異彩
MLPerf基準測試得到了亞馬遜、百度、Facebook、谷歌、哈佛大學、英特爾、微軟和史丹福大學等機構的支持,並跟隨AI的發展步伐持續演進。
最新基準測試包含兩項新的測試和一項經大幅修訂的測試。NVIDIA在這三項測試中均取得了優異的成績。其中,一項基準測試對推薦系統的性能進行了排名。推薦系統是日益普及的一項AI任務。另一項基準測試對使用BERT的對話式AI進行了測試。BERT是現有最複雜的神經網絡模型之一。最後,強化學習測試中使用了Mini-go和全尺寸19x19 圍棋棋盤。該測試是本輪最複雜的測試,內容涵蓋從遊戲到訓練的多項操作。
圖註:使用面向對話式AI和推薦系統的NVIDIA AI解決方案的客戶。
各大公司在這些戰略性的AI應用領域已經受益於NVIDIA帶來的強大性能。
阿里巴巴在11月的「雙十一」期間創造了380億美元的銷售紀錄,其推薦系統使用了NVIDIA GPU,使每秒查詢量達到了CPU的100倍以上。而對話式AI自身也成為了業界關注的焦點,推動從金融到醫療健康等行業的業務發展。
NVIDIA不僅能為這些龐大工作的運轉提供所需的性能,還使其易於使用。
軟體為AI的戰略發展鋪平道路
今年五月,NVIDIA發布了兩個應用框架――用於對話式AI的Jarvis和用於推薦系統的Merlin。 Merlin中包含了助力最新MLPerf基準測試結果的HugeCTR訓練框架。
這些應用框架僅僅是一部分。在不斷壯大的應用框架中,還有面向汽車行業市場的NVIDIA DRIVE,面向醫療健康市場的Clara,面向機器人技術市場的Isaac,以及面向零售/智能城市市場的Metropolis。
圖註:NVIDIA應用框架簡化了企業級AI的開發和部署。
DGX SuperPOD架構兼顧速度與規模
NVIDIA在Selene上運行了系統的MLPerf測試,Selene是基於DGX SuperPOD的內部集群。DGX SuperPOD是針對大規模GPU集群的公共參考架構,可在數周內完成部署。該架構基於DGX POD的設計原理和最佳實踐進行了擴展,致力於解決當今AI領域最具挑戰性的難題。
Selene最近在TOP500榜單中首次亮相,憑藉百億億次(exaflops)級別的AI性能,成為美國最快的工業系統。它也是Green500榜單中全球第二大節能系統。
客戶已經採用這些參考架構來構建自身的DGX POD和DGX SuperPOD。其中包括美國最快的學術領域AI超級計算機HiPerGator,該超級計算機也將成為佛羅裡達大學跨學科AI創新的基石。
同時,全球領先的超算中心Argonne國家實驗室正在使用DGX A100,尋找抗擊COVID-19疫情的方法。Argonne國家實驗室是六個首批採用A100 GPU的高性能計算中心中的先行者之一。
圖註:NVIDIA DGX POD的廣泛採用。
DGX SuperPOD現已助力汽車領域的大陸集團、航空航天領域的Lockheed Martin和雲計算服務領域的微軟等公司取得了良好的業務成果。
這些系統的順利運轉,部分得益於其廣泛的生態系統對於NVIDIA GPU和DGX支持。
NVIDIA生態系統在MLPerf基準測試中展示傲人成績
在提交結果的九家公司中,除NVIDIA外還有六家公司提交了基於NVIDIA GPU的測試結果,其中包括三家雲服務提供商(阿里雲、谷歌雲和騰訊雲)和三家伺服器製造商(戴爾、富士通和浪潮),凸顯了NVIDIA生態系統的優勢。
圖註:採用NVIDIA AI平臺參與基準測試的合作夥伴。
這些合作夥伴大多採用了NVIDIA軟體中心NGC中的容器,以及用於參賽的公開框架。
包括這些MLPerf合作夥伴在內的近二十家雲服務提供商和OEM組成的生態系統,已採用或計劃採用NVIDIA A100 GPU來打造在線實例、伺服器和PCIe卡。
經測試驗證的軟體現可從NGC獲取
現在,大多數NVIDIA及其合作夥伴在最新MLPerf基準測試中使用的軟體,已可通過NGC獲取。
NGC中包括多個GPU優化的容器、軟體腳本、預訓練模型和SDK,可助力數據科學家和開發者在TensorFlow和PyTorch等常用框架上加速AI工作流程。
各機構都在大力採用容器,以加速實現業務成果。畢竟,業務成果才是最終的「基準」。
關注同花順財經(ths518),獲取更多機會
責任編輯:jdm