18項紀錄加持,浪潮NF5488A5決戰2020 AI計算性能之巔

2020-12-24 騰訊網

「18項AI推理性能紀錄!包括圖像分類、自然語言理解、智能推薦、語音識別等場景。」

在剛剛結束的MLperf推理測試評測中,浪潮NF5488A5閃耀全場,成為MLperf榜單中打破記錄最多的AI伺服器。它在Resnet50模型推理任務處理達到每秒處理54.9萬多張圖片;Bert自然語言理解推理任務達26675條/秒;DLRM智能推薦每秒推理處理能力達210萬條。

浪潮NF5488A5創造18項MLPerf推理性能記錄

憑藉強大的性能與軟體優化,浪潮NF5488A5在與同樣師出名門的20家企業「參賽伺服器」測試對比中脫穎而出,獲得了訓練、推理雙料冠軍

等等,為何當今AI這麼火?連評測都轉成了AI項目測試了,真正市場需要有這麼大嗎?

答案當然是肯定的。IDC預測,未來五年人工智慧市場複合增長率將達到44.9%,整體規模將達到175億美金。

未來AI商業化有兩個巨大的市場空間,一是AI產業化,二是產業AI化。人工智慧經過數十年的發展,已經從實驗室階段到進化到AI產業化。從智能音箱到自動駕駛、生物識別,應用場景不斷成熟,人工智慧也正逐漸滲透到各行各業,產業AI化迎來了爆發性增長。

為AI產業提供計算力的平臺,就是浪潮NF5488A5這樣性能強大的AI計算伺服器。

我為AI狂,浪潮5488A5問鼎MLPerf評測

接下來我們先來了解一下當今炙手可熱的MLPerf測試。MLPerf基準聯盟,現有50多家成員,包括谷歌、微軟、Facebook、阿里巴巴、浪潮等企業,以及斯坦福、哈佛等高校。

MLPerf是一套用於測量和提高機器學習軟硬體性能的通用基準,主要用來測量訓練和推理不同神經網絡所需要的時間。近日所進行的測試就是針對伺服器推理方面性能。MLPerf測試集包含了不同領域的Benchmark子項,主要包括圖像分類、物體識別、翻譯、推薦、語音識別、情感分析以及強化學習。

既然是測試,就肯定會有跑分的環節。MLperf針對不同領域設置了不同的Benchmark,對於MLPerf Training測試,每個Benchmark的評價標準是:在特定數據集上訓練一個模型使其達到Quality Target時的Clock time。由於機器學習任務的訓練時間有很大差異,因此,MLPerf 的最終訓練結果是由指定次數的基準測試時間平均得出。Train測試時間包含了模型構建,數據預處理,訓練以及質量測試等時間。

據了解,本次MLPerf推理基準測試設有六個基準,重點面向圖像分類、目標物體識別檢測、醫學影像分割、機器翻譯、自然語言處理和智能推薦等常見機器學習任務。參賽選手可以選擇提交任何基準及相應場景的結果。

MLPerf專為數據中心場景設計了一系列Benchamrk,數據中心場景下的各種推理基準測試包括: 圖像分類、物體檢測、語言翻譯(gmnt)、語義理解、智能推薦等。

在數據中心Closed任務的16項性能指標中,浪潮NF5488A5打破了11項整機性能記錄。

我們來看看其中Resnet50和Bert-99.9這兩項測試。Resnet是殘差網絡(Residual Network)的縮寫,廣泛用於目標分類等領域以及作為計算機視覺任務主幹經典神經網絡的一部分,典型的網絡有resnet50、resnet101等。

浪潮NF5488A5在Resnet50中close封閉任務場景的server項目中得分262305,奪得該項目第一名;offline項目得分303264;在開放優化賽道更是達到驚人的549782/秒的成績,同比2019年伺服器全球最好紀錄提升3倍,與其他選手拉開了明顯差距。

BERT模型是谷歌提出的基於雙向Transformer構建的語言模型,主要考察伺服器的模型訓練性能表現。浪潮NF5488A5在該項測試中依然力拔頭籌,甚至在得分方面壓制住了備受關注的DGX系統,要知道這可是NVIDIA剛剛推出的明星級產品,其他類型伺服器選手更是遠遠甩在了身後。

內功深厚的浪潮NF5488A5

那麼,相比其他同類型伺服器,浪潮NF5488A5又有何過人之處呢?

先來看看硬指標,NF5488A5是浪潮自研的新一代AI伺服器,特點在於4U空間內可支持8顆第三代NVLink全互聯的NVIDIAA100 GPU,搭載2顆支持PCIe4.0的AMD EPYC7742處理器。

仔細觀察不難發現,這些豪華硬體背後的特點就是:高帶寬、低延遲!也就是說,浪潮NF5488A5在系統拓撲上採用了超低延遲設計,支持PCIe 4.0全鏈路優化,高頻通信單元採用一級拓撲最近連接,最大限度提升處理器到AI晶片間的通信性能。通過配置NUMA節點,確保每顆處理器與其直連的GPU之間通信性能最優,最大限度降低通信延遲。

此外,NF5488A5還採用了當今備受關注的高溫化設計,通過深度優化系統結構設計,確保設備可在高環溫下穩定運行,因此適用範圍、場景也更廣。

正是因為有了這些過人之處的設計與優化,才使得浪潮NF5488A5能夠輕鬆打破18項AI性能紀錄。

AI計算正在助力各行各業快速發展

幾年前,行業用戶問題大都集中在「AI能做什麼?」,而現在,關注的則是還有哪些應用沒有用上AI。從AI的發展到壯大的過程,似乎快的令人難以想像。

與此同時,計算力的快速發展極大促進了各行業應用場景的成熟,AI產業化正加速向產業AI化邁進。網際網路、智慧城市、金融行業已經全面融入了AI,未來五年,智造、零售等行業也在逐步加速產業AI化進程。

打開智慧型手機,各式各樣的應用幾乎都與AI和計算力有著密切聯繫。微信中的圖片識別、語音轉文字;金融應用中的智能客服;工具軟體中的拍照翻譯;購物軟體中的拍攝識物等等,它們的背後都是由AI伺服器來支撐。

以浪潮NF5488A5為例,如此強大的軟、硬體系統,它能夠廣泛應用於圖像視頻、語音識別、金融分析、智能客服等典型AI應用場景,幫助AI用戶高效完成AI基礎設施和開發環境的構建,縮短開發周期,顯著提升AI開發和應用效率,在享受更高計算性能的同時降低部署、運行成本。

一直以來,浪潮都在深耕人工智慧計算領域,其產品也早已享譽全球。早在2017年,浪潮就曾發布「智慧計算」戰略,聚焦打造全球領先的AI算力。現如今,浪潮擁有全球最豐富的AI產品陣列,涉及訓練、推理、邊緣等全棧AI場景,還構建了領先的AI框架優化、AI開發管理和應用優化等全棧AI能力。

IDC發布最新一期《2020H1中國AI加速計算報告》。報告顯示,2020年上半年,中國AI伺服器市場規模達到12.9億美元,同比增長53.7%。其中,浪潮AI伺服器市佔率百分點達53.5%。 連續三年保持中國市場第一。

相關焦點

  • 3D床墊:床墊的浪潮之巔
    第三次工業革命的浪潮中,3D床墊是床墊領域的浪潮之巔。它所使用地3D高分子材料是由無數條細絲組成:沒有彈簧,沒有乳膠,沒有海綿,N根柔挺纖維渾然天成,體現了最高的材料科技水平。這個超級透氣的性能如同我們的肺一樣,時刻都在吐故納新,人身體排出的汗液氣體能夠迅速的排出,不會在床上滋生蟎蟲細菌。皮膚不再會過敏、呼吸道不再感染。有韌性現代人有80%的都有腰酸毛病,3D床墊的支撐點達到400萬個,超細纖維極富韌性,可以完美託起整個身體。
  • 浪潮AI伺服器NF5488A5的實測數據分享,單機最大推理路數提升88%
    打開APP 浪潮AI伺服器NF5488A5的實測數據分享,單機最大推理路數提升88% 美通社 發表於 2020-12-24 15:25:01
  • 村木田美女張帆足球寶貝大片 決戰世界之巔
    村木田美女張帆足球寶貝大片 決戰世界之巔 村木田美女張帆足球寶貝大片 決戰世界之巔素有時尚掌門人之稱的張帆,褪去鎂光燈下流行時髦的時裝造型,化身普通球迷,以最真最純的清新面貌站出來為足球加油打氣,一場場華麗的進攻,一個個精彩的進球,一陣陣震天的歡呼,都在激蕩著全世界,張帆
  • 決戰性能之巔!NV雙芯旗艦GTX590評測
    決戰性能之巔!2.18 溫度、功耗、噪音測試    對於在一塊PCB上集成了兩顆GPU核心的頂級顯卡來說,散熱、功耗與性能的平衡永遠都是個問題,而高端顯卡恐怖的發熱噪音歷來為人詬病,這次雙芯旗艦GTX590會不會在刷新性能記錄的同時功耗發熱失控呢?
  • 深度剖析:浪潮16控存儲 SPC-1性能報告
    2020年3月,存儲性能委員會(StoragePerformance Council,簡稱SPC)公布最新的SPC-1™基準測試報告。浪潮存儲AS5600G2(全快閃記憶體)以752萬IOPS、0.472毫秒延時的評測值,創造了16控存儲產品性能的全球最高紀錄,成為全球存儲市場新的領跑者。
  • 解讀《浪潮之巔》1、百年帝國的餘暉——AT&T
    《浪潮之巔》確實是科技商業領域不可多得的一部佳作,甚至它在「史學」書架上都能為自己贏得一個位置。因為信息科技浪潮奔湧了30年,我們每個人都被它所改變,就連我們所處的整個時代都以「信息」二字來命名的。而《浪潮之巔》這本書能夠幫我們把這隻大象的耳朵、鼻子和腿全部都連結在一起,形成一張完整的全球信息科技產業地圖。這種融會貫通的體驗,確實叫人感覺酣暢淋漓。
  • 《浪潮之巔》:矽谷企業的公司文化——工程師文化及其特點
    可以說,堅持工程師文化是Google的成功之道,但是正如世界上不存在只有正面沒有反面的紙一樣,也不可能存在只有優點沒有缺點的企業文化。」——吳軍《浪潮之巔》在《浪潮之巔(第四版)》中,吳軍在第十八章《挑戰者——Google公司》和第二十二章中都提到了工程師文化,那麼什麼是工程師文化?它有什麼特點?
  • 《浪潮之巔》作者吳軍:雅虎被時代淘汰,下一個浪潮是連接與超級智能
    (原標題:《浪潮之巔》作者吳軍:雅虎被時代淘汰,下一個浪潮是連接與超級智能)
  • 從8小時到80秒,NVIDIA突破八項AI性能紀錄
    而這也正解釋了為什麼說今日發布的MLPerf AI訓練結果如此之重要。  通過完成全部6項MLPerf基準測試,NVIDIA展現出了全球一流的性能表現和多功能性。NVIDIA AI平臺在訓練性能方面創下了八項記錄,其中包括三項大規模整體性能紀錄和五項基於每個加速器的性能紀錄。
  • 海賊王第1002話:鬼島之巔上的最弱者找到了,基德的表現真的尷尬
    截止至目前為止,鬼島之巔的決戰已經打了好幾話的內容了!那麼問題來了,鬼島之巔上的最弱者究竟是誰呢?今天我們就通過最新話的內容來簡單的分析一下這個問題吧!01神龍凱多出手!在早先的內容中,極惡世代的超新星們各顯神通,對著百獸凱多一頓暴揍!雖然路飛等人的招式並沒有足以擊敗凱多的破壞力,但是對凱多精神方面的打擊還是很大的!
  • 浪潮擁有全球領先的AI伺服器陣列
    今日,由全球人工智慧頂級學術會議NeurIPS舉辦的自動深度學習AutoDL 2019-2020總決賽公布最終成績,浪潮賽隊以出色成績位列全球第三。 而AutoDL 2019-2020總決賽作為系列賽的收官之戰,其難度進一步加大。比賽不只局限在單一技術領域,而是要求參賽選手設計開發無任何人工幹預的自動深度學習系統,並使用該系統解決包括圖像、視頻、語音、文本和結構化表格數據等多領域的全自動多標籤分類任務探索。挑戰賽一共分為反饋階段和決賽階段。
  • AI時代的摩爾定律?黃氏定律預測AI性能將逐年翻倍
    後來廣為人知的每18個月晶片性能將提高一倍的說法是由英特爾CEO大衛·豪斯(David House)提出。過去的半個多世紀,半導體行業按照摩爾定律發展,並驅動了一系列的科技創新。相比Volta 架構的GPU能夠實現20倍的性能提升,並可以同時滿足AI訓練和推理的需求。憑藉更高精度的第三代Tensor Core核心,A100 GPU AI性能相比上一代有明顯提升,雷鋒網此前報導,在7月的第三個版本MLPerf Training v0.7基準測試(Benchmark)結果中,英偉達的DGX SuperPOD系統在性能上開創了八個全新裡程碑,共打破16項紀錄。
  • 「AI簡史」從1950到2020
    2020 年 3 月 4 日,中央明確指示要加快推進國家規劃已明確的重大工程和基礎設施建設,人工智慧被列入新基建範疇,它將是新一輪產業變革的核心驅動力,重構生產、分配、交換、消費等經濟活動各環節,催生新技術、新產品、新產業。
  • 燧原科技進軍AI邊緣領域,攜手浪潮推出邊緣AI推理伺服器
    2020年12月23日,中國上海——燧原科技繼前日發布首款人工智慧推理產品 「雲燧i10」,又宣布攜手浪潮,共同推出基於雲燧i10的浪潮邊緣計算伺服器「NE5260M5」。雲燧i10實現多用戶支持,最大可支持4個設備實例,具備計算與存儲資源的獨享性,多用戶間安全隔離;單顆晶片上可同時部署不同的業務與負載,實現多任務並行,提高利用率;支持KVM、Xen等系統虛擬化平臺。 浪潮邊緣計算伺服器NE5260M5高度2U,深度只有430毫米,可部署在通信機房或直接懸掛在牆壁上。
  • AI產業化浪潮站穩主航道 劉軍解析為何晶片不等於AI計算力
    浪潮的增長是有延續性的增長,過去幾年浪潮得益於快速增長的網際網路和雲計算市場,近兩年在此基礎之上,浪潮也成為AI嗅覺最敏銳的廠商之一,浪潮在2017年初就成立人工智慧部門,全力推動AI產品的開發,打造多樣化的系統級AI計算平臺,並確立了 「智慧計算」戰略,此外浪潮專門發布了一個全新的 AI 品牌——TensorServer,表明了對於AI時代的投入決心。
  • 浪潮雲亮相2020全球分布式雲大會並斬獲3項大獎
    12月17日-18日,「2020全球分布式雲大會」在深圳成功舉辦,浪潮雲獲頒「分布式雲領導力企業TOP3」、「邊緣計算領導力企業TOP5」、「雲原生最佳實踐」三項大獎。會上,浪潮雲見證「GDCA全球分布式雲聯盟「成立儀式正式啟動。
  • 浪潮計算+大數據 克服大數據「摩擦力」
    【IT168 資訊】「計算+」是浪潮集團副總裁王恩東在2015年浪潮信息全國合作夥伴大會(IPF15)上首次提出的新業務戰略,指出了在物理世界信息化、信息世界智能化的發展趨勢下,計算重心正在向後端轉移,對後端計算能力提出了新的需求和挑戰,融合架構將是應對這一挑戰的最佳選擇。
  • 浪潮信息新品發布,5款AI伺服器支持全新NVIDIA® A
    浪潮伺服器新品發布應用範圍更廣浪潮此次發布的 5 款AI伺服器將應對多種人工智慧計算場景,可支持 8 到 16 顆最新NVIDIA A100 Tensor Core GPU。A100 GPU中的第三代Tensor Core核心速度更快、靈活性更高,同時也更易於使用,使這些伺服器的最高性能可達每秒 4 億億次,同時通過新一代NVIDIA NVSwitch技術實現GPU間P2P通信性能翻倍提升最高達600GB/S。更強計算性能與更高的GPU間互聯帶寬可帶來更高的AI計算效率,支撐用戶進行更大數據規模、更複雜模型的AI訓練。
  • 阿里雲打破AI計算紀錄,包攬斯坦福DAWNBench競賽四項第一
    近日,史丹福大學公布了最新的DAWNBench深度學習榜單,阿里雲打破谷歌等企業創造的紀錄,包攬圖像識別比賽的四項第一,這也意味著阿里雲可提供全球最快的AI計算服務。在圖像識別(Image Classification on ImageNet)榜單中,阿里雲包攬了訓練時間、訓練成本、推理延遲以及推理成本四項第一,打破了谷歌等企業保持一年多的紀錄。
  • 「AI浪潮」這家公司提供了BAT 90%的AI算力,年增長率百分之幾百
    在計算的硬體層面毫無疑問浪潮是國內最強的,浪潮的伺服器在BAT中所佔的份額超過90%,在整個中國AI計算伺服器市場至少是60%以上。但是,身處行業老大位置的浪潮,也有自己的煩惱。前段時間在美國丹佛舉行的全球超算大會(SC17)上,第50屆全球超算TOP500榜單揭曉,中國超算「神威·太湖之光」和「天河二號」分列前兩名,中國已經連續10屆實現對該榜單的領跑。