軟體定義、硬體加速的可編程InfiniBand NDR網絡 賦能E級AI和HPC平臺

2020-12-16 電子發燒友

軟體定義、硬體加速的可編程InfiniBand NDR網絡 賦能E級AI和HPC平臺

NVIDIA 發表於 2020-12-15 14:04:28

在2020年全球數字超算大會(SC20大會)上,NVIDIA宣布推出NVIDIA® Mellanox® 400G InfiniBand產品,這是全球第一代400Gb/s網速的端到端網絡解決方案,可為全球的AI和HPC用戶提供最快的網絡互連性能,同時將計算、可編程性和軟體定義三種技術成功地融於一體,成為業界領先的軟體定義、硬體加速的可編程網絡,為全球的科研人員和工程人員設計新一代計算系統和提升應用性能提供了新的思路。

NVIDIA Mellanox InfiniBand NDR產品是第7代的InfiniBand產品,利用100Gb/s的PAM4 Serdes技術, 實現了400Gb/s的單埠傳輸帶寬, 是上一代產品的兩倍, 同時通過添加更多、更強大的加速引擎,實現了更強大的計算和通信能力。

NVIDIA Mellanox NDR 400G InfiniBand產品系列

「Speed Of Light」是關於NDR InfiniBand技術的第一個特徵,通過加倍的帶寬、更快的包處理能力(Message Rate),讓基於RDMA、GPU Direct RDMA和GPU Direct Storage等先進通信技術的應用性能得到了進一步提升。InfiniBand網絡是天然的SDN網絡,可以讓用戶根據應用的屬性來選擇各種不同的網絡拓撲,以達到最優的性能,如Fat-Tree、DragonFly+、各種Torus等。如通過DragonFly+網絡拓撲可以在4個交換機Hop內達到一百萬個節點的同時通信,這個規模遠遠超出了E級機、甚至10E級機或百E級機需要的規模;同時其天然的SDN屬性也讓動態路由和網絡擁塞控制變得更容易實現。InfiniBand動態路由已經被廣泛地應用到各種網絡拓撲當中,成為優化通信性能的關鍵手段,如美國橡樹林國家實驗室的Summit超級計算機就通過動態路由將超算中心全網的通信效率從60%提升到了96%。NDR InfiniBand交換機在1U空間內可以支持64個400Gb/s的埠或128個200Gb/s的埠,是上一代交換機埠密度的3倍;它還將框式交換機系統的聚合雙向吞吐量提高了5倍,達到1.64 petabits/s,是全球埠數最多、交換容量最大的交換機。

硬體加速是InfiniBand網絡的最大特色,隨著越來越多的加速引擎被添加到InfiniBand硬體中來,進一步加大了其相對於其它網絡技術的領先性。如NDR InfiniBand實現了對於業界最頭疼的All2All和Allreduce通信的硬體卸載,能讓MPI通信的性能提升四倍。NDR InfiniBand對於MPI Tag Matching的硬體卸載,實現了1. 8倍的MPI通信性能提升。NDR InfiniBand可以實現對於NVMeoF的全面卸載, NVMeoF的Target卸載可以讓存儲系統在幾乎不消耗Target端CPU的前提下達到數以百萬級的IOPS,NVME SNAP可以實現對於NVMeoF的Initiator端的卸載,同時可以將InfiniBand網絡模擬成NVMe磁碟提供給主機CPU,可以解決目前很多OS還沒有NVMeoF的Initiator支持的問題,實現了對任何OS,無論是虛擬化還是物理機的全面NVMeoF的支持;InfiniBand FIO SNAP可以實現對於文件存儲的本地模擬,讓任何OS都可以享受最先進的分布式文件存儲系統的性能優勢。

InfiniBand SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) 技術徹底消除了MPI或者NCCL的Allreduce操作中的多打一通信帶來的Incast Burst問題,在保證所有埠全線速、共計12.8Tb/s或25.6Tb/s的數據輸入的前提下,實現在交換機上的Allreduce、Barrier、Reduce和Broadcast計算,在NDR交換機上更是實現了相比上一代交換機32倍的計算性能提升。InfiniBand SHIELD (Self-Healing) 技術實現了網絡中鏈路故障的自修復,讓網絡無需等待管理軟體的參與來恢復鏈路故障,實現了比傳統的軟體故障恢復快千倍以上的性能,讓應用不再受困鏈路故障的幹擾,提升應用的性能。

InfiniBand安全卸載是面向Cloud Native的應用場景,InfiniBand已經得到了Open Stack的官方軟體支持,通過自帶的硬體IPSec、TLS、AES、Root of Trust等功能,可以讓數據不論是在網絡中流動時,還是在向存儲中落盤時都能以線速性能得到加解密,實現了在虛擬化環境或者在容器化環境中的安全保障。

軟體可編程讓InfiniBand的應用場景得到了進一步的延伸,可編程的NDR InfiniBand不僅可以讓用戶處理數據的header,還可以對於數據的數據路徑進行操作,如用戶可以自定義規則對於數據路徑進行操作;或是對於數據直接在網絡中進行預處理而無需送到CPU做預處理。用戶還可以對於數據的通信特徵進行提取、然後利用AI技術對其進行訓練,得到不同應用數據的通用通信特徵,如果發現有異常通信信息,可以向管理員主動發出預警。

NVIDIA Mellanox NDR 400G InfiniBand亮點

NDR InfiniBand以其優異的性能和靈活廣泛的使用場景吸引了眾多的合作夥伴一起共建生態系統,包括Atos、戴爾科技、富士通、浪潮、聯想和SuperMicro等伺服器廠商,以及DDN、IBM Storage等存儲廠商。各家公司都已開始研發其新一代產品,實現對於NDR InfiniBand的支持。而包括微軟Azure公有雲、美國Los Alamos國家實驗室、歐洲Jülich超算中心等全球各頂級用戶都紛紛表示,期待能儘快應用NDR InfiniBand到他們的業務中去,享受NDR的技術優勢。

NVIDIA網絡高級副總裁Gilad Shainer表示: 「我們AI客戶最重要的工作就是處理日益複雜的應用程式,這需要更快速、更智能、更具擴展性的網絡。NVIDIA Mellanox 400G InfiniBand的海量吞吐量和智能加速引擎,幫助HPC、AI和超大規模雲基礎設施以更低的成本和複雜性,實現無與倫比的性能。」

E級AI和HPC時代已經來臨,同時帶來新的挑戰,軟體定義、硬體加速、面向網絡計算的可編程NDR InfiniBand產品將於2021年第二季度提供樣品。NDR產品的出現,將會大幅提升E級AI和HPC系統的性能和效率,簡化系統的管理和操作,降低系統的TCO,進而保護數據中心的投資。

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 軟體定義、硬體加速的可編程InfiniBand NDR網絡賦能E級AI和HPC平臺
    通信世界網消息(CWW)在2020年全球數字超算大會(SC20大會)上,NVIDIA宣布推出NVIDIA® Mellanox® 400G InfiniBand產品,這是全球第一代400Gb/s網速的端到端網絡解決方案,可為全球的AI和HPC用戶提供最快的網絡互連性能,同時將計算、可編程性和軟體定義三種技術成功地融於一體
  • GTC20 | 軟體定義、硬體加速的可編程InfiniBand NDR網絡賦能E級AI...
    在之前的2020年全球數字超算大會(SC20大會)上,NVIDIA宣布推出NVIDIA® Mellanox® 400G InfiniBand產品,這是全球第一代400Gb/s網速的端到端網絡解決方案,可為全球的AI和HPC用戶提供最快的網絡互連性能,同時將計算、可編程性和軟體定義三種技術成功地融於一體
  • ...WAN亮相雲數據企業家海口峰會 打造面向5G和邊緣計算的軟體定義...
    5G和邊緣計算的軟體定義網絡》為題進行主題演講,分享了青雲QingCloud打造新時代軟體定義網絡平臺的思路,介紹了光格網絡SD-WAN支持企業構建雲網邊端一體化架構、全面支撐企業數位化轉型的實踐成果。
  • 賽特斯5G家族亮相PT展 軟體定義賦能新基建
    賽特斯作為積極構建5G網絡與生態的軟體定義通信領導者亮相本次展會,全面展示公司在5G雲化白盒小站、5G+MEC專網領域的應用實踐,並重磅推出5G一體化共站部署方案。 系統構建全部使用白盒化硬體設備,端到端支持網絡切片,並大量應用了軟硬體池化技術。技術和產品方面的優勢讓賽特斯5G雲化白盒小站成為全場焦點。FlexEZ-RAN集中體現ICDT融合的技術理念,為打造架構先進、設施完善、融合創新、開放共贏的新型信息基礎設施提供了源動力。   目前,賽特斯5G雲化白盒小站已完成中國移動實驗室測試,順利通過中國聯通5G社會化基站招募測試。
  • 雲遊戲潮起,底層軟硬體賦能!
    本文核心觀點: 雲遊戲快速增長,五年內將是千億級的市場; 雲遊戲生態鏈中,遊戲廠商和雲廠商是主角,底層軟硬體是基座; 伺服器端優化是雲遊戲的關鍵,為雲廠商賦能。
  • 聯想、中國移動、賽靈思、Napatech、銳德世聯合推出業界首個硬體加速、軟硬解耦的5G接入網雲化方案
    這一方案是在保證軟硬體解耦的基礎上,利用可編程通用硬體加速器提升NFV平臺的整體能效,降低綜合成本。無線雲平臺是支撐O-RAN整體方案的基礎,歡迎業界更多的合作夥伴加入到我們的研究中來,為實現開放、智能的無線接入網而努力。」
  • 軟體吞噬硬體的AI時代,晶片跟不上算法進化可咋辦?
    正如他們所判斷的,AI 晶片不斷出現新的架構,比如來自英國 Graphcore 的 IPU——一種迥異於 CPU 和 GPU 的 AI 專用智能處理器,已經逐漸被業界認可,並且 Graphcore 也獲得了微軟和三星的戰略資本支持。而當下,一種名為 CGRA 的架構,在學界和工業界正受到越來越多的關注。
  • 聯想、中國移動、賽靈思、Napatech、銳德世聯合推出業界首個 硬體加速、軟硬解耦的5G接入網雲化方案
    這一方案是在保證軟硬體解耦的基礎上,利用可編程通用硬體加速器提升NFV平臺的整體能效,降低綜合成本。無線雲平臺是支撐O-RAN整體方案的基礎,歡迎業界更多的合作夥伴加入到我們的研究中來,為實現開放、智能的無線接入網而努力。」
  • 底氣來源於孜孜追求 思科的軟體定義與眾不同
    【PConline 高端訪談】從用戶的「邊緣」入手,以更加智慧的方式幫用戶去解決計算資源等問題,這種形式成為了當前企業級廠商抓取用戶需求,從而緊跟市場走勢的重要途徑和方式。雲,作為企業級IT平臺的重要基石,其在企業用戶業務當中的重要性已無須贅述,在雲的「邊緣」也正在掀起一場「革命」。發動這場革命的正是思科。
  • 跟風送孩子外出學編程,不如家有一套智能家居系統
    芯恆安智能家居5.0「ai玩空間」版將教育屬性與生活屬性結合,則再次拓展了智能家居的賦能空間。 但單品之間孤立,不能互相連接通信等問題導致體驗感不佳,讓不少消費者和媒體開始質疑智能家居的必要性和功能性。 2012年,智能家居開始憑藉網絡通訊等技術,將有智能控制、信息交流及消費服務等功能的家庭設施與住宅環境有機結合,智能家居系統開始萌芽。但這一時期的智能家居因硬體設備昂貴、通信系統複雜、安裝過程繁雜等,讓大眾消費市場「望而卻步」。
  • 英偉達官方解讀:Volta Tensor Core GPU實現AI性能新裡程碑
    深度學習現在已能有效解決大量難題,在這種進展的推動下,算法複雜度的指數級增長已經帶來了對更高速的計算的極大渴求。為了滿足這些需求,英偉達設計了 Volta Tensor Core 架構。英偉達和很多其它公司與研究者一直都在開發計算硬體和軟體平臺來解決這一需求。比如,谷歌打造了 TPU(張量處理單元)加速器,能夠給可以運行在 TPU 上的數量有限的神經網絡帶來優良的表現。
  • 機器編程究竟是什麼?發展難點在哪裡?
    編程對於這個世界的意義,當然不僅僅是創造了一批赫赫有名的IT大佬,創造了微軟和騰訊。進入軟體定義一切的時代,我們越來越相信這個世界是由軟體驅動的,看看擁有代碼最多的公司竟然不是軟體巨頭微軟,而是飛機製造企業。看看從上天的飛機火箭到我們身邊的各種小物件,從報稅到買菜我們都離不開軟體,從工廠到各個機構都離不開軟體的驅動,我們就能夠很好地理解為什麼編程對這個世界舉足輕重了。
  • 軟體定義智造,INTEWELL使能運動控制
    此論壇匯聚了數百名行業精英參與,論壇旨在探討行業當下與未來的發展、企業策略與戰略新思維,重新塑造「中國製造」的品牌價值,同時也為中國經濟在新時期的發展賦能。論壇現場|圖片來源:中國傳動網科東軟體受邀出席本次論壇,公司總經理龔鵬程作了「基於軟體定義的控制解決方案」為主題的演講,向與會者介紹了從晶片、總線、作業系統到控制軟體全自主的運動控制方案。
  • 賦能當下,贏在未來:KOOV堅持推進少兒編程教育發展
    在人工智慧飛速發展的大背景下,索尼始終秉持「激發孩子的好奇心及自主學習能力」的教育理念,以更多的耐心與更深的沉澱在少兒編程領域持續進階。經過近四年的產品開發和市場探索,KOOV從最初硬體產品的提供,發展為完整的教育解決方案,打造了涵蓋校本課程、社團課程、機器人教室、賽事、線上線下互動教學系統、教育者培養等多節點多領域的生態系統,受到了教師和家長們的認可。
  • 停課不停學,VMware技術賦能智慧校園
    構建高效、穩定、安全的雲平臺,加速教學科研創新    隨著學校加速發展、教育行業信息化建設水平提高,各學校的信息化辦公室往往會遭遇IT人員有限、運維管理繁重、IT基礎架構升級預算不足、安全性不足等種種挑戰。
  • 137% YOLOv3加速、10倍搜索性能提升!這樣的驚喜,最新版PaddleSlim...
    表2 基於敏感度的剪裁方法部分實驗結果三、支持網絡可配置量化,新增離線量化,模型預測速度成倍數提升定點量化的目的是將神經網絡前向過程中浮點數運算(float32)量化為整數(int8)運算,以達到計算加速的目的。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    充分利舊現有攝像頭,即插即用,提供可視化管理平臺,支持二次開發。>>立即購買aim.baidu.com/product/6c6610fb-9104-4816-9fde-56697d390e571.
  • VMware存儲:軟體定義、分布式DAS支持
    SDN(軟體定義的網絡,Software Defined Network)一詞可以說是最近的新熱點,而近日在北京舉辦的vForum 2012大會分會場一的主題則是「軟體定義數據中心」。Data Center中涉及到各種領域的技術我並不都熟悉,因此還是主要關注存儲方面。何謂軟體定義的存儲?vSphere哪些方面仍待提高?
  • OpenNetLab開放網絡平臺聯盟成立:助力AI加速網絡研究
    通過為研究人員提供通用的分布式網絡測試平臺,以及真實的網絡評測數據集,來助力AI加速網絡研究。周禮棟講到,「一方面,網絡AI模型的訓練和驗證需要大量的數據,真實且有代表性的網絡數據能提升模型的準確性和適用性,但研究人員獲取大規模真實網絡數據具有較大難度。
  • 華為首秀 AI 全棧軟體平臺!
    首秀昇騰 AI 全棧軟體平臺此次,華為發布的昇騰 AI 全棧軟體平臺包含異構計算架構 CANN 3.0、全流程開發工具鏈 MindStudio 和昇騰應用使能 MindX 1.0,覆蓋基礎軟體到應用使能,分別對應有著不同需求層次的開發者。