全新架構來襲,解讀NVIDIA Ampere如何為用戶打造更多可能

2020-12-10 中國製造業信息化門戶

從最早的Kepler架構到Maxwel、Pascal、Turing以及今年10月正式發布的Ampere架構,NVIDIA為數百萬藝術家、設計師和工程師帶來了GPU的強勁性能提升。

    當前,雲計算、5G、人工智慧、虛擬客戶體驗等各類數位技術正在改變著我們的生活工作方式和企業的運營方式。在全新的數字經濟環境下,無論是企業的研發設計、模擬仿真還是個人的圖形處理、視覺優化,都對GPU性能有了更高的要求,企業需要更強勁的GPU性能讓響應更加迅速、協作更加高效。

    作為GPU的發明者和全球圖形運算行業領袖,NVIDIA從推出第一代GPU架構開始,就在不斷創新迭代,使GPU架構更加符合不同環境下的圖形和可視化運算要求,從最早的Kepler架構到Maxwel、Pascal、Turing以及今年10月正式發布的Ampere架構,NVIDIA為數百萬藝術家、設計師和工程師帶來了GPU的強勁性能提升。

    「在過去20年裡,NVIDIA在不同領域針對GPU進行優化,無論是軟硬體設計,還是功能改進,使不同用戶產生了性能飛躍。」日前,在GPU舉辦的線上媒體溝通會上,NVIDIA 中國區高級技術市場經理施澄秋進一步解讀了全新Ampere架構的GPU的技術特點和性能優勢,並以實際應用案例詮釋NVIDIA Ampere架構GPU如何為用戶帶來應用體驗飛躍和工作效率提升。

圖 NVIDIA GPU架構發展路線圖

性能突破,Ampere架構下的非凡體驗

    基於Ampere架構,NVIDIA發布了面向工作站的RTX A6000和面向伺服器的RTX A40。兩者均採用了最新的Ampere架構,並在GPU 配置上保持一致性,即84個帶有 GA102 GPU 的流式多處理器。唯一的區別在於前者是主動散熱,而後者是被動。與上一代產品相比,施澄秋介紹NVIDIA Ampere GPU架構的性能提升主要體現在以下三個方面:

 

圖 NVIDIA Ampere架構三大性能提升

    首先,是在流式多處理器(SM)架構上,新一代最高可以提供39 TFLOPS的FP32算力。由於目前FP32(單精度浮點)主要用於圖形運算或者物理模擬,對於運算結果的精度要求並不高,例如在研發設計方面,以CAD、CAM的研發設計仿真精度權重並不是首位,FP32既可以滿足需求。因此,NVIDIA針對新一代的流式多處理器架構進行優化,使其單精度浮點達到上一代Turing架構的2倍。

    其次,在RT (實時光線追蹤)Core上,NVIDIA在Turing架構裡首次引入了專門的光線追蹤運算環境,通過BVX算法使用一個專門電路運算光線軌跡及當前畫面裡3D建模之間的光線反射、折射或更複雜的軌跡,例如鏡面反射、漫反射等,讓電腦畫面更加逼真,達到照片級渲染精度。在新的Ampere架構下,NVIDIA對BVX算法進行了優化,最高可提供2倍於上一代的吞吐量,以及並行光線追蹤、著色和計算功能。

    最後,在Tensor Core(張量計算核心)方面,我們知道由於總性能是一定的,精度提高時,運算量就會增加,性能自然也會降低。NVIDIA Ampere 的TF32精度可以快速適應FP32精度,在吞吐量上達到上一代的5倍。此外,Ampere架構支持全新TF32和BF16數據格式,結合稀疏運算特性提供10倍加速性能。值得一提的是,DDR6顯存和PCIe Gen 4作為發展趨勢,在全新的Ampere架構下都得到支持。目前單個GPU可提供的最大內存以達到48GB。

多行業場景下的最佳實踐

    如今,人們對消費品的功能性和創新性期待日益增高,對於研發設計人員而言,其複雜性隨之加大。施澄秋介紹日常生活中看似一個簡單的商品,其背後經歷了非常多的繁瑣、冗長的步驟,例如選擇何種材質、材質的牢固程度、材質的耐磨損程度、材質使用過程中的舒適程度以及美觀程度,以及是否符合人體工學等等,涉及到多次模擬仿真和討論修改,而NVIDIA就是要加速設計和創新過程,提升效率,讓企業創新步伐邁的更快。

    例如Predator Cycling,美國的一家碳纖維自行車製造商,其產品設計過程中應用了Keyshot、ANSYS CFD、Fusion360等諸多軟體,通過NVIDIA RTX A6000加速每一個創作流程,其許多關鍵應用程式的性能提高了2到6倍,並讓團隊可以在視頻會議中同時進行分析、建模和屏幕共享。

    在建築工程行業,全球最大的建築事務所之一KPF(Kohn Pedersen Fox Associates)在中國有許多施工案例,如深圳第一高樓平安金融中心,上海曾經的第一高樓環球金融中心等。作為最早一批使用RTX A6000的公司,KPF表示該GPU能夠將解析度提高至原來的3倍,並加快複雜建築模型的實時可視化。在KPF的可視化經理Paul Renner看來,NVIDIA RTX A6000的驚人之處在於能夠將解析度提高至原來的2倍或3倍,並顯著加快城市景觀中大型複雜建築模型的實時可視化速度。

    在傳媒娛樂這種對圖形渲染和視覺處理要求更高的行業,NVIDIA A6000的強大性能能夠更快、更輕鬆地打造各種複雜、逼真的視覺特效,滿足4K/8K圖形、圖像渲染、色彩空間變換、虛擬演播和HDR等專業領域中的顯示處理要求。獲得奧斯卡獎的視覺效果公司Digital Domain指出了創作數字人類時,NVIDIA的實時光線追蹤和機器學習的重要性。Digital Domain數字人類團隊主管Darren Hendler表示:「Digital Domain創作實時、照片級逼真數字人類的技術處於業內領先地位。我們與Epic Games和NVIDIA合作,不斷突破技術的極限。全新NVIDIA RTX A6000讓我們擁有了完全重新定義實時光線追蹤和機器學習的可能。」

多工具工作流「一站式」解決,Omniverse讓協作更輕鬆

    Omniverse作為全球首個基於NVIDIA RTX的3D仿真模擬和協作平臺,在今年10月初的GTC線上主題演講中,NVIDIA創始人兼執行長黃仁勳揭露了其公測版的相關信息。黃仁勳表示:「物理和虛擬世界將會日益融合。Omniverse讓位於全球各地或居家辦公的創作者團隊,能夠像編輯文檔一樣在同一個設計上輕鬆開展協作。」

    施澄秋介紹NVIDIA目前包含很多技術應用,如光線追蹤、物理模擬、VR/AR等,各種第三方工具軟體也對其提供支持,例如UE虛幻引擎、AUTODESK REVIT、SUBSTANCE by Adobe、Unity、MAYA等。當用戶在研發設計時,通常伴有跨軟體平臺的應用,如在不同平臺之間進行材質設計、模型構建、貼圖、組裝等,這個過程不僅涉及到繁瑣的數據資產存取、導入、導出,還可能存在數據轉換,甚至引發中間工作流程所帶來的冗餘和混亂。

    NVIDIA的Omniverse平臺能夠讓用戶無論使用什麼軟體、工具和平臺,都能以Omniverse為入口進行分發協調工作、整合工作流程,讓所有用戶、設計師、科學家和工程人員都在同一個NVIDIA Omniverse平臺上完成分工和協作。

    這其中的關鍵就是PhysX USD技術。施澄秋解釋USD是一個通用的全局場景描述文件,能把數字資產解析成在不同軟體平臺、不同ISV應用程式下都可以進行合作使用並統一存取的格式。此外,它還能夠分層式管理數據資產,讓大型團隊的不同部門在同一個場景工作並共享數據,進行協同和發布。例如遠程團隊可以通過該平臺同時開展項目協作,負責3D建築設計迭代的建築師、修改3D場景的動畫師以及協作開發自動駕駛汽車的工程師,整個協作就像是在線上共同編輯文檔一樣簡單。

    因此,對於創意工作者和開發人員而言,Omniverse的關鍵創新是僅需一鍵點擊即可在Autodesk Revit、McNeel Rhino或Trimble SketchUp之間切換。用戶無需進行數據準備或抽樣,就能使用兼容的照片級逼真的渲染軟體瀏覽大型模型。這就避免了轉化延遲和切換軟體工具造成的錯誤,大量節省了時間和成本。

    目前,Omniverse獲得了許多主要的軟體領導者支持,例如Adobe、Autodesk、Bentley Systems、Robert McNeel & Associates和SideFX等。未來,施澄秋介紹NVIDIA還與其他領先的軟體供應商合作,讓所有藝術家和設計師都可以在自己選擇的應用上通過Omniverse開展協作。

NVIDIA GTC 中國線上大會註冊正在火熱進行,誠邀您線上參與這一年度重磅 AI 與圖形技術大會。掃描下方海報二維碼立即註冊!
 

相關焦點

  • 如何做到性能翻倍 NVIDIA Ampere架構解析(全文)_影馳 GeForce RTX...
    除了性能上的提升,新的NVIDIA Ampere架構還帶來了第二代RT Core和第三代Tensor,雖然RTX 30系顯卡擁有諸多提升,但價格卻與上一代顯卡相同,在9月2日發布會當天,雖然過程僅有短短的40分鐘,卻震驚了全世界的用戶。
  • 這要從NVIDIA Ampere架構的變化說起
    這首先就要從NVIDIA全新打造的Ampere架構相對Turing架構的進化說起。GPU進化史上的奇蹟!NVIDIA Ampere架構帶來多項革命性升級★安培VS圖靈:SM單元大幅改進,效率巨幅進化!第三代的Tensor Core相比Turing架構的第二代Tensor Core性能高出一倍以上前面我們也提到,從Ampere到 Turing,RT Core從第一代升級到了第二代,Tensor Core也從第二代升級到了第三代,除了前面提到的純性能提升外,更高的性能也帶來的更多的應用可能。
  • 輕鬆打造專業家庭直播間,NVIDIA Broadcast究竟有多強?
    【天極網IT新聞頻道】北京時間9月2日,NVIDIA正式官宣萬眾期待的GeForce RTX 30系GPU,與此同時還發布了多款專為玩家打造的新技術。其中的NVIDIA Broadcast是專為主播而來的應用,旨在利用 AI 的強大功能,幫助主播們進一步提升直播質量,讓房間 「一鍵」升級為專業家庭直播工作室。
  • 從TNGA架構成功的秘密,解讀一汽豐田未來的「無限可能」
    這款全新車型搭載了亞洲龍同款的TNGA 2.0L自然吸氣發動機,並擁有同級最長的2750mm軸距,空間體驗十分優秀。 在廣州車展上,一汽豐田面向不同消費群體,推出了基於TNGA架構的三款全新產品。目前,一汽豐田主銷車型已全部實現TNGA化,同時,在TNGA架構加持下,其新能源產品矩陣、產品力也不斷升級。
  • NVIDIA CES特別直播:30系筆記本&桌面級RTX 3060登場
    此外,更多顯示器和滑鼠正加入NVIDIA Reflex陣營。售價999美元起的新一代筆記本電腦有著高達2倍的性能提升,並為輕薄筆記本電腦引入第三代Max-Q技術。全新RTX 30系列筆記本電腦GPU為《賽博朋克 2077》(Cyberpunk 2077)等頂級遊戲帶來令人驚嘆的光線追蹤遊戲體驗,並使內容創作者能使用數百個GPU加速的應用創作令人難以置信的作品。
  • 《Apex英雄》支持NVIDIA Reflex!《看門狗:軍團》公布全新推薦配置
    該技術可為數百萬GeForce玩家降低系統延遲。系統延遲(通常稱作 "輸入延遲"),是影響遊戲響應速度的關鍵因素之一。低系統延遲可以為在線遊戲玩家帶來競爭優勢。藉助最新的NVIDIA Game Ready驅動,玩家即可在更新後的《Apex英雄》(Apex Legends )中體驗NVIDIA Reflex。
  • NVIDIA 445.75版顯卡驅動發布:DLSS 2.0落地兩款遊戲
    DLSS 2.0基於NVIDIA RTX顯卡架構的Tensor Cores張量計算核心,是經過改進全新的深度學習神經網絡,能提高幀速率,同時為遊戲生成精美的圖像,最大程度地提高質量設定,提高輸出解析度。
  • NVIDIA A100 ,中國頂級雲服務提供商和系統製造商的上佳之選
    中國雲服務提供商採用NVIDIA A100為其全球用戶賦能雲實例可以幫助用戶執行更高級的實時工作負載。NVIDIA A100不僅可以滿足全球雲服務提供商用戶對性能的要求,而且還可以為全球用戶提供強大的可靠性支持。
  • NVIDIA再添「利器」:為用戶提供飛躍式應用體驗
    希望讓更多的人了解到NVIDIA全新Ampere架構的GPU、以及在Ampere GPU加持下的Omniverse能為專業可視化圖形的用戶帶來怎樣的應用體驗飛躍和應用工作流程效率提升。  NVIDIA Ampere GPU提供驚人性能  據施澄秋介紹,NVIDIA在專業視覺計算領域裡耕耘了很長時間。
  • 為《死亡擱淺》等打造的GeForce Game Ready驅動現已發布
    今天, NVIDIA發布為《死亡擱淺》(DEATH STRANDING)打造的全新Game Ready驅動。這項最新更新還對3款全新G-SYNC Compatible顯示器提供支持,新增10款遊戲支持"一鍵式"最佳可玩性設置(OPS)。
  • 年度最香Ampere甜品 NVIDIA GeForce RTX3060Ti實測
    目前,NVIDIA又針對有著中端顯卡需求的用戶們推出了甜品級的新產品——GeForce RTX 3060Ti,性能據此前網上爆料將與GeForce RTX 2080 Super持平,而價格則定位為GeForce RTX 2060 Super級別。今天我們也搶先得到了一塊公版的GeForece RTX 3060Ti,請大家隨我們一起來了解一下它的性能表現如何吧!
  • NVIDIA Broadcast:擴展直播空間
    北京時間9月2日,NVIDIA正式官宣萬眾期待的GeForceRTX 30系GPU,與此同時還發布了多款專為玩家打造的新技術。NVIDIABroadcast利用AI,將網絡攝像頭和麥克風轉變為智能設備,為用戶帶來噪音消除,虛擬背景以及人像跟蹤三項功能。    三大功能,顯著提升直播質量    首先是噪音消除功能,即消除麥克風輸入中的背景噪音,無論是裝修電鑽聲還是空調嗡嗡聲都可以消除,進而使得用戶的聲音更為清晰。
  • 普通用戶也能使用NVIDIA Studio內容進行VLOG剪輯
    直到NVIDIA推出全新的GeForce RTX 30系列顯卡,讓普通玩家不用高價購買專業顯卡也能打造一臺居家辦公的Studio PC,讓高效率的居家辦公觸手可得。 以適合普通用戶人群低成本在家剪輯渲染vlog等素材,搭載著全新的NVIDIA Ampere架構的影馳 GeForce RTX 3080 黑將最具代表性。
  • 全新第三代奔騰B70來了,新架構下的首款產品真漂亮
    這就是剛剛被正式命名為「全新第三代奔騰B70」的車型,該車型基於一汽奔騰「無限方程FMA架構」打造,體現奔騰全新的設計語言「光影哲學之性感曲面」,是這一架構下的首款產品。 ,歷時五年打造的全新技術架構。
  • NVIDIA助力渲雲洞悉渲染,共同打造CG行業雲生態
    渲染和桌面雲是網際網路上資源利用的全新方式,用戶能夠依託網際網路上異構、自治的服務對資源進行按需即取。雖然國內雲渲染和雲桌面技術起步較晚,但在市場和用戶的不同需求下,其基礎架構技術也在迭代更新。渲雲是江蘇贊奇科技股份有限公司自主研發並運營的雲渲染公共服務平臺。
  • 喜迎聖誕 NVIDIA RTX 3060Ti顯卡首發
    加州聖克拉拉市,2020年12月1日——NVIDIA推出RTX30系列甜品卡GeForce RTX 3060 Ti,它是RTX3060家族的首位成員,採用NVIDIA Ampere架構和第二代NVIDIA RTX。
  • 世界級標準,M3X火星架構原力賦能,EXEED星途攜全新一代TXL、旗艦...
    (9月26日,北京)2020北京國際車展EXEED星途正式公布了立足中國、面向全球的全新架構——M3X火星架構,基於此架構打造而來的全場景超五星SUV全新一代TXL與給家人的禮賓級SUV星途VX 290T同步亮相併開啟預售。其中,全新一代TXL預售價格區間為15萬元~18萬元,星途VX 290T車型預售價格區間為17萬元~18萬元。
  • NVIDIA成為目前唯一軟硬體均支持DX12 Ultimate的GPU廠商
    這項最新更新還對九款全新G-SYNC Compatible顯示器提供支持,新增十幾款遊戲支持"一鍵式"最佳可玩性設置(OPS)。NVIDIA於2018年推出Turing顯卡架構,率先支持DirectX 12 Ultimate。隨著該軟體的發布,遊戲開發者、創作者和遊戲玩家都可以使用革命性的實時光線追蹤技術的完整工具集。  NVIDIA GeForce軟體高級產品經理Sean Pelletier表示,"為運用下一代硬體功能,需要一個綜合軟體包。
  • OriginOS簡談,在自由與開放中,探索人機互動更多可能
    秉持著「設計為本原、本原做設計」的設計原則,vivo全新定製系統OriginOS自發布以來,就憑藉各方面的出眾表現,成為市場以及用戶關注的焦點。眾所周知,手機作業系統作為連接真實世界和數字世界的紐帶,在人機互動中可謂有著至關重要的作用。
  • 華為會員中心全新升級:更多種類福利來襲,吃玩住購行多方覆蓋
    華為會員中心全新升級:更多種類福利來襲,吃玩住購行多方覆蓋 大家還記得入秋時,網上都在曬#入秋後的第一杯奶茶#嗎?小編不知道,大家又用何種方式迎接這個冬天的到來呢?