從最早的Kepler架構到Maxwel、Pascal、Turing以及今年10月正式發布的Ampere架構,NVIDIA為數百萬藝術家、設計師和工程師帶來了GPU的強勁性能提升。
當前,雲計算、5G、人工智慧、虛擬客戶體驗等各類數位技術正在改變著我們的生活工作方式和企業的運營方式。在全新的數字經濟環境下,無論是企業的研發設計、模擬仿真還是個人的圖形處理、視覺優化,都對GPU性能有了更高的要求,企業需要更強勁的GPU性能讓響應更加迅速、協作更加高效。
作為GPU的發明者和全球圖形運算行業領袖,NVIDIA從推出第一代GPU架構開始,就在不斷創新迭代,使GPU架構更加符合不同環境下的圖形和可視化運算要求,從最早的Kepler架構到Maxwel、Pascal、Turing以及今年10月正式發布的Ampere架構,NVIDIA為數百萬藝術家、設計師和工程師帶來了GPU的強勁性能提升。
「在過去20年裡,NVIDIA在不同領域針對GPU進行優化,無論是軟硬體設計,還是功能改進,使不同用戶產生了性能飛躍。」日前,在GPU舉辦的線上媒體溝通會上,NVIDIA 中國區高級技術市場經理施澄秋進一步解讀了全新Ampere架構的GPU的技術特點和性能優勢,並以實際應用案例詮釋NVIDIA Ampere架構GPU如何為用戶帶來應用體驗飛躍和工作效率提升。
圖 NVIDIA GPU架構發展路線圖
性能突破,Ampere架構下的非凡體驗
基於Ampere架構,NVIDIA發布了面向工作站的RTX A6000和面向伺服器的RTX A40。兩者均採用了最新的Ampere架構,並在GPU 配置上保持一致性,即84個帶有 GA102 GPU 的流式多處理器。唯一的區別在於前者是主動散熱,而後者是被動。與上一代產品相比,施澄秋介紹NVIDIA Ampere GPU架構的性能提升主要體現在以下三個方面:
圖 NVIDIA Ampere架構三大性能提升
首先,是在流式多處理器(SM)架構上,新一代最高可以提供39 TFLOPS的FP32算力。由於目前FP32(單精度浮點)主要用於圖形運算或者物理模擬,對於運算結果的精度要求並不高,例如在研發設計方面,以CAD、CAM的研發設計仿真精度權重並不是首位,FP32既可以滿足需求。因此,NVIDIA針對新一代的流式多處理器架構進行優化,使其單精度浮點達到上一代Turing架構的2倍。
其次,在RT (實時光線追蹤)Core上,NVIDIA在Turing架構裡首次引入了專門的光線追蹤運算環境,通過BVX算法使用一個專門電路運算光線軌跡及當前畫面裡3D建模之間的光線反射、折射或更複雜的軌跡,例如鏡面反射、漫反射等,讓電腦畫面更加逼真,達到照片級渲染精度。在新的Ampere架構下,NVIDIA對BVX算法進行了優化,最高可提供2倍於上一代的吞吐量,以及並行光線追蹤、著色和計算功能。
最後,在Tensor Core(張量計算核心)方面,我們知道由於總性能是一定的,精度提高時,運算量就會增加,性能自然也會降低。NVIDIA Ampere 的TF32精度可以快速適應FP32精度,在吞吐量上達到上一代的5倍。此外,Ampere架構支持全新TF32和BF16數據格式,結合稀疏運算特性提供10倍加速性能。值得一提的是,DDR6顯存和PCIe Gen 4作為發展趨勢,在全新的Ampere架構下都得到支持。目前單個GPU可提供的最大內存以達到48GB。
多行業場景下的最佳實踐
如今,人們對消費品的功能性和創新性期待日益增高,對於研發設計人員而言,其複雜性隨之加大。施澄秋介紹日常生活中看似一個簡單的商品,其背後經歷了非常多的繁瑣、冗長的步驟,例如選擇何種材質、材質的牢固程度、材質的耐磨損程度、材質使用過程中的舒適程度以及美觀程度,以及是否符合人體工學等等,涉及到多次模擬仿真和討論修改,而NVIDIA就是要加速設計和創新過程,提升效率,讓企業創新步伐邁的更快。
例如Predator Cycling,美國的一家碳纖維自行車製造商,其產品設計過程中應用了Keyshot、ANSYS CFD、Fusion360等諸多軟體,通過NVIDIA RTX A6000加速每一個創作流程,其許多關鍵應用程式的性能提高了2到6倍,並讓團隊可以在視頻會議中同時進行分析、建模和屏幕共享。
在建築工程行業,全球最大的建築事務所之一KPF(Kohn Pedersen Fox Associates)在中國有許多施工案例,如深圳第一高樓平安金融中心,上海曾經的第一高樓環球金融中心等。作為最早一批使用RTX A6000的公司,KPF表示該GPU能夠將解析度提高至原來的3倍,並加快複雜建築模型的實時可視化。在KPF的可視化經理Paul Renner看來,NVIDIA RTX A6000的驚人之處在於能夠將解析度提高至原來的2倍或3倍,並顯著加快城市景觀中大型複雜建築模型的實時可視化速度。
在傳媒娛樂這種對圖形渲染和視覺處理要求更高的行業,NVIDIA A6000的強大性能能夠更快、更輕鬆地打造各種複雜、逼真的視覺特效,滿足4K/8K圖形、圖像渲染、色彩空間變換、虛擬演播和HDR等專業領域中的顯示處理要求。獲得奧斯卡獎的視覺效果公司Digital Domain指出了創作數字人類時,NVIDIA的實時光線追蹤和機器學習的重要性。Digital Domain數字人類團隊主管Darren Hendler表示:「Digital Domain創作實時、照片級逼真數字人類的技術處於業內領先地位。我們與Epic Games和NVIDIA合作,不斷突破技術的極限。全新NVIDIA RTX A6000讓我們擁有了完全重新定義實時光線追蹤和機器學習的可能。」
多工具工作流「一站式」解決,Omniverse讓協作更輕鬆
Omniverse作為全球首個基於NVIDIA RTX的3D仿真模擬和協作平臺,在今年10月初的GTC線上主題演講中,NVIDIA創始人兼執行長黃仁勳揭露了其公測版的相關信息。黃仁勳表示:「物理和虛擬世界將會日益融合。Omniverse讓位於全球各地或居家辦公的創作者團隊,能夠像編輯文檔一樣在同一個設計上輕鬆開展協作。」
施澄秋介紹NVIDIA目前包含很多技術應用,如光線追蹤、物理模擬、VR/AR等,各種第三方工具軟體也對其提供支持,例如UE虛幻引擎、AUTODESK REVIT、SUBSTANCE by Adobe、Unity、MAYA等。當用戶在研發設計時,通常伴有跨軟體平臺的應用,如在不同平臺之間進行材質設計、模型構建、貼圖、組裝等,這個過程不僅涉及到繁瑣的數據資產存取、導入、導出,還可能存在數據轉換,甚至引發中間工作流程所帶來的冗餘和混亂。
NVIDIA的Omniverse平臺能夠讓用戶無論使用什麼軟體、工具和平臺,都能以Omniverse為入口進行分發協調工作、整合工作流程,讓所有用戶、設計師、科學家和工程人員都在同一個NVIDIA Omniverse平臺上完成分工和協作。
這其中的關鍵就是PhysX USD技術。施澄秋解釋USD是一個通用的全局場景描述文件,能把數字資產解析成在不同軟體平臺、不同ISV應用程式下都可以進行合作使用並統一存取的格式。此外,它還能夠分層式管理數據資產,讓大型團隊的不同部門在同一個場景工作並共享數據,進行協同和發布。例如遠程團隊可以通過該平臺同時開展項目協作,負責3D建築設計迭代的建築師、修改3D場景的動畫師以及協作開發自動駕駛汽車的工程師,整個協作就像是在線上共同編輯文檔一樣簡單。
因此,對於創意工作者和開發人員而言,Omniverse的關鍵創新是僅需一鍵點擊即可在Autodesk Revit、McNeel Rhino或Trimble SketchUp之間切換。用戶無需進行數據準備或抽樣,就能使用兼容的照片級逼真的渲染軟體瀏覽大型模型。這就避免了轉化延遲和切換軟體工具造成的錯誤,大量節省了時間和成本。
目前,Omniverse獲得了許多主要的軟體領導者支持,例如Adobe、Autodesk、Bentley Systems、Robert McNeel & Associates和SideFX等。未來,施澄秋介紹NVIDIA還與其他領先的軟體供應商合作,讓所有藝術家和設計師都可以在自己選擇的應用上通過Omniverse開展協作。
NVIDIA GTC 中國線上大會註冊正在火熱進行,誠邀您線上參與這一年度重磅 AI 與圖形技術大會。掃描下方海報二維碼立即註冊!