Ampere架構GPU帶來了什麼

2020-12-05 電子發燒友

Ampere架構GPU帶來了什麼

比特網 發表於 2020-12-01 10:39:19

  在今年10月份,NVIDIA正式發布了採用8nm製程工藝Ampere架構的RTX A6000、RTX A40兩款專業圖形和計算GPU,這兩款產品採用RT Core、Tensor Core和CUDA Core,旨在加速圖形、渲染、計算和AI,分別面向工作站和伺服器用途。

  長久以來,NVIDIA在專業級別GPU領域不斷進行創新,此前已經推出過Kepler、Maxwel、Pascal以及Turing等架構,此次,最新的Ampere架構在圖形處理、AI、光線追蹤等性能上又有進一步的提升。

  NVIDIA 中國區高級技術市場經理施澄秋表示:「在過去20年裡,NVIDIA在各式各樣的圖形和可視化運算及AI等不同領域,都針對GPU做出相應優化。NVIDIA GPU無論是在軟硬體設計,還是功能改進,都針對不同用戶產生了不同性能飛躍,包括現在很流行的AEC、BIM、CAM等。」

  此外,NVIDIA還帶來了全新Omniverse平臺的秋季更新,有了這套平臺,分散在各地的遠程團隊,能夠同時針對特定的設計項目來進行協同作業。

  Ampere架構GPU帶來了什麼

  我們發現,在發布全新的RTX A6000系列顯卡時,與此前的「Tesla」一樣,「Quadro」品牌也被NVIDIA淡化了。NVIDIA沒有對變更名稱給出官方的解釋,筆者認為主要是因為目前圖形卡、計算卡的界限漸漸地模糊,產品線之間的重合度越來越高造成的,這也可以理解為NVIDIA未來的GPU產品線突破了自己「畫的圈」,更加「野蠻」地生長。

  隨著Ampere架構的發布,NVIDIA進一步提升在GPU領域中主導地位,新架構與前代Turing相比有三大優勢:

  一、新一代的SM(新一代流式多處理器)架構最高可以提供39 TFLOPS的FP32算力。

  二、第二代RT Core相對於第一代Turing架構裡的RT Core最高可以提供76 TFLOPS光線追蹤算力。和以往GPU不同的是除了SM之外,加入了RT Core、Tensor Core,該張量運算核心主要是針對AI裡面最有倚重、最主要的運算單元Tensor Core。

  三、新架構產品最多可以提供310個Tensor TFLOPS的算力。

  NVIDIA Ampere架構和上一代Turing架構相比最重要的就是SM以及傳統圖形運算核心採用全新設計,進行全新增強,並採用基於全新架構及設計第二代RT Core及第三代Tensor core,使得RTX A6000在性能、AI、光線追蹤等方面獲得了非常大的增強。

  施澄秋表示:「其實就CAD、CAM或者模擬,以及整個大型複雜零組件裝配等工作來說,對於GPU的依賴程度非常高。企業去設計一款產品,產品本身可能對於用戶而言只是一個最終拿到手上的物品,但生產製造設計人員其實經歷了非常多的繁瑣、冗長的步驟。」

  也的確如此,比如設計一款產品要經過選擇材質、考慮材質的牢固程度、材質的耐磨損程度、材質使用過程中的舒適程度以及美觀程度,還要考慮產品是否符合人體工學等等一系列的設計和製造流程。在過程中要花費設計人員相當多的時間與精力。

  而在使用高性能的RTX A6000或A40時,就可以幫助大家節約很多的工作時長、能夠大幅提升工作流程和效率,優化每一個步驟。這樣的過程中,其實NVIDIA專業可視化顯卡一直以來都是生產類工具。

  對於採用A6000的實例,美國NASA給出了一個評價很有意思,他們覺得新一代Ampere架構的A6000與雙路的上一代旗艦級別的RTX8000運算能力差不多,而且,功耗、散熱、噪音以及管理成本都下降不少,這足以說明Ampere架構的提升。

  讓遠程協助更簡單

  今年的疫情改變了很多人的工作方式,其中就包括創意工作者以及開發人員。

  一直以來,設計人員為了創建視覺效果、建築可視化和製造設計,需要不同團隊協作,並且,在設計完成之後還需要多個客戶進行審查。

  由於不同的文件格式、所有權、軟體和團隊不連通等問題,不同軟體之間無法建立聯繫,不但會導致信息延遲,在某些情況下還會影響效率甚至阻礙工作的完成。Omniverse能夠讓不同的設計師使用不同的工具,無縫地完成同一個設計項目的不同部分。

  在Omniverse推出之後,另一個關鍵創新是僅需一鍵點擊即可在Autodesk.Revit、McNeel.Rhino或Trimble.SketchUp之間進行切換。用戶無需進行數據準備或抽樣,就能使用兼容的照片級逼真的渲染軟體瀏覽大型模型。這就避免了轉化延遲和切換軟體工具造成的錯誤,大量節省了時間和成本。

  此外,Omniverse還更好地對光線追蹤進行支持,可以把實時光線追蹤的能力帶到任何一個設備上。我們以前給客戶做演示的時候會拿一個手機或者平板電腦,客戶可能只會看到一張圖或者一個視頻,既不可交互也不能改變視角。

  藉助Omniverse平臺,設計師可以用流媒體的方式把設計程序,甚至整套流程串流到任何一個設備上。只需一臺平板電腦/手機/上網本/輕型筆記本,就可以給客戶進行演示,而且還可以得到實時反饋,讓客戶看到當前設計的狀況,甚至可以利用AR/VR的方式讓用戶更真實的體驗你所使用地應用程式。

  如果Omniverse平臺有RTX A6000顯卡加持,會創造出什麼樣的畫面呢?在NVIDIA剛剛放出來的夜間版《Marbles》便是這兩者合體的傑作,施澄秋介紹:「視頻中物體的摩擦、彈跳、互動,包括裡面不同位置的聲音全部由NVIDIA Ampere架構的技術來完成。該視頻製作者來自超過12個團隊,幾十個工程師和設計師分散在全世界各個地方,實時利用NVIDIA Omniverse和NVIDIA RTX Ampere架構GPU完成了這一藝術創舉。」

  寫在最後

  在Turing架構推出三年之後,NVIDIA為大家帶來了更加強悍的Ampere架構,讓我們再一次感受到GPU性能的提升,而且二代RT Core、Tensor Core的引入對全新光線追蹤和AI性能的加強也讓其成為更出色的生產工具。

  今年7月NVIDIA市值達到2513億美元,首度超越Intel成為美國市值最高半導體公司,截止至目前,其市值更突破3000億美元大關,在NVIDIA剛剛發布的第三季度財報中,創下收入47.3億美元的記錄。一個個記錄隨時間遷移不斷被打破,未來還會發生什麼?我們非常期待。
責任編輯:YYX

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 盤點:GPU加速的神經網絡與JavaScript的交叉
    訓練神經網絡與深層架構是一個計算密集型過程,在機器智能領域帶來了許多重要的先進結果。本文著眼於這些趨勢的不斷融合,並提供了將GPU加速的神經網絡引入到JavaScript世界的一些項目的概述。雖然在網站上提到了「類似numpy 的基礎架構」作為目標,但是API在「繁重的開發」下,包括與神經網絡和計算機視覺相關的功能。使用load函數,可以解析npy文件的內容並作為張量使用。在瀏覽器環境中,PropelJS使用了deeplearn.js中的WebGL功能。對於節點的GPU加速,項目使用了TensorFlow的C API。
  • 全新架構來襲,解讀NVIDIA Ampere如何為用戶打造更多可能
    從最早的Kepler架構到Maxwel、Pascal、Turing以及今年10月正式發布的Ampere架構,NVIDIA為數百萬藝術家、設計師和工程師帶來了GPU的強勁性能提升。     當前,雲計算、5G、人工智慧、虛擬客戶體驗等各類數位技術正在改變著我們的生活工作方式和企業的運營方式。
  • NVIDIA或推Volta架構GPU 但GTX 2080仍是Pascal架構
    Volta架構GPU將會由臺積電代工,基於改良過的12nm FinFET工藝。GeForce遊戲顯卡的具體上市時間仍未公布,但看到Pascal架構今年非常強勢而且暫時未有競品能動搖到其高端產品的地位,NVIDIA極有可能在2017年的新一代顯卡繼續沿用Pascal(Pascal Refresh),到2018年才把Volta架構顯卡公諸於世。
  • 70+款採用NVIDIA Ampere架構的全新GeForce RTX筆記本電腦發布
    GeForce RTX 30 系列筆記本電腦 GPU 帶來高達 2 倍性能提升,搭載第3代 Max-Q 技術,售價 999 美元起美國加利福尼亞州聖克拉拉市,2021 年 1 月 12 日——今天, NVIDIA Ampere 架構筆記本電腦正式邁入新時代--70 多款筆記本電腦正式發布,搭載 GeForce RTX 30 系列筆記本電腦GPU。
  • 顯卡帝教你讀懂GPU架構圖 輕鬆做達人
    :    一、頂點、像素、著色器是什麼;    二、SIMD與MIMD的架構區別;    三、A/N在統一渲染架構革新中的三次交鋒情況如何;    四、為什麼提出並行架構設計;    五、A/N兩家在GPU架構設計的特點及其異同點是什麼。
  • 英偉達Turing架構Quadro系列GPU國內首次亮相
    DoNews8月24日消息(記者 程侃如)8月23日,英偉達在第二十七屆北京國際廣播電影電視展覽會上介紹了採用全新Turing架構的全球首款光線追蹤GPU:NVIDIA? Quadro? RTX? GPU,並演示適用於廣電傳媒娛樂領域各類專業工作流程的技術與應用。
  • 傳Nvidia下代遊戲顯卡跳過Volta使用Ampere架構
    【中關村在線新聞資訊】2月10日消息:Nvidia的Volta架構顯卡一直是作為商用級產品推出的,而玩家們則一直在等著Volta架構的遊戲級顯卡。但現在看來,Nvidia似乎並不打算推出等著Volta架構的遊戲卡。
  • 英偉達 NVIDIA 顯卡,架構和對應型號解析
    英偉達桌面型顯卡的架構,是以科學家的名字來命名的。>GTX 1050GTX 1060GTX 1070GTX 1080GTX 1080TINVIDIA TITAN X(新TITAN X)【安培 ampere
  • NVIDIA:圖靈是架構變化最大的GPU之一,性能提升兩倍
    在8月20日的科隆遊戲展上,NVIDIA推出了Turing圖靈架構,並首發了三款顯卡——GeForce RTX 2080 Ti/2080/2070,本月17日才會正式解禁。NVIDIA財務長Colette Kress日前透露說圖靈是他們史上架構變化最大的GPU之一,性能相比以前的顯卡大幅提升,不考慮光線追蹤處理的的話性能提升兩倍,如果考慮光線追蹤,性能就是提升六倍了。NVIDIA CFO Colette Kress以及投資者關係部門的Simona Jankowski日前參加了花旗集團2018全球技術大會。
  • 7nm GPU又要等了 NV黃仁勳:沒必要升級Volta及Turing架構
    NVIDIA的Volta架構GPU發布於2017年5月份的GTC大會上,距今2年多了,號稱研發投入超過30億美元,目前依然是NVIDIA Tesla系列加速卡、Quadro系列專業卡的基礎。黃仁勳提到,在伺服器領域打好硬體基礎通常需要數年時間,這個過程要涉及提前規劃,從這一點上來說Volta架構在明年底之前都會保持成功,軟體生態優化還可以發揮重要作用。
  • IMR, TBR, TBDR 還有GPU架構方面的一些理解
    虛擬內存:則可以用下面這張圖總結,作業系統完成由虛擬內存地址到真實內存地址或者磁碟地址之間的映射工作,這樣子給用戶提供的虛擬內存的地址空間就可以非常非常大,用戶程序中那些很久都用不到的內存空間可以被作業系統給搞到磁碟上邊存儲,什麼時候需要用了,又從磁碟中加載到真實內存中,這個過程全部是作業系統自動完成的。
  • 關於NVIDIA 安培架構 GPU最新講解!下周一直播,快上車~
    巔峰贅婿原標題:關於NVIDIA安培架構GPU最新講解!下周一直播,快上車~5月14日,在GTC2020上,NVIDIA新一代GPU架構「安培(Ampere)」正式發布,同時推出首款基於安培架構的GPU——NVIDIAA100。
  • 基於RTX2060構建TensorFlow-gpu(keras)學習平臺
    一、conda命令1. onda env list 或 conda info -e 查看當前存在哪些虛擬環境2. conda create --name tf36gpu python=3.6 anaconda3. conda remove -n
  • GeForce RTX 30系列顯卡曝光:NVIDIA Ampere架構+8nm工藝
    GeForce RTX 30系列顯卡採用全新的NVIDIA Ampere架構和8nm工藝,可以在更高的解析度下給玩家提供更出色,更流暢的視覺體驗。首批上市的顯卡除了已經開售的RTX 3080,還包括RTX 3090和RTX 3070。
  • NVIDIA Volta架構GPU或2017面世 12nm工藝
    【PConline 資訊】有外媒透露NVIDIA計劃在今年發布其新世代基於12nm工藝的Volta架構GPU,但Fox Bussiness說NVIDIA的下一代顯卡(GTX20系列)依然會使用Pascal架構,以及通用計算超算、機械學習、人工智慧等方面。
  • NVIDIA RTX 30系列架構詳解:8nm安培GPU的兩倍性能從何而來?
    在當前的顯卡市場上,佔據80%的NVIDIA公司被玩家愛且恨著——他們帶來了最近十多年來最好的顯卡,同時也讓高端遊戲卡的價格高企,發燒顯卡至少五位數起。今天我們就來從詳細解讀一下安培GPU的架構,探究它到底帶來了哪些技術升級以致於讓NVIDIA創始人黃仁勳稱之為有史以來性能提升最大的一次。
  • 英偉達發布新一代GPU架構用於數據中心,遊戲玩家得再等等
    黃仁勳在演講中花大量篇幅展示了新的安培架構GPU,以顯示其與前一代伏特架構相比更為強大的性能。作為安培架構首發的NVIDIA A100搭載高達540億個電晶體,是目前當前最大的7納米製程晶片。在滿足AI運算需求上, 新GPU可使AI運算性能提高20倍;在數據中心高性能計算用途方面,NVIDIA A100相較前一代可提高2.5倍運算量。
  • 亞馬遜加持,英偉達A100 GPU將無人匹敵?
    單個NVIDIA DGX A100系統(帶有8個A100 gpu)在某些AI應用上可以提供與近1000臺雙插槽CPU伺服器相同的性能。 英偉達負責加速計算的副總裁伊恩 巴克(Ian Buck)在公布基準業績後表示:「每個行業都在尋求更好的方式,應用人工智慧來提供新的服務,並擴大業務,我們正處於一個歷史的轉折點。」
  • AMD宣布全新CDNA GPU架構:數據中心計算專用
    AMD CPU架構這幾年發展的順風順水,Zen、Zen+、Zen 2、Zen 3、Zen 4每一代都表現驚豔,GPU架構就相對暗淡一些了:GCN已經服役多年廉頗老矣,RDNA閃亮登場但依然無法和對手全面抗衡。
  • 蘇姿豐發布RDNA2架構RX 6000系列新顯卡,與英偉達RTX 3000決戰...
    AMD蘇姿豐親自上陣,為大家帶來了新一代 Radeon RX 6000系列顯卡,全面對標Nvidia 的 RTX 3000系列。 >三個新卡全部基於AMD最新的RDNA2 GPU架構。