VCZ曝光NVIDIA Turing架構秘密:SM單元大改,CUDA性能提升50%

2021-01-18 超能網

NVIDIA第一批光線追蹤顯卡評測解禁臨近,但我們依然對其中Turing架構的細節一無所知,這與NVIDIA最近實施最強的管控措施有關,從源頭上就限制住各方提前爆料的可能性,比如說顯卡不能提前給媒體、限制驅動分發等等。所以想提前知道詳細規格、性能如何?但這難不倒VideoCardZ,他們居然曝光了Turing架構顯卡的一些秘密,比方說SM單元大改,CUDA性能提升50%,RTX 2070其實用TU106核心,還有一大堆新的著色技術引入。

由於NVIDIA尚未公布Turing架構白皮書,很多細節無法得知。但VideoCardZ不知道哪裡搞來了全套架構圖,公布的架構圖與NVIDIA官方傳統風格不一樣,可能是為了規避水印而做的高清重製版本,真實性應該可以得到確認,不然沒事誰會亂P一個架構圖呢?

我們先來看看SM單元的組成吧。除了原有的FP32單精度單元,FP64雙精度單元全都砍掉了,加入了INT32單元以及Tensor Core,底下新增加了一個相對獨立的RT Core。VCZ還提到Turing架構SM單元還將共享緩存、L1緩存、紋理緩存引入了統一架構,可以讓L1緩存更充分利用資源,這樣的設計可以使得每一個CUDA單元獲得50%的性能提升。

來源VideoCardZ

再回到比較大的層面上,看看RTX 2080 Ti的TU102框架圖,這可不得了非常壯觀的規格。TU102一共分為6組GPC單元,每組GPC單元又擁有12個SM單元,一共是72個SM單元,但RTX 2080 Ti也只是用了68個而已。同時按照已經RTX 2080 Ti已經公布的參數,可以計算得出,每個SM單元將會配備64個CUDA、8個Tensor Core 、1個RT Core。

來源VideoCardZ

完整版的TU106核心依然是6組GPC單元,不過每組GPC改為8個SM單元,一共是48個,RTX 2080的GPU核心是TU104-400,只用上了46組,還有預留有2組空缺的。VCZ給出的數據是545平方毫米,一共有136億電晶體。

來源VideoCardZ

原本以為RTX 2070依然會是TU104核心「閹割」下來,但是VCZ確實是全新的核心型號TU106,你可以將其視作RTX 2080 Ti規格砍半,3組GPC單元,3×12=36組SM單元,經過計算,RTX 2070是滿血版的TU104核心。VCZ給出的數據時454平方毫米,一共有106億電晶體。但是這樣算下來,RTX 2070規格並不比GTX 1080好多少,性能提升堪憂。

來源VideoCardZ

Turing顯卡使用了新的顯存無損壓縮技術,不過VCZ也只是簡單說明了相比於Pascal顯卡有50%帶寬增長而已,沒具體說明。

此外NVLink可以確認為RTX 2080 Ti、RTX 2080獨享,RTX 2070並不支持。此外新的Turing顯卡使用了新的視頻圖像引擎,支持Displayport 1.4標準,最高可以輸出8K@60Hz圖像,還可以一次性驅動兩臺這樣的顯示器。 新編解碼引擎,可以編碼H.265 8k@30FPS視頻,或者解碼YUV 4:4:4 10/12bit HDR 8K和VP9 10/12bit HDR視頻。

還有一大堆新的著色技術,比如Mesh Shading 、Variable Rate Shading (VRS)、Texture-Space Sharing、Multi-View Rendering (MVR) 等。

相關焦點

  • GTX1180曝光 Volta架構12nm工藝性能提升50%
    從資料庫中能夠看到,GTX 1180採用了Volta架構,核心為GV104,基於12nm製程工藝,有3584個流處理器,224個陰影單元,64個光柵單元,256bit顯存位寬,16GB GDDR6內存,12GHz內存頻率。核心頻率為14052MHz,單精度浮點性能為13TFLOPs,功耗高達200W。
  • 性能暴增50%!NVIDIA全新顯卡架構Volta解析
    GP100核心架構示意圖回到GP100與GV100大核心上,他們的架構也是漸進式變化,也是6組GPC計算單元,不過GP100核心每個GPC單元中是10組SM單元,每個SM單元有64個CUDA核心,而GV100大核心中每組GPC單元是14個SM單元,總數應該是84組SM單元,但是現在Tesla V100跟Tesla V100一樣都不是完全體,前者啟用了56組SM單元
  • 12倍於上代的DP性能 NVIDIA Volta架構解析
    NVIDIAVolta架構,一個在幾年前便已經被曝光的次世代架構,於上周的GTC2017大會上正式與大家見面。正如老黃去年所說的,NVIDIA未來會大幅提高產品的迭代速度以推動GPU界的發展,Volta架構的發布時間正好距Pascal架構的發布過了一年。
  • NVIDIA安培架構RTX 30系顯卡性能曝光:提升31%超給力
    電腦硬體更新頻率之快令人驚嘆,很多網友感嘆,我連光追特效都還沒有體驗過,NVIDIA下一代安培架構RTX 30系顯卡的性能跑分已經曝光了,據說提升高達31%,真的是非常給力,看來又可以再等等了!而隨著時間的臨近,關於NVIDIA下一代基於安培架構的RTX 30系列遊戲顯卡的各路曝光信息也逐漸多了起來。
  • NVIDIA RTX 30系列架構詳解:8nm安培GPU的兩倍性能從何而來?
    與圖靈顯卡相比,安培GPU的變化之大讓人驚訝,在過去十多年的顯卡升級換代中,性能翻倍的提升很少見到了,NVIDA是怎麼做到的?今天我們就來從詳細解讀一下安培GPU的架構,探究它到底帶來了哪些技術升級以致於讓NVIDIA創始人黃仁勳稱之為有史以來性能提升最大的一次。
  • NVIDIA Turing架構解析:追光逐影,成敗未定
    與過去推出的產品大不相同,NVIDIA已將其最新顯卡的介紹內容分為兩部分:架構和性能。近日,NVIDIA終於揭開了全新Turing架構細節的面紗,雖然一些有趣的方面尚未得到官方解釋,還有一些環節需要與客觀數據一起深入研究,但也讓我們有機會深入了解那項為GeForce RTX冠名的技術:光線追蹤。
  • NVIDIA發布GeForce RTX平臺遊戲顯卡,全新Turing架構性能提升6倍
    NVIDIA發布GeForce RTX平臺遊戲顯卡,全新Turing架構性能提升6倍NVIDIA 創始人兼執行長黃仁勳先生表示: 「Turing 開啟了遊戲行業又一個黃金時代,它為玩家奉上只有光線追蹤技術才能實現的高保真度,而此前大多數人認為仍需十年努力才可實現這一成果。
  • NVIDIA:圖靈是架構變化最大的GPU之一,性能提升兩倍
    對於圖靈這一代的顯卡,由於公版的價格大漲,RTX 2080已經上到6499元,RTX 2080 Ti則要9999元,因此大家最關注的就是新一代顯卡性能增加了多少,遊戲玩家到底能享受到多大的提升,是不是物有所值。這段時間有不少RTX 2080/2080 Ti顯卡測試性能曝光,不過現在官方還沒解禁,很多東西還不確定。
  • 5nm+CUDA數量翻倍!NVIDIA新一代GPU太兇猛
    系列顯卡的旗艦級產品上,也代表著該架構在消費者市場的潛在最高性能表現。 新架構全系產品都會將製程工藝升級為5nm,將配備比前兩代更大的緩存空間,AD102晶片將配備12個圖像處理器模塊(12*6架構)、擁有72組紋理處理單元、144組流處理器單元、
  • NVIDIA GM200怪獸級顯卡性能曝光 超Titan Black 50%
    GTX 980和GTX 970讓大家知道NVIDIA Maxwell架構不論是性能還是功耗都有極優秀的表現,其中GTX 970 2499元起的價格(實際還能更低)也不算很貴。
  • RTX 2080TI顯卡的圖靈架構是什麼?
    9月20全新一代顯卡即將同步發售了,自2080ti顯卡發布以來持續熱議,除了被吐槽的煤氣灶外形,更多的還是對性能的期待。性能的大幅升級之外,新一代顯卡最大的變化還是架構的更新。全新的圖靈架構,是新款顯卡的秘密武器。
  • Win10+GeForce 940MX+Cuda9.2環境安裝PyTorch
    02Visual Studio安裝地址https://visualstudio.microsoft.com/zh-hans/vs/older-downloads/03Cuda9.2安裝地址https://developer.nvidia.com
  • NVIDIA下一代RTX 40情報曝光
    新架構全系產品都會將製程工藝升級為5nm,將配備比前兩代更大的緩存空間,AD102晶片將配備12個圖像處理器模塊(12*6架構)、擁有72組紋理處理單元、144組流處理器單元、高達18432個 FP32單元(CUDA核心)和高達66 TFlops的運算性能。
  • NVIDIA下代架構進駐超級計算機:性能猛增75%
    NVIDIA Turing(圖靈)架構帶來了全新的光線追蹤,堪稱GPU歷史上的一大革命,而經過兩代產品的迭代,下一代Ampere(安培)架構也是呼之欲出,最早有望在3月份的GTC圖形大會上公布。美國印第安納大學將在建校200周年之際打造全新的超級計算機「Big Red 200」,其中就會部署基於下代架構的NVIDIA GPU!據悉,這臺超算將分兩期建設,一期已經上線,包含672個雙路節點,處理器是AMD的最新旗艦級霄龍7742,64核心128線程,整套系統總共86016個核心、172032個線程。二期則會加入NVIDIA的下一代GPU。
  • 跨時代大升級!華為Mate40 Pro曝光:五攝+麒麟1020+A78架構
    但是,麒麟990相對於上一代的提升並不是很大。因為晶片都是基於7nm製程,麒麟990 5G還額外集成了5G基帶,所以在性能上只有微小的改進。我個人認為,現在並不是換機的好時機,等到臺積電5nm技術開始量產,5G基帶繼續完善功耗,才到了換機的好時機。4月29號,外媒傳來最新消息,華為Mate40 Pro的相機渲染圖已經被曝光了,設計大改,性能大幅度提升。
  • IT圈那些事:性能暴漲 看NVIDIA新GPU架構_SSD內存硬碟應用_太平洋...
    IT圈那些事:性能暴漲 看NVIDIA新GPU架構  本期的話題包括:「性能暴漲 NVIDIA新GPU架構曝光」、「今天吃藥了嗎? 性能暴漲 NVIDIA新GPU架構曝光!還原新聞熱點:  NVIDIA在GTC大會的第二天公布全新的GPU架構路線圖,NVIDIA新一代的Volta(伏打)架構首次曝光。
  • NVIDIA正式公布Turing架構:新增RT Core,12年來圖形界最偉大的飛躍...
    NVIDIA的官方直播大概是早上的8:45結束的,現在還有很多細節沒有公布出來,所以我們先來看看官方的Newsroom,首先關於Turing架構,NVIDIA對其非常有自信,稱其為自從2006年通過統一渲染架構帶來CUDA後最偉大的飛躍,所以你可想而知NVIDIA對其的期望,或者說野心。
  • AMD 7nm Navi顯卡架構變了:GCN重組 後端性能翻倍
    Navi顯卡預計還是基於AMD的GCN架構,但在7nm工藝加持下,Navi從架構到規格,從性能到能效都會有明顯的變化,此前爆料稱Navi顯卡會擁有40組CU單元,2560個流處理器單元,頻率可以達到2GHz,綜合性能提升30%,能效進步相當於NVIDIA從Kepler到Maxwell那一代。從Kepler到Maxwell的能效提升意味著什麼?
  • NVIDIA Turing 架構獲得2019年度行業創新獎
    其中,NVIDIA Turing 架構榮獲2019年度行業創新獎,引領產品技術創新,取得了跨越性的突破。NVIDIA Turing 架構是近些年對於顯卡發展影響最大的產品,在保留傳統顯卡架構的核心之外,還加入了RT Cores、Tensor Cores,從而賦予了顯卡核心RTX實時光線追蹤、DLSS深度學習超級採樣以及NVIDIA NVENC編碼器等技術。