NVIDIA曝光Pascal顯卡:浮點性能高達GK110的三倍

2021-01-10 遊民星空

  NVIDIA今年會推出新一代Pascal顯卡,最快4月份的GTC 2016大會上就能見到面向高性能伺服器市場的Tesla版GP100核心顯卡。只不過NVIDIA這次的保密工作做到太好了,除了官方公布過的3D顯存、FinFET工藝之外,Pascal顯卡的規格還是非常神秘。還好NVIDIA功虧一簣,日前曝光的一份文檔中顯示Pascal顯卡配備的3D顯存帶寬高達1024GB/s,單精度浮點性能12TFLOPS,雙精度浮點性能4TFLOPS,是GK110核心的三倍之多。

  3DCenter論壇有網友找到了NVIDIA公司CUDA院士Manuel Ujaldon去年6月份發布的一份演講文檔,他本身也是西班牙大學教授,這份文檔裡對比了Intel、AMD及NVIDIA公司不同處理器、顯卡的帶寬及計算性能,我們來看最關鍵的Pascal與Teslak K20X的對比。

  K20X使用的是GK110核心,14組SMX單元,2688個CUDA核心,384bit位寬,帶寬25GB/s,單精度浮點性能3.95TFLOPS,雙精度浮點性能1.31TFLOPS。Pascal顯卡規格沒提,但應該是GP100核心,配備3D顯存,帶寬1024GB/s,單精度浮點性能12TFLOPS,雙精度浮點性能4TFLOPS。

  GK110與Pascal之間隔了Maxwell架構,不過Maxwell顯卡之所以高效,很大一部分原因是閹割了雙精度單元,所以在這一點上它實際上連GK110核心都不如,這可能是GM200核心沒有加入對比的原因。

  只看GK110與Pascal的GP100核心,GP100的性能是GK110核心的三倍,單精度及雙精度差不多都是這樣。雖然缺少與GM200核心的直接對比,但GM200核心的Tesla M40單精度性能是7TFLOPS,以此計算的話GP100性能依然是GM200核心的1.7倍,也就是性能提升了70%。


不同處理器/顯卡的帶寬性能比

  從三倍GK110性能來看,GP100核心的規模也一定很龐大,所以之前傳聞的6144個CUDA核心、170億電晶體以及600mm2核心面積的傳聞還是有一定可信度的。

  值得一提的是,Pascal顯卡使用HBM顯存幾乎是板上釘釘了,而且1024GB/s的帶寬也正好與HBM 2顯存特性相符,但Manuel Ujaldon這篇文章中除了一個列表提到HBM顯存之外,大部分篇幅都是在講HBM對手HMC顯存的,這也是一種3D堆棧內存技術,但HMC 1.0顯存的帶寬與規格跟1024GB/s的帶寬也不符,實在是猜不透這裡面到底是怎麼回事。

  考慮到這篇演講是去年6月份的了,並不是最新資料,所以內容僅供參考,GP100核心的性能基本沒跑了,至於3D顯存到底是HBM還是HMC,筆者還是傾向於HBM 2,畢竟HBM的商業化程度比HMC高多了。

相關焦點

  • NVIDIA發布RTX 3060顯卡:10倍GTX 1060光追性能 12GB顯存超3080
    1月13日的CES展會上,NVIDIA正式發布了RTX 3060顯卡,這是安培遊戲顯卡的第六位成員,10倍於GTX 1060顯卡的光追性能,12GB顯存比RTX 3080的10GB還要多,售價329美元起。
  • nvidia顯卡設置最高性能
    最近有小夥伴向小編問道自己配置英偉達顯卡的電腦玩起遊戲來畫面有些卡頓,應該怎麼才能將英偉達顯卡設置成最高性能?下面小編就來跟大家說一說,英偉達的顯卡如何設置成最高性能。nvidia顯卡設置最高性能1、要想對英偉達顯卡進行設置,首先我們要確定電腦上的顯卡驅動安裝好了。2、確定顯卡的驅動安裝正常。我們直接右鍵桌面的空白處,就可以打開英偉達的控制面板了。3、也可以通過打開「控制面板」→「硬體和聲音」打開。4、打開後在左邊一框的「3D設置」下列,單擊第二項「管理3D設置」。
  • RTX 3080Ti規格遭曝光 單精度浮點高達21T
    前兩天有一張沒有具體型號的顯卡跑分出來了,其成績比RTX 2080Ti還要高30%,不禁令人懷疑,難道它就是RTX 3080Ti?雖然不清楚那張卡是否為RTX 3080Ti,不過疑似RTX 3080Ti的規格曝光了,很給力!
  • 下一代Atom晶片規格曝光 顯卡性能提升三倍以上
    據Intel開發論壇曝光將會在2013年年底2014年年初的時候推出22nm製程的Atom晶片,今天德國的科技論壇3DCenter.org再次曝光了開發代碼為Bay Trail的新平臺晶片,採用三柵極電晶體技術(Tri-gate transistor)打造一個SoC,根據報導這款四核SoC相比較前代Atom提升了50到100%的性能,圖形處理能力是Gen7顯卡晶片的三倍以上。
  • 地球最強單芯卡王 NVIDIA TITAN X首測(全文)_NVIDIA TITAN X_顯卡...
    憑藉超高的基礎頻率和龐大的運算規模,NVIDIA TITAN X擁有11 TFLOPS的超高單精度浮點運算能力,照比GTX TITAN X提升了57%,為目前單精度浮點運算性能最高的單芯顯卡。DX11遊戲性能測試  測試完三款卡的DX12遊戲性能,我們再來看一下它們在DX11遊戲中的表現。需要說明的是,我們之前做的《狙擊精英4》的AN對比評測是在DX12模式下,我們這次選擇在DX11模式下進行測試,最終測試結果如下:
  • NVIDIA RTX 3080首發評測-NVIDIA,顯卡,RTX...
    實測RTX 3080的單精度浮點運算性能是29117GFLOPS,略低於理論值。這是因為320W TDP的限制,RTX 3080在進行GPGPU單精度浮點測試時,GPU核心的滿載頻率只有1672MHz並沒有達到默頻的1710MHz。
  • NVIDIA RTX 3060 Ti首測 甜品卡的性能飛躍_NVIDIA顯卡_遊戲硬體...
    2020年第四季度是顯卡市場最忙碌的時間節點,新顯卡接踵而至,全新的RTX 30系顯卡截至目前已經解禁了RTX 3070/3080/3090三款顯卡,今天要給大家帶來的則是NVIDIA GeForce RTX 3060 Ti的評測
  • NVIDIA CES特別直播:30系筆記本&桌面級RTX 3060登場
    售價999美元起的新一代筆記本電腦有著高達2倍的性能提升,並為輕薄筆記本電腦引入第三代Max-Q技術。全新RTX 30系列筆記本電腦GPU為《賽博朋克 2077》(Cyberpunk 2077)等頂級遊戲帶來令人驚嘆的光線追蹤遊戲體驗,並使內容創作者能使用數百個GPU加速的應用創作令人難以置信的作品。
  • 英偉達(NVDA.US)RTX 30系列顯卡會對PS 5造成衝擊嗎?
    英偉達表示,與上一代顯卡相比,新的安培GeForce RTX顯卡「性能可達兩倍,功耗為1.9倍」,但其價格與上一代相同。智通財經APP認為,這對於備受期待的索尼PlayStation 5遊戲機來說可能是個壞消息,因為與入門級的英偉達顯卡相比,PlayStation 5的性能可能會嚴重不足。
  • RTX 30顯卡為何性能暴增?這要從NVIDIA Ampere架構的變化說起
    從圖中可以看到,相對於第一代RTX顯卡使用的Turing架構來講,NVIDIA Ampere架構中全新設計的SM模塊提供了兩倍的FP32單元,每個時鐘周期可以執行一次128bit FMA浮點運算操作,同時,增加的FP32單元在需要的時候也可以轉為INT32單元,應對程序需求的方式更加靈活,效率也變得更高,這也是NVIDIA Ampere架構比Turing架構更加先進的革命性設計之一
  • NVIDIA 445.75版顯卡驅動發布:DLSS 2.0落地兩款遊戲
    除了正式發布新一代深度學習抗鋸齒技術DLSS 2.0,NVIDIA今晚還發布了GeForce 445.75版顯卡驅動,通過微軟WHQL認證的正式版本,讓玩家第一時間體驗DLSS 2.0遊戲的快感。DLSS 2.0基於NVIDIA RTX顯卡架構的Tensor Cores張量計算核心,是經過改進全新的深度學習神經網絡,能提高幀速率,同時為遊戲生成精美的圖像,最大程度地提高質量設定,提高輸出解析度。
  • PS5的CPU性能為PS4的4倍
    據3DMGame報導,油管頻道RedGamingTech最近製作一組模擬測試中顯示,PS5的AMD Zen 2架構CPU為PS4/PS4 Pro的美洲豹架構CPU4倍。試中把與PS5的AMD Zen 2架構CPU相似的CPU放入了對比(也就是不同頻率的R7 3700X),測試數據圖表顯示,PS4的得分與在PS5中提供的Zen 2內核等效版本進行比較,PS4的CPU性能與次世代主機PS5將使用的CPU性能有很大差異,PS5的CPU性能為PS4的4倍。
  • 微軟公布Xbox Series X詳細參數:浮點性能12TFLOPS
    Game Awards 2019 大會期間,微軟公布了下一代 Xbox 主機的外觀以及名稱,但是僅將其性能描述為「兩倍於 Xbox One X」。就在玩家還在因為微軟此後的行為糾結這款 Xbox 的名字究竟會是什麼的時候,它的詳細性能今天被曝光了出來。
  • 英偉達30移動顯卡性能曝光,3080顯卡性能超過了桌面3070?
    英偉達的30移動顯卡確定一月份發布了,當然這一次顯卡的一些參數是曝光了,這一代的顯卡可能是有提升的一代了!現在曝光的名稱是,英偉達移動顯卡有RTX 3070 Max-P、RTX 3070 Max-Q,基於GA104M打造,顯存是16gb,這是比賽桌面版的顯卡高很多的,3080移動顯卡使用的是GA104 GPU,有6144CUDA核心。
  • Nvidia顯卡再次升級!RTX 3090曝光,將要取代TITAN品牌?
    但是在RTX 3000系列顯卡上Nvidia可能是要做出些改變了,因為RTX 3090顯卡突然被曝光。再者,顯卡的命名也是沒有得到證實的,GPU和內存也是如此。因此lgor列出的這三個系列顯卡也將全都基於PG132板,並將具有不同規格的GA102晶片。以上三款GPU都將配備GDDR6X內存,並將具有300+bit的總線寬度。
  • 模擬測試:PS5的CPU性能為PS4的4倍
    目前,索尼已經公布PS5使用的是AMD Zen 2架構的CPU,但性能如此強大的CPU對開發人員來說有多大的優勢呢?據油管頻道RedGamingTech最近製作一組模擬測試中顯示,PS5的AMD Zen 2架構CPU為PS4/PS4 Pro的美洲豹架構CPU4倍。
  • 如何做到性能翻倍 NVIDIA Ampere架構解析(全文)_影馳 GeForce RTX...
    持續了一個月的「顯卡發布季」已經告一段落,截止目前NVIDIA發布了GeForce RTX 3060 Ti/3070/3080/3090共4個型號的顯卡,相比上一代顯卡,RTX 30系顯卡再次做到了性能翻倍的神話。
  • 本想買2080ti做機器學習,沒想到地震了:RTX3090顯卡發布
    不過大家萬萬沒想到的是發生「地震」了:英偉達正式發布RTX30系列顯卡,而其中的旗艦版配置閃亮登場,讓人驚呼天人(卡)。之前我們一直念念不忘叨咕的2080ti,性能被這次英文大的新品顯卡無情吊打,性價比和優勢能轟然倒塌碎了一地。因為這次發布的是RTX30系列三款,RTX3070,RTX3080和RTX3090顯卡。
  • Intel Xe首款獨立顯卡性能對比:N/A入門卡完虐之
    Intel攜帶著全新的Xe架構,正在重返獨立顯卡市場,而且野心勃勃地要各個行業領域通吃,從最頂級的超級計算機到最入門的輕薄筆記本,無一不想觸及。今年初,Intel宣布首款Xe架構的獨立顯卡代號為DG1,將伴隨11代輕薄本移動平臺Tiger Lake在今年晚些時候登場,並向開發人員提供了DG1 SDV軟體開發套件。
  • 性能級7nm顯卡RadeonRX 5600M性能曝光
    2020年註定是AMD在移動端全面反攻的一年,不僅發布了7nm工藝、Zen2架構的Ryzen4000系列移動處理器,更有同為7nm工藝的RadeonRX 5600M顯卡問世,正如這款顯卡的「性能級」定位一樣,其性能、能效都十分出色