英偉達新顯卡發布的節奏非常快,RTX3080#英偉達RTX30系列顯卡#還沒發布多久,RTX3090就發布了,而RTX3070也將在下月中旬發布。
小熊錯過了RTX3080,這次先寫RTX3090的評測。對比RTX 3080,RTX 3090的流處理器數量、Tensor Core、 ROP單元、顯存帶寬、紋理單元都提升了20%左右,TDP也從RTX 3080的320W進一步提高到了350W。9月24日上市,售價11999元,相比RTX3080的價格也翻了一倍。
▼這次拉來作對比的是RTX2080s,完全同步的對比評測。以前玩過RTX2080Ti,所以也有些數據,但平臺和驅動都不同。最大的遺憾是沒有一手的RTX3080數據,只能參考現在網上的評測數據。
紙上談兵
RTX2080TI的的流處理器(CUDA)數量是4352,RTX2080S是3072,而RTX3080則暴增到了8704個,RTX3090更誇張,是10496個,那麼RTX3090,3080相對RTX2080TI的性能提升不應該是200%以上嗎?但是並沒有!原因就是要從SM單元說起。
顯卡運算處理方式主要有2種,一種是負責浮點型運算,負責比較大小,處理結果,計算最大值最小值的數學運算;另一種是負責整數運算,主要負責內存尋址和獲取資料等工作。但在Turing誕生之前,GPU核心中並沒有單獨的FP32和INT32單元,從Kepler到Maxwell到再到Pascal,無論整數還是浮點都交給相同的核心進行運算,顯卡所以核心在一個周期內只能進行一種運算。
就強度而說浮點運算是高於整數運算的。經過英偉達的分析每100條指令操作中有62條是浮點指令操作,38條是整數指令操作,即浮點(FP32)/整數(INT32)核心的科學比例為62:38(也有說是64:36的)。
Turing設計思路是認為之前的運算效率太低,造成了大量核心的閒置,於是將負責浮點和整數的核心分開,每個SM單元擁有64個FP32核心,64個INT32小核心,但由於這些小核心性能比較弱,所以NVDIA並未把這些核心算作CUDA核心。
新一代Ampere(安培)架構的RTX30系列顯卡則又統一了INT32與FP32單元,原本只能做整數運算的INT32單元現在既能做整數運算,也能做單精度浮點運算,即原來的FP32並沒有動,INT32變成了INT32與FP32的混合核心,並且由小核心變成和FP32一樣的大核心,這樣這些混合核心也被算進了CUDA。所以其實嚴格意義上說Ampere的CUDA數量提升遠沒有官方說的那麼誇張。
再回到到開頭說的,那Ampere不是把Turing的改動又改回去了?正應了那句話,天下大事合久必分,分久必合。當然小熊畢竟是門外漢,也不明白這兩種架構哪個更好,個人也覺得大家就不要在意CUDA數量了,畢竟性能提升才是實實在在的。
測試平臺介紹:
買不起10900k,只能用OC 5GHz的10700k為大家作測試了,還請大家諒解!具體配置如下:
CPU:英特爾(intel) i7 10700k OC 5GHz
主板:華擎(ASRock) Z490 Phantom Gaming-ITX/TB3
內存:影馳(Galaxy)HOF OC Lab 大師 DDR4 4000 8G*2
顯卡:耕升(GAINWARD)RTX 3090炫光
索泰(ZOTAC) RTX2080super玩家力量至尊PGF OC
SSD:威騰電子 (Western Digital)WD_BLACK SN750 1TB
電源:安鈦克(Antec) HCG 1000 Extreme
機箱:安鈦克 (Antec) Striker 鋒芒
▼在RTX3090的24G顯存面前,16G的內存已經抬不起頭了
▼電源採用了額定1000w,保證電力供給充足。
▼由於Striker機箱的特殊結構,使得顯卡被安裝在正面,對顯卡來說是一個基本完全開放的平臺。
▼再次抱歉沒有8K顯示器來測試RTX3090,只能使用PD2700U(27寸,4k解析度)的顯示器!
對比測試
系統:Windows 10 Version 2004 64-bit
驅動: 456.38
理論性能分析
▼這款耕升的RTX3090炫光版基本就是公版的性能參數。
▼在3DMARK firestrike ultra基準跑分項目中,耕升RTX3090炫光的圖形得分為12561、顯卡測試1的幀數為68.25,已經非常流暢了;顯卡測試2幀數為45.53,算是基本流暢。以DX12為基準的time spy extreme的圖形得分為10146、顯卡測試1的幀數為65.19,顯卡測試2幀數為58.91,都很流暢。
▼UNIGINE SUPERPOSITION的8K OPTIMIZED的平均幀數也到達了54.22。
▼數據直接匯總為表格:以RTX3090為100%計,3DMark Fire Strike(DX11)中 ,RTX2080s的性能為~57%;RTX2080TI為~70%;RTX3080為~86%,3DMark Time Spy(DX12)以及SUPERPOSITION測試也基本是這個結果。
RTX3080的數據參考網上評測。另外還要說明的是使用的RTX2080s以及以前的RTX2080TI都是超高公版的頂級顯卡,而耕升RTX3090炫光基本為公版性能,所以如果是公版比公版,RTX3090和這兩款顯卡數據差距會更大。
實際遊戲測試
在實際遊戲測試中,RTX3080都已經可以完美流暢進行4K遊戲了,那麼RTX3080就更不成問題了!遊戲測試截圖如下:
▼
▼
▼
▼
▼在吃雞中,無腦全部超高特效,2k解析度下幀數可以在~200fps以上;4k解析度率下也能在~120以上,即使沒有8K顯示器,也可以讓4k的144Hz顯示狀態拉滿!
不過在測試中也發現了一個問題,就是RTX3090在1080p解析度下表現不佳,很多評測認為是CPU性能不夠。個人倒認為是功耗牆的限制,因為實測在1080p解析度下,顯卡的負載會變的非常低,而頻率則會維持在比較高水平(肯定是沒碰到溫度牆);到了4k解析度,顯卡的負載會基本拉滿,而頻率則會有所降低,所以小熊分析這是功耗牆限制顯卡的性能,因為低解析度下如果性能全開幀數會非常高,將把顯卡的功耗進一步拉高,所以驅動不得不降低負載以便功耗還在限制之內。
RTX3090的流處理器相對於3080多了20%,但是功耗提升只有~10%。所以說如果說320W的TDP不能完全發揮RTX3080的性能,那麼350W的TDP顯然更不能完全發揮RTX 3090的性能。
▼分析數據匯總成表,由於上面說到1080p的問題,所以就沒有統計1080p的數據。可以看到RTX3090在4k解析度下性能優勢遠超過2k解析度的,因為降負載的問題,2k解析度下的小部分遊戲也會出現這個問題,不過出現的頻率小,時間短很,所以最後還是以4k的性能為準。
▼DX12的遊戲中,還是以4k的性能為準,具體數據見下表,基本和DX11的趨勢差不多。
再次強調,使用的RTX2080s以及以前的RTX2080TI都是超高公版的頂級顯卡,而RTX3080的數據來自網上評測,這部分數據只能等到小熊實測過3080才能進一步修正了。
光線追蹤以及DLSS表現
安培構架採用了第二代RT Core使得光追性能得到了翻倍提升,以及第三代Tensor Core(負責DLSS),效率是第二代的4倍,當然由於安培構架將每個SM中的Tensor Core減半,所以實際上它能達到圖靈2倍的效能。
光線追蹤技術,即利用算法來模擬真實世界中的光線的物理特點,能夠做到物理上精確的陰影、反射和折射以及全局光照,在虛擬的遊戲場景下,讓遊戲中的物體更加具有真實感。有種身臨其境的感覺。
▼如《飛向月球》開了光追,才能從玻璃中看到鏡像,另外環境中的陰影表現有更加豐富和真實了。
▼地鐵:離去中選擇最猛的EXTREME預設以及ULTRA的光追特效也可以到達流暢的~60 fps,當然也得開DLSS。
▼德軍總部-新血脈對顯卡的要求比較低,開dlss的4k幀數也可以過百。
DLSS的全稱為Deep Learning Super Sampling,翻譯過來就是深度學習超級採樣。其本質是用更低解析度的圖像來代替部分高解析度的圖像,從而減小運算量提高幀數,不過由於深度學習,即AI的銳化補償技術,代替的非常巧妙,畫面還能保持高解析度下的清晰程度。
▼還是做個表格來統計下吧,佔用資源%就是開啟特效後幀數下降的百分比。現有條件只能和RTX2080s比一下了。可以看到即使RTX3090不開DLSS,幀數下降的比例也要比2080s少很多,而開啟DLSS後的幀數提高幅度也要比2080s高一些。RTX30在光線追蹤以及DLSS表現確實要好於RTX20。
理論計算能力
▼實測RTX3080的單精度浮點運算性能是34587GFLOPS,RTX2080S的單精度浮點運算性能是12126GFLOPS,提升的幅度已經快接近3倍了!
功耗和溫度
▼測試時的環境溫度為~25度。
▼首先使用使用Furmark來對進行烤機測試,參數設定為1920*1080解析度、0AA,發現頻率居然減少到了1125MHz,明顯碰到了功耗牆,可以看到GPU-Z顯示的功耗為350w。0AA下Furmark的幀數會非常高,所以不減低負載,只能減低頻率以便不超越功耗牆。而前面說的1080p遊戲測試則是維持頻率,負載減少。總之都是功耗限制太死的原因。
▼運行10分鐘之後, RTX 3090的溫度穩定在72度附近,小米智能插座顯示的輸入功耗為為~470w。
▼在使用time spy的壓力測試,這個測試幀數肯定高不了,所以可以看到頻率可以維持在1700MHz左右,不過浮動變化還是比較大,GPU-Z檢測到最大頻率到了1995MHz。完成壓力測試後的最高溫度為75度,炫光的散熱系統還是不錯的。此時小米智能插座顯示的輸入功耗為為~485w,比之前的Furmark要高了一點。
超頻?別想了!
▼耕升的GW-SOUL軟體,提供簡單超頻設定功能,RGB燈效控制以及風扇調速等多種功能。使用該軟體的一鍵超頻功能,在GPU-Z上確實能有~50MHz左右的提升,實際測試3DMARK的最高頻率也從1995MHz到了2040MHz,但分數方面卻沒有實際的提升,小熊認為就是功耗的管理機制,這裡就不再複述了。
顯卡以及其它硬體介紹
顯卡
▼耕升GeForceRTX3080炫光的包裝風格科技味十足,並且正面還標註了3年質保+個人送保的服務;附件包括RGB顯卡支架,可安裝在顯卡背面的風扇,和一條顯卡連接主板同步燈效的RGB連接線。
▼耕升RTX3080炫光的三圍尺寸為329*136*63mm,採用了3個90mm風扇,風扇面有圓形和方向的圖案,感覺充滿幾何圖形的元素。
▼中間是圓形的扇框,風扇為十一片扇葉設計,扇葉採用鋒刃設計。
▼兩邊的是稜形導風罩。
▼RTX3080炫光還是雙槽固定,不過厚度達到63mm,基本上到達了三槽厚度。側面有標誌性GEFORCE RTX的LOGO,旁邊還有耕升GAINWARD的標識,並且帶有RGB燈。配備了雙8PIN外接供電,和公版一致。
▼前端可以看到5根6mm鍍鎳熱管,但其實有7根,等會在拆解部分會看到它的全貌。導風罩的前部,附帶了兩個接口,5PIN接口是通過線材連接主板實現RGB同步功能,而4PIN口則是用於連接背板風扇。
▼IO部分,擁有3個DP1.4a規格接口和1個HDMI2.1規格接口,可以支持8K&60Hz的輸出。
▼金屬背板的前部和後部都進行了鏤空處理,尤其是前部,因為這部分並沒有PCB,這樣設計可以更輕鬆吹透鰭片散熱部分。
▼SLI僅限RTX 3090獨享,玩雙卡的成本進一步增大了。
▼附件中的背板風扇,直徑80mm。
▼風扇安裝在背板上,可以增加散熱系統的空氣流動性,更輕鬆的輕鬆吹透鰭片。
▼但安裝風扇也會使得顯卡的厚度增加,一些機箱可能會安裝不了,比如小熊測試用的Striker。
▼小熊是不會放棄拆解卡皇的機會!和RTX3080最大的不同就是PCB背面還有12顆顯存,單顆容量1GB,再加上正面的12顆,正好24顆,24GB。
▼所有散熱器部分貼近電感、顯存晶片、MOS管晶片的地方都配置了導熱墊。
▼除了前端看到的5根貫通的熱管,還有2根在核心區域成U型,從後端穿出,組成了7條6mm鍍鎳熱管+回流焊的散熱系統。
▼顯卡PCB的VRM供電使用獨立加厚散熱板設計,另外也可以看到顯卡的整個PCB長度只有215mm,不過還是採用了12層PCB板,進一步提升顯卡的電氣性能。
▼ GPU核心為NVIDIA的GA102-200 ,8nm工藝製程。;顯存是美光的GDDR6X;供電方案和採用了18相供電:9相NVVDD核心供電,5相MSVDD核心供電,4相顯存供電。Dr mos的具體型號為Alpha & Omega的ALN0 0N18。PWM部分使用了3顆uP9511R,正面有1顆,2顆在PCB背面。
內存
▼為了不給測試平臺拖後腿,選擇了高頻內存:HOF OC Lab 大師 DDR4 4000 8G*2。
▼表面經過特殊塗層處理的純白金屬馬甲,手感非常好。內存使用了三星的B-die晶片和10層的加強型PCB,XMP頻率4000MHz,時序19-25-25-45,電壓1.4V。
▼不過大師系列是無RGB燈效的,當然白色的馬甲,非常容易映射周圍的光效。
電源
High Current Gamer Extreme,簡稱 HCGX,包裝的配色是玫瑰金,該系列通過80 PLUS金牌認證,並提供了10年質保,使用了額定1000w的型號。
▼開盒後可以看到除了說明書之外,在理線方面分別提供扎帶和理線帶。
▼1000w型號的長度為16cm,而850w型號的長度是14cm,對機箱的兼容性會更好些;兩側都為玫瑰金色的金屬板,有品牌 LOGO和型號;在電源輸入口旁邊還有一個按鍵,就是Hybrid模式切換功能的開關,開啟後電源風扇會在低負載時停轉,提供更好的靜音表現。
▼全模組輸出接口,提供了8個12V的CPU/PCle接口,而且並不區分CPU/PCle,可以隨意使用。
▼HCGX電源採用了單路12V設計,單路12V輸出達到了83A,即996W,還是偏向遊戲應用的設計。
顯卡RGB效果
上面通過GW-SOUL軟體可以看到炫光支持支持5種燈光效果,同時還有一鍵切換主板同步模式(需要連線),不過並不支持彩虹跑馬燈的模式。
▼
▼中間的風扇帶燈珠,而兩邊的是風扇框有光。
▼
▼品牌logo燈。
總結
RTX3090可能比RTX3080高~15%,理論上限也只有20%,但價格翻倍了。其實想想之前RTX2080s和2080ti的性能和價格,也就不會太奇怪現在RTX3090的定價,畢竟這種定位的顯卡就不要去討論性價比了。
耕升RTX 3090炫光這款顯卡的顏值和散熱系統還是不錯的,當然現在的問題不是買哪個牌子型號,而是怎麼才能買到!
確實4k解析度下大多數遊戲不會使用超過10GB以上的顯存,所以RTX3090的優勢還是在8K解析度上。但由於沒有設備 ,沒發作8k解析度的測試,由於時間關係也沒有使用DSR來進行模擬測試。其實就像曾經的RTX2080以及RTX2080Ti在4k解析度下表現的還不夠完美一樣,現在的RTX3090在8k解析度上表現也不會非常完善,畢竟還要藉助DLSS,但很多遊戲是不支持的。所以RTX3090適合高玩們的嘗鮮,畢竟8k是屬於未來的!
另一方面24GB顯存也是一些渲染以及視頻創作者的需求。如果說你就是想用RTX3090在4k解析度的顯示器上玩遊戲,那麼它可以提供更好的光追性能,或者跑滿您的高刷新率顯示器。
困惑:為啥英偉達把功耗限制的那麼死,限制了RTX3080和3090的進一步發揮。小熊想到的幾個原因和大家一起分享和探討:
1)CUDA過多,高負載高頻率難以控制,限制功耗牆可以使顯卡更穩定運行,減少返修率。
2)制式升級到了8nm,但功耗還是比上代顯卡高了接近100w,再高了不太好看,會被說成電老虎,不利於宣傳。
3)畢竟競爭對手還沒出牌,而且現在的性能提升對於RTX20已足夠,如果AMD的顯卡性能優秀,可以再進一部分調整驅動釋放性能,或者再推出功耗更高,性能更強的3080s、3090s來反制對手。
RTX30的到來肯定會使電源廠家高興,高功率的電源好賣了!官方推薦RTX3080和3090最好使用額定750w的電源,經小熊實測後,顯卡烤機功率在480w~490w左右,遊戲時測試的功耗在~530w左右(遊戲時CPU的負載會再高一些),當然餘量還是要留好的,顯卡的峰值用電也要考慮到,所以如果是10700k或者10900k最好還是老老實實按官方的750w,甚至850w來選電源;如果是10400,10500以及同級別的AMD CPU,選650w的電源也可以。
另一個高興的可能是分體水冷廠家了,這麼高的功耗不想嘗試一下水冷的效果嗎?小熊這個測試平臺其實很方便連接顯卡水冷,只是現在還沒有冷頭,等以後有機會在測試下RT30在水冷下的表現。