從9月發布至今,NVIDIA安培架構的GeForce RTX 30系列顯卡上市接近3個月時間,但RTX 3080依然一卡難求。雖然使用GA104核心的GeForce RTX 3070顯卡貨源相對充足,唯一不足就是部分高端型號價格直逼RTX 3080,讓消費難以下手。
在GeForce RTX 3070上市一個月後,NVIDIA在12月1日為用戶帶來GA104核心的GeForce RTX 3060 Ti顯卡。新顯卡的GA104-200核心同樣擁有174億電晶體、三星8nm工藝製造;熱設計功耗降低至200W,內建38組SM單元、共4864個CUDA;搭配與RTX 3070相同的256bit位寬、8GB GDDR6顯存。
GA104-200 GPU核心
NVIDIA GeForce RTX 3060 Ti採用與RTX 3070相同的GA104核心,新核心內建6組GPC,每組的TPC數量從6組減少到4組(24組TPC),每組TPC包含2個SM單元,合計48個SM單元,每個SM內置128個CUDA核心、理論最高6144個CUDA;8個32bit位寬的顯存控制器,組成256bit的顯存位寬。
RTX 3060 Ti的GA104-200核心屏蔽10組SMe單元,啟用38組SMe,4864個CUDA,基礎頻率14100MHz、Boost頻率1665MHz;256bit顯存位寬、速率14Gbps的8GB GDDR6顯存,帶寬為448GB/s。與公版不同的是,iGeme GeForce RTX 3060 Ti Advanced OC支持雙BIOS切換功能,其中高頻BIOS最高Boost頻率可達1800MHz。
NVIDIA安培架構簡介
與上一代圖靈架構PGU相比,NVIDIA在安培架構上引入第二代RT Cores以及第三代Tensor Cores,並加入可同時支持INT32或FP32兩種數據類型的新ALU。NVIDIA和微軟合作的RTX IO功能最快在2021年加入支持。
第一代的RT Cores實現了從無到有,第二代光追核心帶來更優秀的性能,在新插值算法支持下,新增的動態模糊的加速運算,可保證動態模糊精確性、同時提高實時光線追蹤效率,擁有最高8倍於上代的性能。第二代RT Cores在基礎的BVH計算上也比第一代快2倍。
負責運行AI計算的硬體單元Tensor Cores也升級到第三代,雖然NVIDIA對遊戲卡的Tensor Cores核心進行精簡,但依然能提供比第二代Tensor Cores高2倍的能效。性能更強的Tensor Cores為GPU帶來更出色的AI運算——DLSS,能夠通過深度學習技術,能將畫面解析度拉伸至8K。
安培架構GPU核心可以同時進行INT32和FP32運算,而非圖靈架構那樣在進行某種運算時,另一種運算無法同時進行,新的ALU大幅提升GPU核心的計算效率,也是安培架構GPU單精度性能暴漲的重要原因。
在安培架構上,NVIDIA提升GPU內部各種單元之間的並行性,讓傳統的INT/FP計算單元、RT Cores和Tensor Cores三大單元同時工作,進一步縮短幀渲染時間,提高GPU的運算性能。
NVIDIA RTX IO功能需要藉助微軟的DirectStorage API,以插件的形式與後者整合實現。這項技術能讓顯卡繞開CPU,直接讀取SSD數據,從而降低CPU的佔用率,而且最終商用還要遊戲開發商做針對性優化。
另外,NVIDIA還為電競玩家和直播用戶帶來NVIDIA Refiex和NVIDIA Broadcast。
NVIDIA Reflex分為硬體和軟體兩部分,硬體部分叫Reflex Latency Analyzer,可視為LDAT的升級版,直接預安裝在顯示器中,通過測量玩家從點擊滑鼠直到畫面出現變化的時間差,得到整套系統的所有延遲。軟體部分則是NVIDIA Reflex SDK,作用是降低以及測量渲染延遲,開發者可直接整合到遊戲內。在開啟其低延遲模式後,可以讓CPU與顯卡同步,大幅度減少渲染序列進而降低渲染延遲。
NVIDIA Broadcast則是為直播主們準備的,利用RTX GPU的AI運算能力替換或消除直播背景、攝像頭重構圖、甚至為麥克風提供智能降噪,減少直播場景的搭建。
iGame GeForce RTX 3060 Ti Advanced OC外觀
外觀方面,iGame GeForce RTX 3060Ti Advanced OC採用家族式的冰海銀鯊散熱器,兩個9cm配合一個8cm捕風手風扇,13翼扇葉能夠將更多的空氣壓入散熱器內,智能啟停技術不僅擁有低噪音的特點、同時還具備更長使用壽命。
合金壓鑄的導流罩大幅提高出風效率,配合4條8mm熱管,能輕鬆慢熱設計功耗為200W的RTX 3060 Ti顯卡。
為了保證顯卡的穩定性,iGame還為RTX 3060 Ti Advanced OC顯卡配備金屬背板。
雖然8pin+PCIe合計可提供225W的供電,但考慮到顯卡的穩定性,iGame還是為顯卡提供雙8pin,讓顯卡能夠全速運行。
作為玩燈好手,iGame為RTX 3060 Ti Advanced OC採用凝聚燈光效果的雙燈環,1600萬色和5種RGB模式。協同燈光閃頻和一定數值的風扇轉速,帶來放佛精緻的視覺效果,全是Advanced以靜制動的壓迫力。
輸出接口方面,iGame GeForce RTX 3060 Ti Advanced OC與提供3個DP 1.4a和1個HDMI 2.1接口,接口均配備金屬屏蔽罩,確保輸出信號乾淨、穩定。雙BIOS切換功能在輸出接口上方,玩家輕鬆快速的切換BIOS。
拆解iGame RTX 3060 Ti Advanced OC可以看到,顯卡採用8+2相供電,其中8為GPU核心供電,剩餘2相為8GB GDDR6顯存供電。
GPU核心為GA104-200-A1,默認頻率1410MHz,BOOST頻率提升至1665MHz;切換至高頻BIOS時的BOOST頻率1800MHz。
顯存使用三星提供的GDDR6顯存,單顆容量1GB、8顆共8GB,14Gbps的速率和256bit位寬,為顯卡提供448GB/s的帶寬。
性能測試
從GPU-Z識別的頻率可以看到,iGame RTX 3060 Ti Advanced OC的BOOST頻率達1665MHz,筆者將BIOS切換至BOOST下對性能進行測試。
測試平臺
CPU:英特爾酷睿i5-10600K
主板:iGame Z490 Vulcan X
內存:七彩虹捍衛者DDR4-3200 8GB*4
顯卡:iGame GeForce RTX 3060 Ti Advanced OC
iGame GeForce RTX 3070 Advanced OC
iGame GeForce RTX 3080 Ultra 10G
NVIDIA RTX 2080 Ti
iGame GeForce RTX 2070 SUPER Advanced OC
電源:鑫谷崑崙KL750W
基準性能測試以3DMark為主,測試DX11、DX12性能,包括Time Spy、Fire Strike、光線追蹤性能,並對比RTX 2070 SUPER、RTX 2080 Ti、RTX 3080以及RTX 3070。
從3DMark中的DX11、DX12測試可以看到,除了1080P的Fire Strick領先約16%、Time幾乎持平之外,RTX 3060 Ti實現對RTX 2070 Super碾壓,2K解析度的Fire Strick Ultra領先12%,其他的領先幅度均在10%左右。在新的RT Core和新的Tensor Core加持下,RTX 3060 Ti的光線追蹤領先RTX 2070 Super約14%。
無光追、DLSS選擇《古墓麗影:暗影》、《刺客信條:奧德賽》、《絕地求生:大逃殺》、《孤島驚魂5》、《GTA5》以及《巫師3》,分別在1080P、2K和4K三種解析度下測試。
在遊戲實測中可以看到,RTX 3060 Ti再1080P下與RTX 2070 Super互有勝負,性能差距不大。2K解析度下除了巫師3幾乎持平外,其他遊戲領先幅度在6%至20%之間。4K解析度下的RTX 3060 Ti全面領先RTX 2070 Super,幀率差距在2%到25%之間。
開啟光線追蹤和DLSS選擇《古墓麗影:暗影》、《控制》、《死亡擱淺》及《我的世界》四款遊戲,同樣細分為1080P、2K和4K三種解析度,直接比較平均幀率。
開啟光線追蹤和DLSS之後,1080P解析度下的RTX 3060 Ti與RTX 2070 Super得到縮小,《古墓麗影:暗影》和《死亡擱淺》的遊戲基本持平,另外兩款遊戲的性能差距在20%左右。2K解析度下的RTX 3060 Ti性能得到一定提升,《死亡擱淺》並未拉開差距,但《古墓麗影:暗影》、《控制》和《我的世界》領先10%至20%。RTX 3060 Ti終於在4K解析度取得全面領先,《死亡擱淺》的差距在10%左右,《控制》的領先幅度多達27%。
溫度噪音測試
在溫度、功耗測試方面,裸平臺測試,保證顯卡風扇不受機箱風道的影響。筆者選擇FurMark軟體對顯卡進行拷機測試,項目包括整卡功耗、噪音和溫度。
噪音方面,得益於冰海銀鯊散熱器2.0和4熱管+3風扇設計,室溫20℃下的室內環境下滿載噪音58.8分貝。顯卡滿載狀況下的噪音並不高。溫度控制方面,得益於iGame的冰海銀鯊散熱器2.0,1665MHz頻率下的RTX 3060 Ti Advanced OC烤機最高72℃,滿載下的溫度在70到72℃之間跳動。功耗方面,RTX 3060 Ti的核心功耗在165W左右,整卡功耗也在210W之內。
評測總結:從價格的定位來看,RTX 3060 Ti將取代RTX 2070 SUPER的位置,成為新一代的「甜品級」顯卡。可媲美RTX 2080 SUPER的遊戲性能,讓顯卡可以輕鬆勝任2K解析度下的3A大作;高刷新率的4K顯示器價格比顯卡還貴,雖然RTX 3060 Ti沒到不能玩的地步,但某些場景下十多幀還是會影響到遊戲體驗。
評測平臺介紹
主要測試平臺處理器採用英特爾6核12線程的i5-10600K,默認頻率4.1GHz,單核睿頻4.8GHz。
主板為iGame Z490 Vulcan X,12+2相的I.P.P至純供電可以為處理器提供穩定供電。
內存七彩虹CVN捍衛者3200MHz系列,擁有5大板卡廠商的ARGB同步認證。
電源是鑫谷崑崙KL750G,額定750W,80plus金牌認證、全模組設計,輕鬆帶動RTX 3060 Ti與i5-10600K平臺。