NVIDIA用1年左右的時間,初步布局好基於安培(Ampere)架構GPU,桌面端從兼顧遊戲、專業創作的GeForce RTX 3090布局到主流級別的RTX 3060,移動端更是發布GeForce RTX 3050的入門級型號。
按照以往的兩年更新一次架構的節奏來看,「年中小改款」的GeForce顯卡也需要積極推進。
NVIDIA在5月31日帶來兩款Ti系列的新品,分別是將於6月2日解禁上市的GeForce RTX 3080 Ti和6月9日解禁上市的GeForce RTX 3070 Ti。
我們在6月2日首發評測七彩虹的iGame GeForce RTX 3080 Ti Advenced OC,七彩虹送測戰斧GeForce RTX 3070 Ti,下面就一起看看這款顯卡的表現。
NVIDIA安培架構GPU沿用了特定組數的CUDA單元、RT核心、Tensor核心封裝為SM單元,然後將一定組數的SM單元封裝為一個GPC結構,最後將幾組GPC單元和內部緩存等其他硬體組成GPU核心。
安培架構中每組SM單元內建4個Tensor Core核心、128個CUDA核心、一個RT核心。
RTX 3070 Ti核心採用完整版的GA104核心,擁有48組6144個CUDA核心、192個Tensor Core核心和48個RT Core核心。顯卡的顯存容量為8GB,顯存位寬依然是256 Bit,但19Gbps速率的GDDR6x顯存還是為顯卡帶來608GB/s的帶寬。
七彩虹戰斧GeForce RTX 3070 Ti 8G的核心頻率為1580MHz,Boost頻率為1770MHz,分別比RTX 3070高80MHz和40MHz。由於採用GDDR6x顯存,整卡熱設計功耗達到290W,比RTX 3070的220W高出不少。
安培架構解析
與圖靈架構的RTX 20系列相比,採用安培架構的RTX 30系列在SM單元上的最大變化,是將用於傳統計算的FP32單元翻倍,引入第二代RT Core以及第三代Tensor Core。
圖靈架構中整數型(INT32)和單精度浮點型(FP32)兩種不同的數據類型交給兩種不同的ALU進行計算。
考慮到現代遊戲多數以FP32進行運算,所以NVIDIA在安培架構上引入可同時支持INT32或FP32兩種數據類型的新ALU,讓兩條不同數據路徑能夠同時處理整數或者單精度浮點,另一條則單純處理處理單精度浮點計算。
第二代RT Core核心負責進行實時光線追蹤運算,增加動態模糊的加速運算支持。新加入的插值算法保證動態模糊精確性,同時提高實時光線追蹤效率,最高可帶來8倍於上代的計算速度。第二代RT Core的BVH計算也比第一代快2倍。
負責運行AI計算的Tensor Core在安培架構上升級到第三代,能夠提供比第二代Tensor Core高出4倍的效能。
與A100計算卡上的Tensor Core相比,GeForce遊戲卡上的Tensor Core經過一定的精簡,其FP16 FMA計算的吞吐量只有GA100核心中的Tensor Core一半的性能。第三代Tensor Core帶來的DLSS2.1,通過渲染1440P的畫面輸出4320P的8K遊戲畫面。
戰斧GeForce RTX 3070 Ti外觀設計
七彩虹戰斧GeForce RTX 3070 Ti顯卡配備一個HDMI 2.1,可以單線輸出8K/60Hz或4K120Hz。
另外三個接口則是DisplayPort 1.4a。得益於非公版PCB設計,顯卡的供電接口採用全新的12pin設計,能夠為顯卡提供穩定的功率輸出。GPU支持PCIE 4.0接口,能夠大幅減少系統的帶寬瓶頸,Resizable BAR更是進一步提升CPU和GPU之間的數據交換。
七彩虹戰斧GeForce RTX 3070 Ti採用經典的紅黑配色,正面採用類似鑽石的切割設計。三個9cm支持自動啟停功能的風扇,能夠讓顯卡在負載情況下保持安靜、高負載確保散熱能力,帶來更人性化的的使用體驗。
顯卡是七彩虹「COLORFUL」的品牌LOGO,通電後LOGO可實現呼吸閃爍。顯卡採用全金屬背板,不僅提升顯卡的強度,背部的個性化的塗鴉圖案能更好地滿足用戶的個性化選擇。顯卡PCB與背板之間還有導熱貼提升供電部分的散熱性能。
七彩虹戰斧GeForce RTX 3070 Ti顯卡拆解
由於使用公版PCB,所以七彩虹戰斧GeForce RTX 3070 Ti的元器件布局相當緊湊。供電採用NVIDIA新標準的12pin接口,配合內部的9+2相供電設計,讓750W電源就能滿足顯卡正常使用,不僅省去升級高功率電源的需求,同時還能降低機箱內部走線的難度。
七彩虹戰斧GeForce RTX 3070 Ti顯卡使用於公版相同的PCB設計,核心為完整版的GA-104-400-A1,顯存顆粒仍然來自美光,型號D8BWW的GDDR6X顯存單顆容量1GB,位寬32bit,8顆組成8GB、256 Bit位寬。
性能測試
測試平臺
CPU:英特爾Intel Core i7-11700K
主板:七彩虹iGame Z590 Vulcan W
顯卡:七彩虹戰斧GeForce RTX 3070 Ti
iGame RTX 3080 Advanced OC
iGame RTX 3070 Neptune OC
iGame RTX 3080 Ti Advanced OC
內存:七彩虹捍衛者DDR4-3200 8GB*4
硬碟:三星980 Pro 1TB
散熱器:鑫谷冰酷240S一體式水冷
電源 鑫谷崑崙KL-750電源
基準性能測試
顯卡基準性能測試依然採用3DMark,測試項目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六個項目。全部均在2K和4K解析度下進行排分測試,具體的單項得分成績見下表。
從基準性能測試來看,RTX 3070 Ti的性能比RTX 3070有3%左右提升,但明顯落後於RTX 3080。4K解析度下的遊戲模擬Time Spy Extreme的性能更是落後RTX 3080多達30%。
傳統光柵化遊戲測試
傳統光柵化遊戲測試採用《古墓麗影·暗影》、《刺客信條·奧德賽》、《絕地求生》、《賽博朋克2077》、《GTA5》、《巫師3》,測試2K和4K兩種解析度,採用預設中最高畫質設置。
在6款遊戲2K解析度的實測來看,RTX 3070 Ti平均表現就是RTX 3090的97%的性能,平均領先RTX 3080則達到12%,領先上一代的旗艦RTX 2080 Ti達到38%。
在4K解析度下,RTX 3070 Ti小幅領先RTX 3070,《賽博朋克2077》的落後RTX 3080最高達60%,最小的《GTA5》月24%。
實時光追遊戲測試
光追測試《賽博朋克2077》、《古墓麗影·暗影》、《控制》、《死亡擱淺》、《我的世界》五款遊戲,光線追蹤效果均設為「高」,DLSS 2.0均選擇為「性能」模式。
開啟光追後在2K解析度下,RTX 3070 Ti的遊戲性能領先RTX 3070約5%,落後RTX 3080在20%~40%之間。4K解析度的情況與2K大致相同,RTX 3070 Ti與RTX 3080之間的性能差在17%~48%之間。
烤機測試
GPU烤機測試安裝在機箱內,測試環境溫度約為26℃。待機溫度是開機以後記錄10分鐘。烤機軟體為FurMark,通過GPU-Z的Log to File功能記錄溫度、各項功耗、頻率等信息。
由於七彩虹戰斧GeForce RTX 3070 Ti採用6熱管和3個9cm風扇為顯卡提供強大的散熱性能,顯卡在機箱內的待機溫度為56℃,滿載後的最高溫度86℃,大部分時間的溫度穩定在83℃。
官方的TGP整卡功耗為290W,測試中的顯卡功耗始終控制在290W內,其中GPU功耗224W。頻率方面,3Dmark跑分中的最高頻率可加速至1905MHz,烤機的功耗始終控制在1770MHz。
評測總結
從硬體規格來說,GeForce RTX 3070 Ti和RTX 3070之間差別並不大,能夠明顯感受到RTX 3070 Ti將直接取代RTX 3070,硬體限制挖礦性能讓顯卡的市場和價格不再被「礦老闆」左右。
只是從RTX 3080 Ti首發上市的情況來看,新品並不能在短時間內解決顯卡稀缺的問題,雖然Ti系列已經限制了挖礦算力,但依然比上代RTX 20系列好不少,加上專用挖礦的CMP顯卡毫無性價比的狀態,相信「礦老闆們」依然想衝RTX 3080/70 Ti這兩款新顯卡。