RTX 3060 Ti是今年NVIDIA RTX 30系最後發布的顯卡,熱鬧了一整個季度的RTX 30系顯卡暫時落下帷幕了,而大家期待已久的「幫主」——銘瑄,則作為壓軸出場。雖然姍姍來遲,但成功避開了此前曝出的電容問題,並且能有更充足的時間打磨產品。
在RTX 30系顯卡方面,銘瑄一口氣發布了三個系列的產品,分別是iCraft OC;iCraft GM OC;以及結合二次元形象的iCraft GM OC璦珈限定版。
銘瑄GeForce RTX 3060 Ti iCraft OC採用了NVIDIA Ampere架構,相較於上一代的NVIDIA Turing架構有什麼不同呢?
第一代RTX架構 Turing下的RTX 2060 SUPER
第二代RTX架構 Ampere下的RTX 3060 Ti
相較於初代的Turing RTX架構,NVIDIAAmpere架構在算力上有著成倍的增長,這一點在RTX 3060 Ti中依舊有體現,每個時鐘執行2次著色器運算,而Turing為1次,RTX 3060 Ti的著色器性能達到16.2 TFLOPS單精度性能,而Turing為7.2 TFLOPS。
NVIDIAAmpere架構翻倍了光線與三角形的相交吞吐量,RT Core達到31.6 RTTFLOPS,而Turing為21.7 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是性能提升,還增加了對遊戲中運動模糊部分場景的光線追蹤計算加速。
例如最新發布的《賽博朋克2077》中,當玩家在遊戲中遭遇賽車,追逐,打鬥等激烈運動場景,第二代光追在架構上可以確保顯卡渲染幀率相對更平穩,遊戲體驗上不會有頻繁掉幀帶來的頓挫感。
《賽博朋克2077》
全新的Tensor Core可自動識別並消除不太重要的DNN權重,處理稀疏網絡的速率是Turing的兩倍,算力高達129.6 TensorTFLOPS,而Turing為57.4 TensorTFLOPS。
晶片雖然決定了顯卡的性能和規格,但是顯卡工作的整體穩定性,溫度表現,噪音等級卻更依賴顯卡製造商在PCB布線,電子元器件的適配,散熱系統調校等綜合能力。
我們此次拿到的是GeForce RTX 3060 Ti iCraft OC,作為代表作,iCraft電競之心系列一直被玩家熟知。在評測開始前,筆者為大家總結一些該顯卡的特點,也方便大家有針對性的閱讀:
外觀改版,相較RTX 20系的iCraft更大氣
性能飛躍,作為甜品卡性能略高於RTX 2080 SUPER
高頻低耗,1800MHz相較公版的1670MHz有較大提升
總的來說銘瑄顯卡作為壓軸出場,確實給我們帶來了不少驚喜,首先在外觀方面進行了相當大的改變,鏡面與燈帶的加入,讓全新設計的iCraft系列更顯大氣。並且在散熱效率上有著很大進步。
銘瑄GeForce RTX 3060 Ti iCraft OC
在性能和售價方面,公版的RTX 3060 Ti成績超越了上一代準旗艦顯卡RTX 2080 SUPER,但定價卻與RTX 2060相同,而銘瑄GeForce RTX 3060 Ti iCraft OC的頻率相較公版的1670MHz有較大幅度提升,達到了1800MHz。而這款顯卡目前的售價為3699元,和其他品牌相比,在同規格的情況下,依舊性價比十足。
01銘瑄GeForce RTX 3060 Ti iCraft OC外觀
在RTX 30系顯卡中,銘瑄的iCraft電競之心系列依舊是主力型號,外觀經過大面積改版,正面的導流罩部分相比RTX 20系採用了更多帶有稜角的設計。
銘瑄GeForce RTX 3060 Ti iCraft OC
銘瑄的電競之心系列是玩家最為熟知的,屬於旗艦系列,而在30系顯卡中電競之心也得到了全面的改版。整體給人感覺更大氣了,由於3080散熱規格的增加,顯卡尺寸更大,正面導流罩部分相比20系的過度柔和,RTX 3080 iCraft OC採用了更多帶有稜角的設計,並且導流罩四周採用了鏡面加燈帶的處理方式,三個90mm的大風扇給了顯卡本身足夠的散熱效果。
銘瑄GeForce RTX 3060 Ti iCraft OC 供電接口
在顯卡頂部,iCraft電競之心的logo設計,相比以往的燈效來說,呈現的方式也更加活潑年輕化。銘瑄GeForce RTX 3060 Ti iCraft OC的供電接口位於logo上方,採用8+8pin供電,由於這款顯卡的自身功耗較小,實測滿載僅為220W左右,對於想換新顯卡又不想換電源的用戶非常友好,推薦的電源為650W及以上。
銘瑄GeForce RTX 3060 Ti iCraft OC 背部
顯卡背板部分銘瑄也做了很多升級,首先增加了電競之心的logo燈效,在左側有冰藍色的iCraft logo印刷,並有「SHOW YOUR BRAVE HEART」字樣,翻譯過來為「展示你無畏的心」,另外在核心部位有鏤空設計方便GPU更好的散熱。
銘瑄GeForce RTX 3060 Ti iCraft OC
在顯卡內部散熱方面,採用了6熱管散熱模組,熱管採用回流焊工藝,導熱更高效,散熱更迅速。
銘瑄GeForce RTX 3060 Ti iCraft OC 視頻輸出接口
視頻輸出接口上,銘瑄GeForce RTX 3060 Ti iCraft OC採用DP1.4a*3+HDMI 2.1的4接口設計,另外新的HDMI 2.1接口可支持單線8K的視頻輸出。
銘瑄GeForce RTX 3060 Ti iCraft OC
銘瑄GeForce RTX 3060 Ti iCraft OC的整體外觀就為大家介紹到這裡,下面我們來看看在新的NVIDIA Ampere架構下的RTX 3060 Ti是什麼樣的。
02NVIDIA Ampere架構下的RTX 3060 Ti
銘瑄RTX 3060 Ti iCraft OC採用了NVIDIA Ampere架構,我們首先來看一下RTX 3060 Ti的提升。
RTX 3060 Ti採用GA104核心擁有174億個電晶體,392平方毫米的面積,基於三星的8nm NVIDIA定製工藝,另外在RTX 3060 Ti中我們都知道仍然採用了GDDR6顯存,不過不同於RTX 3080的Micron,RTX 3060 Ti採用了三星的GDDR6顯存。
我們在發布會中經常聽到性能翻倍的說法,其實是因為本次NVIDIAAmpere的SM在Turing基礎上增加了一倍的FP32運算單元,這就使得每個SM的FP32運算單元數量提高了一倍,同時吞吐量也就變為了一倍。
而通常我們計算顯卡的CUDA數量,並不是把SM中的所有單元加起來計數,而是只統計FP32單元的數量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變為 2:1。
RTX 3060 Ti共有4864個CUDA,其實它有2432個INT32單元,但由於內部的FP32數量翻了一倍,所以最終實現了4864這個驚人的數字。
而這樣粗暴的提升CUDA數量對於遊戲其實有著非常大的幫助,通常在遊戲中浮點運算相比整數計算要常用的多,圖形、算法以及各種計算操作中著色器工作負載通常需要混合使用FP32算數指令,而FP32的加速也有助於光線追蹤降噪著色器。
光追工作原理示意
在此次的NVIDIAAmpere架構中,NVIDIA官方宣布為第二代RT Core,它和第一代有什麼不同呢。首先要知道RT Core的工作原理是,著色器發出光線追蹤的請求,交給RT Core來處理,它將進行兩種測試,分別為邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersectiontesting)。基於BVH算法來判斷,如果是方形,那麼就返回縮小範圍繼續測試,如果是三角形,則反饋結果進行渲染。
而光線追蹤最耗時的正是求交計算,因此,要提升光線追蹤性能,主要是對兩種求交(BVH/三角形求交)進行加速。
RT Core的變化
在Turing的RT Core中,可以每個周期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 裡,NVIDIA增加了一個新的三角形位置插值模塊以及一個的額外的三角形求交模塊,這樣做的目的是為了提升諸如運動模糊特效時候的光線追蹤性能。
運動模糊渲染原理
第二代RT Core可以讓光線追蹤與著色同時進行,進行的光線追蹤越多,加速就越快,它將光線相交的處理性能提升了一倍,在渲染有動態模糊的影像時,按照NVIDIA自己的實測,比Turing快8倍。
稀疏深度學習
Tensor Core可以看作是GeForce RTX GPU上的AI大腦。可加速用於深度神經網絡處理功能的線性代數,這是現代AI的基礎。例如用於AI超解析度的NVIDIA DLSS和用於AI增強的聲畫處理技術NVIDIA Broadcast應用。
在本次的NVIDIA Ampere架構的Tensor Core也得到了極大地加強,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動識別並消除不太重要的DNN(深度神經網絡)權重,同時依然能保持不錯的精度。
首先原始的密集矩陣會經過訓練,刪除掉稀疏矩陣,再經過訓練稀疏矩陣,從而實現稀疏優化,進而提高Tensor Core的性能。
與此次RTX 30系顯卡一同發布的還有一項新技術——RTX IO。目前很多遊戲動輒幾十G甚至百G的安裝空間,對於存儲空間的負擔暫且不提,但存放在硬碟中的數據,如果顯卡想要讀取到,需要先由CPU從硬碟中讀取壓縮過的數據,經過解壓縮再發送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機械硬碟能夠快20倍,但受制於傳統I/O限制,NVMe高達7GB/秒的高速讀寫對於CPU是極大的負擔。
傳統的數據交換
在這個過程中,會佔用多個CPU核心,壓力急劇增大,佔用較多的內存,而此時其實GPU是處於閒置狀態的。RTX IO的作用就是越過CPU解壓再傳輸數據這一步,直接從PCIE總線讀取硬碟上經過壓縮的數據,並且完成無損GPU解壓,降低CPU佔用,變向提升了性能。
RTX IO可以極大解放CPU負擔
當然這項技術作為系統底層的運行方式改變,還需要藉助微軟發布的DirectStorage來實現,對於目前容量的遊戲來說,RTX IO的改善效果有限,但假以時日等遊戲容量上百G成為常態的時候,這項技術將會發揮巨大的功效。
同時搭配新增的HDMI 2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
033DMARK 理論性能測試
首先介紹一下測試平臺,為了保證此次評測能夠發揮銘瑄GeForce RTX 3060 Ti iCraft OC顯卡的最佳性能,主板和CPU採用了目前桌面旗艦級配置,具體如下。
在測試成績上,基準測試採用3DMARK,遊戲性能測試使用遊戲自帶Benchmark,同時為了減小誤差,每項測試成績均測試3遍取平均值。
GPU-Z參數
首先看一下GPU-Z的參數,RTX 3060 Ti採用GA104核心,三星8nm工藝,晶片面積392平方毫米,擁有4864個CUDA,銘瑄RTX 3060 Ti iCraft OC的Boost頻率為1800MHz,公版為1665MHz,有較大提升。採用8GB GDDR6顯存,位寬為256bit,顯存帶寬達到了448GB/s,光柵單元和紋理單元為80和152。
下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:
3D MARK FS套裝測試
在針對顯卡DX11性能的3DMARK FS套裝測試中,我們主要對比銘瑄RTX 3060 Ti iCraft OC和RTX 2080 SUPER,整體來看在各項成績中均小幅領先公版RTX 3060 Ti和RTX 2080 SUPER;但差距不大。
3D MARK TS套裝測試
而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,銘瑄RTX 3060 Ti iCraft OC領先RTX 2080 SUPER更多,在TS中領先6%;在TSE成績中領先13%。
3D MARK 光追測試
PortRoyal是3DMARK中專門針對光追性能的測試項,銘瑄RTX 3060 Ti iCraft OC的成績相較RTX 2080 SUPER的成績更高一些,提升約6%。
在理論測試中,公版RTX 3060 Ti可以說是RTX 2080 SUPER的OC版,而銘瑄RTX 3060 Ti iCraft OC在公版成績的基礎上又有一定提升,所以對比RTX 2080 SUPER還是有著相當大的提升。
04遊戲性能測試
在遊戲性能測試中,我們選擇了《古墓麗影:暗影》、《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:奧德賽》、國產遊戲《邊境》、《光明記憶:無限》的benchmark跑分軟體。
另外在遊戲測試中,由於顯卡驅動的版本更新和遊戲更新非常影響遊戲幀數,所有benchmark跑分成績均以本次成績為準。
《古墓麗影:暗影》遊戲測試
《古墓麗影:暗影》遊戲測試
由於本次的參測顯卡比較多,而古墓麗影分為標準測試和光追DLSS效果的測試,故分為兩張表格進行對比,共2組6測。第一組為預設最高畫質下,RTX OFF/DLSS OFF;第二組為預設最高畫質下,RTX 超高/DLSS ON。
其中不難看出RTX 3080仍然遙遙領先,銘瑄RTX 3060 Ti iCraft OC也要小幅領先RTX 2080 SUPER的分數,但是差距不大。
《德軍總部新血脈》遊戲測試
《德軍總部新血脈》並且由於自帶兩個benchmark,所以我們的數據取跑分均值。其中銘瑄RTX 3060 Ti iCraft OC比RTX 2080 SUPER在1080P解析度下的分數高8%,2K解析度下高17%;4K解析度下高6%。
《刺客信條:奧德賽》遊戲測試
接下來是《刺客信條:奧德賽》,其中銘瑄RTX 3060 Ti iCraft OC比RTX 2080 SUPER在1080P解析度下分數高1%;2K解析度下高8%;4K解析度下高9%。
《孤島驚魂5》遊戲測試
《孤島驚魂5》同樣算是優化比較到位的3A大作,銘瑄RTX 3060 Ti iCraft OC比RTX 2080在1080P解析度下分數高6%;2K解析度下高17%;4K解析度下高20%。
《光明記憶:無限》遊戲測試
《光明記憶:無限》是由飛燕群島工作室開發的《光明記憶》新系列,目前還沒有遊戲提供試玩,不過benchmark的跑分軟體官方已經提供,玩家可以在steam上自行下載。另外我們在測試的時候由於無法關閉光追選項,故所有測試成績均為「RTX 最高/DLSS 質量」模式下進行。
《邊境》遊戲測試
《邊境》同樣是一款來自柳葉刀工作室的國產3A大作,具體發售日期不明,目前僅提供了benchmark跑分軟體。同樣的目前跑分軟體不支持關閉光追選項,所以在測試時我們選擇「RTX 最高/DLSS 質量」下進行。
05溫度與功耗測試
在溫度功耗測試方面,室溫24℃,我們並沒有採用全封閉式的機箱,而是採用測試平臺的方法,這樣做可以最大限度的保證顯卡除了自身散熱外將風道等外因減小到最低。
功耗測試(點擊查看大圖)
功耗測試中,我們選擇FurMark軟體進行拷機測試,功耗僅計算顯卡自身。作為一款甜品級顯卡銘瑄RTX 3060 Ti iCraft OC的功耗要小得多,在峰值情況下整體平均在220W左右。
溫度測試
溫度方面,本次的銘瑄RTX 3060 Ti iCraft OC經過10分鐘左右的拷機,溫度穩定為64-65℃,相對公版低了9℃左右,可以看出此次銘瑄在產品方面打磨的足夠到位,作為壓軸出場無論是性能還是散熱設計上相較上一代有著很大提升。
06部分遊戲光追效果展示
上面我們測試了部分遊戲的光追和DLSS性能表現,這些效果具體在遊戲中是什麼表現,下邊筆者選擇了兩款遊戲給大家展示一下。
《堡壘之夜》RTX ON(點擊查看大圖)
《堡壘之夜》RTX OFF(點擊查看大圖)
堡壘之夜的光追效果還是比較明顯的,其中加入了反射、全局照明和路徑追蹤等效果。卡車車身上的反射較為明顯,角色身上的環境光在打開光追後更為寫實,另外仔細看的話遠處建築物的玻璃同樣有光線的反射,整體畫質改善非常明顯。
《魔獸世界9.0》RTX ON(點擊查看大圖)
《魔獸世界9.0》RTX OFF(點擊查看大圖)
第二組對比來自最新的《魔獸世界9.0》,同樣作為一款卡通渲染的網遊來說,魔獸的年代更加久遠,此次加入光追效果在整體視覺上沒有堡壘之夜明顯。不過如遠處的樹木陰影,以及近處石臺下方的陰影都比較明顯。
《控制》RTX ON(點擊查看大圖)
《控制》RTX OFF(點擊查看大圖)
第三組對比為《控制》遊戲,這款遊戲所採用的引擎物理效果非常出色,同時光追開關的對比也是肉眼可見的明顯。包括玻璃上的人物反光,遠處地面的植物反光都比較清晰,同時打開光追後屋頂處的明暗對比也更加明顯。
07軟硬兼施 鑄就Ampere
好的硬體沒有軟體的加持,相當於空有長柄沒有槍頭,想要發揮十成威力則必須軟硬搭配,反之亦然。此次隨著發布會共同推出的還有以下幾項非常值得大家關注。
NVIDIA Reflex
以往我們關注延遲大多從顯示器上了解到幾毫秒極速響應,但那只是作為最終端的顯示輸出效果,你是否想過從系統內部到實際看到的畫面有多大延遲?
NVIDIA Reflex
在20系顯卡中NVIDIA反覆提及的「幀能贏」,在30系顯卡中也做了更進一步的突破,除了NVIDIA將推出自己的電競顯示器NVIDIA 360Hz G-SYNC ESPORTS,還有NVIDIA Reflex技術。
以往如果想測量系統延遲需要高速相機以及定製的LED滑鼠電路。而使用帶有NVIDIA Reflex技術的顯示器將內置精確的延遲分析工具,可在CPU和GPU中優化渲染管道,極大減少延遲時間,將系統延遲整體降低至30ms以下。不過就像圖中所示,為此你需要一個支持反射延遲分析的滑鼠。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且專業的直播軟體,它的強大之處就在於主播不再需要任何的背景布置,只需要一個普通的攝像頭和一張GeForce RTX系列的顯卡即可。
它戳我臉!
這款軟體可以讓你雜亂無章的房間立即變成直播間,其內置了音頻降噪、背景虛化、虛擬背景、頭部追蹤等功能。NVIDIA Broadcast的工作原理是利用AI算法通過DGX超級計算機深度學習而來。
NVENC編碼
同時RTX 30系顯卡擁有目前最好的硬體解碼器,大部分用戶的電腦在直播時打開OBS推流後CPU佔用會直接飆升到50%左右,而基於GPU的NVENC解碼可以極大地減輕CPU負擔。
NVIDIA Studio
對於內容創作者來說,提到軟體可能大部分只會想到內容創作的相關軟體,但NVIDIA專為內容創作者推出的NVIDIA Studio驅動則是承擔著連接創作軟體和顯卡功能的關鍵。
NVIDIA Studio
NVIDIA Studio驅動經過更新與優化,對於最新版本的Adobe系列軟體支持更為穩定,同時附帶更出彩的創作功能。利用NVIDIA CUDA技術,GPU加速特效可實現更快的實時視頻編輯並加速渲染輸出,並讓原本只能進行軟體編碼輸出的視頻輕鬆得到硬體的支持。另外在AI計算方面的優勢,包括自動標記片段、特效追蹤和人臉識別等功能,都有顯著的速度提升。
以GPU渲染為14.98秒 而CPU渲染為11分鐘
當然NVIDIA Studio的加速創作絕不止Adobe一家,DaVinci、Keyshot、Blender、D5等專業軟體中都有非常亮眼的表現。不僅能提供強大且穩定的運行環境,更能以GPU加速,有效提升創作效率。
08心之所向 無畏無雙
銘瑄的電競之心系列是玩家最為熟知的,此次在RTX 30系列中不僅外觀得到了改進,另外在散熱及做工方面都有所加強。
在性能和售價方面,公版的RTX 3060 Ti成績超越了上一代準旗艦顯卡RTX 2080 SUPER,但定價卻與RTX 2060相同,而銘瑄GeForce RTX 3060 Ti iCraft OC的頻率相較公版的1670MHz有較大幅度提升,達到了1800MHz。而這款顯卡目前的售價為3699元,和其他品牌相比,在同規格的情況下,依舊性價比十足。
銘瑄GeForce RTX 3060 Ti iCraft OC
雖然價格與20系相同,但全新的NVIDIA Ampere架構採用了第二代RT Core和第三代Tensor Core,在光線追蹤和AI學習方面都有不同程度加強,還擁有更高的能耗比。
銘瑄GeForce RTX 3060 Ti iCraft OC
另外從遊戲方面來說,這款甜品卡同樣有著非常恐怖的性能,完全可以滿足在2K解析度下的高幀率遊戲體驗,甚至部分遊戲在4K解析度下也可以保障60幀的流暢運行。
另外我們評測的這款iCraft OC為電競之心的基礎版本,後續還會有性能更強勁的GM版本,以及璦珈限定版。
銘瑄GeForce RTX 3060 Ti iCraft OC
顯卡一直以來給人的感覺都是冷冰的硬體,而二次元形象璦珈的融合,讓以藍白色為主調的顯卡更加凸顯活潑可愛的效果。
如果你還在猶豫選擇哪款30系顯卡,那麼作為壓軸出場的銘瑄值得考慮,也讓我們共同期待銘瑄後續推出的幾款產品吧。
(7593530)