轉眼2020年已經接近尾聲了,持續了將近一個季度的「顯卡發布季」隨著60型號的發布暫時告一段落,接下來A/N兩家將著重更新移動遊戲卡。整體來看30系顯卡有著非常恐怖的性能飛躍,即使是RTX 3060 Ti這種甜品級顯卡的性能都在RTX 2080 SUPER,也就是上一代的準旗艦之上。今天為大家帶來的是索泰RTX 3060 Ti X-GAMING OC的評測。
索泰RTX 3060 Ti X-GAMING OC採用了NVIDIA Ampere架構,相較於上一代的NVIDIA Turing架構有什麼不同呢?
第一代RTX架構 Turing下的RTX 2060 SUPER
第二代RTX架構 Ampere下的RTX 3060 Ti
相較於初代的Turing RTX架構,NVIDIAAmpere架構在算力上有著成倍的增長,這一點在RTX 3060 Ti中依舊有體現,每個時鐘執行2次著色器運算,而Turing為1次,RTX 3060 Ti的著色器性能達到16.2 TFLOPS單精度性能,而Turing為7.2 TFLOPS。
NVIDIAAmpere架構翻倍了光線與三角形的相交吞吐量,RT Core達到31.6 RTTFLOPS,而Turing為21.7 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是性能提升,還增加了對遊戲中運動模糊部分場景的光線追蹤計算加速。
例如最新發布的《賽博朋克2077》中,當玩家在遊戲中遭遇賽車,追逐,打鬥等激烈運動場景,第二代光追在架構上可以確保顯卡渲染幀率相對更平穩,遊戲體驗上不會有頻繁掉幀帶來的頓挫感。
《賽博朋克2077》
全新的Tensor Core可自動識別並消除不太重要的DNN權重,處理稀疏網絡的速率是Turing的兩倍,算力高達129.6 TensorTFLOPS,而Turing為57.4 TensorTFLOPS。
晶片雖然決定了顯卡的性能和規格,但是顯卡工作的整體穩定性,溫度表現,噪音等級卻更依賴顯卡製造商在PCB布線,電子元器件的適配,散熱系統調校等綜合能力。
在評測開始前,筆者為大家總結一些該顯卡的特點,也方便大家有針對性的閱讀:
粉藍撞色外觀,更加年輕活潑
超強性價比
滿載64℃出色的散熱設計
總的來說,索泰RTX 3060 Ti X-GAMING OC相比公版在散熱方面做了很大改善,在整個RTX 30系顯卡中拷機滿載64℃也是少有的,作為老牌的AIC核心廠商,顯卡素質讓人絕對放心。同時全新的X-GAMING系列撞色設計賦予了顯卡更年輕活潑的感覺。對於大部分玩家來說RTX 3060 Ti完全可以滿足2K流暢的遊戲體驗,高性能低功耗的特點也讓用戶在升級顯卡時不必大動幹戈來更換電源。
01索泰RTX 3060 Ti X-GAMING OC外觀
在RTX 30系顯卡中,索泰的X-GAMING系列外觀全面改版,採用了年輕時尚的撞色設計。兩種顏色的搭配堪稱絕妙,不同色系的撞色搭配,不僅不會有違和感,兩種色彩混合在一起還能給人清新時尚的感覺。
索泰RTX 3060 Ti X-GAMING OC
索泰RTX 3060 Ti X-GAMING OC採用了粉藍撞色設計,整體外觀一改以往的冰冷金屬風格,多了許多活潑元素,同時表面塗裝略帶磨砂質感,所以觸手感覺也比較溫和。
顯卡的整體尺寸為331×118×53mm,相較上一代顯卡沒有明顯增加,最主要的是厚度相較目前的非公版顯卡控制的比較好。正面採用3個11葉盾鱗風扇,搭配智能啟停設計,有效提升散熱氣流的流動效率,同時也更靜音,延長風扇壽命。
索泰RTX 3060 Ti X-GAMING OC供電接口
在顯卡頂部,有傾斜的ZOTAC logo設計,相比以往的燈效來說,呈現的方式也更加活潑年輕化。索泰RTX 3060 Ti X-GAMING OC的供電接口位於logo燈上方,採用單8pin供電,由於這款顯卡的自身功耗較小,實測滿載僅為200W左右,對於想換新顯卡又不想換電源的用戶非常友好,推薦的電源為650W及以上。
索泰RTX 3060 Ti X-GAMING OC背板
索泰RTX 3060 Ti X-GAMING OC的顯卡採用鋁合金背板,增強散熱的同時,保護PCB不會彎折變形。並且同樣採用粉藍撞色設計,尾部印有白色的「X-GAMING」logo字樣,中間鏤空部位方便晶片散熱。
索泰RTX 3060 Ti X-GAMING OC
在顯卡內部散熱方面,採用了3熱管+鏡面拋光工藝接觸傳導,讓散熱模組與GPU之間的貼合更緊密,導熱更高效,散熱更迅速。
索泰RTX 3060 Ti X-GAMING OC視頻輸出接口
視頻輸出接口上,索泰RTX 3060 Ti X-GAMING OC採用DP1.4a*3+HDMI 2.1的4接口設計,另外新的HDMI 2.1接口可支持單線8K的視頻輸出。
索泰RTX 3060 Ti X-GAMING OC
索泰RTX 3060 Ti X-GAMING OC的整體外觀就為大家介紹到這裡,下面我們來看看在新的NVIDIA Ampere架構下的RTX 3060 Ti是什麼樣的。
02NVIDIA Ampere架構下的RTX 3060 Ti
索泰RTX 3060 Ti X-GAMING OC採用了NVIDIA Ampere架構,我們首先來看一下RTX 3060 Ti的提升。
RTX 3060 Ti採用GA104核心擁有174億個電晶體,392平方毫米的面積,基於三星的8nm NVIDIA定製工藝,另外在RTX 3060 Ti中我們都知道仍然採用了GDDR6顯存,不過不同於RTX 3080的Micron,RTX 3060 Ti採用了三星的GDDR6顯存。
我們在發布會中經常聽到性能翻倍的說法,其實是因為本次NVIDIAAmpere的SM在Turing基礎上增加了一倍的FP32運算單元,這就使得每個SM的FP32運算單元數量提高了一倍,同時吞吐量也就變為了一倍。
而通常我們計算顯卡的CUDA數量,並不是把SM中的所有單元加起來計數,而是只統計FP32單元的數量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變為 2:1。
RTX 3060 Ti共有4864個CUDA,其實它有2432個INT32單元,但由於內部的FP32數量翻了一倍,所以最終實現了4864這個驚人的數字。
而這樣粗暴的提升CUDA數量對於遊戲其實有著非常大的幫助,通常在遊戲中浮點運算相比整數計算要常用的多,圖形、算法以及各種計算操作中著色器工作負載通常需要混合使用FP32算數指令,而FP32的加速也有助於光線追蹤降噪著色器。
光追工作原理示意
在此次的NVIDIAAmpere架構中,NVIDIA官方宣布為第二代RT Core,它和第一代有什麼不同呢。首先要知道RT Core的工作原理是,著色器發出光線追蹤的請求,交給RT Core來處理,它將進行兩種測試,分別為邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersectiontesting)。基於BVH算法來判斷,如果是方形,那麼就返回縮小範圍繼續測試,如果是三角形,則反饋結果進行渲染。
而光線追蹤最耗時的正是求交計算,因此,要提升光線追蹤性能,主要是對兩種求交(BVH/三角形求交)進行加速。
RT Core的變化
在Turing的RT Core中,可以每個周期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 裡,NVIDIA增加了一個新的三角形位置插值模塊以及一個的額外的三角形求交模塊,這樣做的目的是為了提升諸如運動模糊特效時候的光線追蹤性能。
運動模糊渲染原理
第二代RT Core可以讓光線追蹤與著色同時進行,進行的光線追蹤越多,加速就越快,它將光線相交的處理性能提升了一倍,在渲染有動態模糊的影像時,按照NVIDIA自己的實測,比Turing快8倍。
稀疏深度學習
Tensor Core可以看作是GeForce RTX GPU上的AI大腦。可加速用於深度神經網絡處理功能的線性代數,這是現代AI的基礎。例如用於AI超解析度的NVIDIA DLSS和用於AI增強的聲畫處理技術NVIDIA Broadcast應用。
在本次的NVIDIA Ampere架構的Tensor Core也得到了極大地加強,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動識別並消除不太重要的DNN(深度神經網絡)權重,同時依然能保持不錯的精度。
首先原始的密集矩陣會經過訓練,刪除掉稀疏矩陣,再經過訓練稀疏矩陣,從而實現稀疏優化,進而提高Tensor Core的性能。
與此次RTX 30系顯卡一同發布的還有一項新技術——RTX IO。目前很多遊戲動輒幾十G甚至百G的安裝空間,對於存儲空間的負擔暫且不提,但存放在硬碟中的數據,如果顯卡想要讀取到,需要先由CPU從硬碟中讀取壓縮過的數據,經過解壓縮再發送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機械硬碟能夠快20倍,但受制於傳統I/O限制,NVMe高達7GB/秒的高速讀寫對於CPU是極大的負擔。
傳統的數據交換
在這個過程中,會佔用多個CPU核心,壓力急劇增大,佔用較多的內存,而此時其實GPU是處於閒置狀態的。RTX IO的作用就是越過CPU解壓再傳輸數據這一步,直接從PCIE總線讀取硬碟上經過壓縮的數據,並且完成無損GPU解壓,降低CPU佔用,變向提升了性能。
RTX IO可以極大解放CPU負擔
當然這項技術作為系統底層的運行方式改變,還需要藉助微軟發布的DirectStorage來實現,對於目前容量的遊戲來說,RTX IO的改善效果有限,但假以時日等遊戲容量上百G成為常態的時候,這項技術將會發揮巨大的功效。
同時搭配新增的HDMI 2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
033DMARK理論性能測試
首先介紹一下測試平臺,為了保證此次評測能夠發揮索泰RTX 3060 Ti X-GAMING OC顯卡的最佳性能,主板和CPU採用了目前桌面旗艦級配置,具體如下。
在測試成績上,基準測試採用3DMARK,遊戲性能測試使用遊戲自帶Benchmark,同時為了減小誤差,每項測試成績均測試3遍取平均值。
GPU-Z參數
首先看一下GPU-Z的參數,RTX 3060 Ti採用GA104核心,三星8nm工藝,晶片面積392平方毫米,擁有4864個CUDA,索泰RTX 3060 Ti X-GAMING OC的Boost頻率為1680MHz,公版為1665MHz,有小幅提升。採用8GB GDDR6顯存,位寬為256bit,顯存帶寬達到了448GB/s,光柵單元和紋理單元為80和152。
下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:
3D MARK FS套裝測試
在針對顯卡DX11性能的3DMARK FS套裝測試中,我們主要對比索泰RTX 3060 Ti X-GAMING OC和RTX 2080 SUPER,整體來看在各項成績中均小幅領先RTX 2080 SUPER;但差距不大。
3D MARK TS套裝測試
而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,索泰RTX 3060 Ti X-GAMING OC領先RTX 2080 SUPER更多,在TSE成績中領先7%。
3D MARK 光追測試
PortRoyal是3DMARK中專門針對光追性能的測試項,索泰RTX 3060 Ti X-GAMING OC的成績相較RTX 2080 SUPER的成績更高一些,但差距不明顯。
在理論測試中,索泰RTX 3060 Ti X-GAMING OC可以說是RTX 2080 SUPER的OC版,不過兩者的價格卻相差不少,RTX 2080 SUPER比RTX 3060 Ti要貴將近2000元左右。
04遊戲性能測試
在遊戲性能測試中,我們選擇了《古墓麗影:暗影》、《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:奧德賽》、國產遊戲《邊境》、《光明記憶:無限》的benchmark跑分軟體。
另外在遊戲測試中,由於顯卡驅動的版本更新和遊戲更新非常影響遊戲幀數,所有benchmark跑分成績均以本次成績為準。
《古墓麗影:暗影》遊戲測試
《古墓麗影:暗影》遊戲測試
由於本次的參測顯卡比較多,而古墓麗影分為標準測試和光追DLSS效果的測試,故分為兩張表格進行對比,共2組6測。第一組為預設最高畫質下,RTX OFF/DLSS OFF;第二組為預設最高畫質下,RTX 超高/DLSS ON。
其中不難看出RTX 3080仍然遙遙領先,索泰RTX 3060 Ti X-GAMING OC也要小幅領先RTX 2080 SUPER的分數,但是差距不大。
《德軍總部新血脈》遊戲測試
《德軍總部新血脈》並且由於自帶兩個benchmark,所以我們的數據取跑分均值。其中索泰RTX 3060 Ti X-GAMING OC比RTX 2080 SUPER在1080P解析度下的分數高5%,2K解析度下高15%;4K解析度下高5%。
《刺客信條:奧德賽》遊戲測試
接下來是《刺客信條:奧德賽》,其中索泰RTX 3060 Ti X-GAMING OC比RTX 2080 SUPER在1080P解析度下分數高2%;2K解析度下高8%;4K解析度下高4%。
《孤島驚魂5》遊戲測試
《孤島驚魂5》同樣算是優化比較到位的3A大作,索泰RTX 3060 Ti X-GAMING OC比RTX 2080在1080P解析度下分數高4%;2K解析度下高12%;4K解析度下高16%。
《光明記憶:無限》遊戲測試
《光明記憶:無限》是由飛燕群島工作室開發的《光明記憶》新系列,目前還沒有遊戲提供試玩,不過benchmark的跑分軟體官方已經提供,玩家可以在steam上自行下載。另外我們在測試的時候由於無法關閉光追選項,故所有測試成績均為「RTX 最高/DLSS 質量」模式下進行。
《邊境》遊戲測試
《邊境》同樣是一款來自柳葉刀工作室的國產3A大作,具體發售日期不明,目前僅提供了benchmark跑分軟體。同樣的目前跑分軟體不支持關閉光追選項,所以在測試時我們選擇「RTX 最高/DLSS 質量」下進行。
05溫度與功耗測試
在溫度功耗測試方面,室溫24℃,我們並沒有採用全封閉式的機箱,而是採用測試平臺的方法,這樣做可以最大限度的保證顯卡除了自身散熱外將風道等外因減小到最低。
功耗測試(點擊查看大圖)
功耗測試中,我們選擇FurMark軟體進行拷機測試,功耗僅計算顯卡自身。作為一款甜品級顯卡索泰RTX 3060 Ti X-GAMING OC的功耗要小得多,在峰值情況下整體平均在200W左右,與公版相同。
溫度測試
溫度方面,本次的索泰RTX 3060 Ti X-GAMING OC經過10分鐘左右的拷機,溫度穩定為64-65℃,相對公版低了9℃左右,雖然X-GAMING的系列定位並不是旗艦,但在散熱方面依然非常到位。
06部分遊戲光追效果展示
上面我們測試了部分遊戲的光追和DLSS性能表現,這些效果具體在遊戲中是什麼表現,下邊筆者選擇了兩款遊戲給大家展示一下。
《堡壘之夜》RTX ON(點擊查看大圖)
《堡壘之夜》RTX OFF(點擊查看大圖)
堡壘之夜的光追效果還是比較明顯的,其中加入了反射、全局照明和路徑追蹤等效果。卡車車身上的反射較為明顯,角色身上的環境光在打開光追後更為寫實,另外仔細看的話遠處建築物的玻璃同樣有光線的反射,整體畫質改善非常明顯。
《魔獸世界9.0》RTX ON(點擊查看大圖)
《魔獸世界9.0》RTX OFF(點擊查看大圖)
第二組對比來自最新的《魔獸世界9.0》,同樣作為一款卡通渲染的網遊來說,魔獸的年代更加久遠,此次加入光追效果在整體視覺上沒有堡壘之夜明顯。不過如遠處的樹木陰影,以及近處石臺下方的陰影都比較明顯。
《控制》RTX ON(點擊查看大圖)
《控制》RTX OFF(點擊查看大圖)
第三組對比為《控制》遊戲,這款遊戲所採用的引擎物理效果非常出色,同時光追開關的對比也是肉眼可見的明顯。包括玻璃上的人物反光,遠處地面的植物反光都比較清晰,同時打開光追後屋頂處的明暗對比也更加明顯。
07軟硬兼施 鑄就Ampere
好的硬體沒有軟體的加持,相當於空有長柄沒有槍頭,想要發揮十成威力則必須軟硬搭配,反之亦然。此次隨著發布會共同推出的還有以下幾項非常值得大家關注。
NVIDIA Reflex
以往我們關注延遲大多從顯示器上了解到幾毫秒極速響應,但那只是作為最終端的顯示輸出效果,你是否想過從系統內部到實際看到的畫面有多大延遲?
NVIDIA Reflex
在20系顯卡中NVIDIA反覆提及的「幀能贏」,在30系顯卡中也做了更進一步的突破,除了NVIDIA將推出自己的電競顯示器NVIDIA 360Hz G-SYNC ESPORTS,還有NVIDIA Reflex技術。
以往如果想測量系統延遲需要高速相機以及定製的LED滑鼠電路。而使用帶有NVIDIA Reflex技術的顯示器將內置精確的延遲分析工具,可在CPU和GPU中優化渲染管道,極大減少延遲時間,將系統延遲整體降低至30ms以下。不過就像圖中所示,為此你需要一個支持反射延遲分析的滑鼠。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且專業的直播軟體,它的強大之處就在於主播不再需要任何的背景布置,只需要一個普通的攝像頭和一張GeForce RTX系列的顯卡即可。
它戳我臉!
這款軟體可以讓你雜亂無章的房間立即變成直播間,其內置了音頻降噪、背景虛化、虛擬背景、頭部追蹤等功能。NVIDIA Broadcast的工作原理是利用AI算法通過DGX超級計算機深度學習而來。
NVENC編碼
同時RTX 30系顯卡擁有目前最好的硬體解碼器,大部分用戶的電腦在直播時打開OBS推流後CPU佔用會直接飆升到50%左右,而基於GPU的NVENC解碼可以極大地減輕CPU負擔。
NVIDIA Studio
對於內容創作者來說,提到軟體可能大部分只會想到內容創作的相關軟體,但NVIDIA專為內容創作者推出的NVIDIA Studio驅動則是承擔著連接創作軟體和顯卡功能的關鍵。
NVIDIA Studio
NVIDIA Studio驅動經過更新與優化,對於最新版本的Adobe系列軟體支持更為穩定,同時附帶更出彩的創作功能。利用NVIDIA CUDA技術,GPU加速特效可實現更快的實時視頻編輯並加速渲染輸出,並讓原本只能進行軟體編碼輸出的視頻輕鬆得到硬體的支持。另外在AI計算方面的優勢,包括自動標記片段、特效追蹤和人臉識別等功能,都有顯著的速度提升。
以GPU渲染為14.98秒 而CPU渲染為11分鐘
當然NVIDIA Studio的加速創作絕不止Adobe一家,DaVinci、Keyshot、Blender、D5等專業軟體中都有非常亮眼的表現。不僅能提供強大且穩定的運行環境,更能以GPU加速,有效提升創作效率。
08悅動隨心 娛見傾心
索泰RTX 3060 Ti X-GAMING OC顯卡在外觀方面充滿了青春活潑元素,更時尚的撞色外觀也更適合搭配側透機箱來展示。
索泰RTX 3060 Ti X-GAMING OC
在性能和售價方面,RTX 3060 Ti的成績超越了上一代準旗艦顯卡RTX 2080 SUPER,但定價卻與RTX 2060相同,可以說即便是本代的甜品卡也擁有不俗的實力。
索泰RTX 3060 Ti X-GAMING OC
雖然價格與20系相同,但全新的NVIDIA Ampere架構採用了第二代RT Core和第三代Tensor Core,在光線追蹤和AI學習方面都有不同程度加強,還擁有更高的能耗比。
另外從遊戲方面來說,這款甜品卡同樣有著非常恐怖的性能,完全可以滿足在2K解析度下的高幀率遊戲體驗,甚至部分遊戲在4K解析度下也可以保障60幀的流暢運行。
琉綺Ruki
七海Nana7mi
除此之外,X-GAMING系列還聯合VirtuaReal,為旗下虛擬主播打造定製版顯卡,將青春氣息體現的淋漓盡致,感興趣的玩家不要錯過。
(7585861)