如果說具體到哪一款顯卡值得等等黨的選購,那大概就是RTX 3060Ti顯卡莫屬了,在性能方面要小幅度領先上一代RTX 2080 SUPER顯卡,但是卻支持眾多的「黑科技軟體應用」,並且在價格上更是讓人大快人心。
今天筆者將給大家帶來一款出自技嘉之手的RTX 3060 Ti GAMING OC PRO 魔鷹,按照慣例,在評測之前,我們先來了解一下這款顯卡的特點。
性能表現出眾,性能略強於RTX 2080 SUPER,並且價格更低,真正的新一代「甜品卡」。
注重散熱細節,正逆轉氣流導向設計。風扇正逆轉設計形成氣流漩渦,能夠快速帶走熱量。實測壓力測試中顯卡在平臺上最高僅為64°且噪音極低,表現出眾。
光線追蹤、DLSS等功能加持,遊戲畫面更加真實暢爽。
技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡採用了NVIDIA Ampere架構,相較於上一代的NVIDIA Turing架構有什麼不同呢?
第一代RTX架構 Turing下的RTX 2060 SUPER
第二代RTX架構 Ampere下的RTX 3060 Ti
相較於初代的Turing RTX架構,NVIDIA Ampere架構在算力上有著成倍的增長,這一點在RTX 3060 Ti中依舊有體現,每個時鐘執行2次著色器運算,而Turing為1次,RTX 3060 Ti的著色器性能達到16.2 TFLOPS單精度性能,而Turing為7.2 TFLOPS。
NVIDIA Ampere架構翻倍了光線與三角形的相交吞吐量,RT Core達到31.6 RT TFLOPS,而Turing為21.7 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是性能提升,還增加了對遊戲中運動模糊部分場景的光線追蹤計算加速。
例如最新發布的《賽博朋克2077》中,當玩家在遊戲中遭遇賽車,追逐,打鬥等激烈運動場景,第二代光追在架構上可以確保顯卡渲染幀率相對更平穩,遊戲體驗上不會有頻繁掉幀帶來的頓挫感。
《賽博朋克2077》
全新的Tensor Core可自動識別並消除不太重要的DNN權重,處理稀疏網絡的速率是Turing的兩倍,算力高達129.6 Tensor TFLOPS,而Turing為57.4 Tensor TFLOPS。
晶片雖然決定了顯卡的性能和規格,但是顯卡工作的整體穩定性,溫度表現,噪音等級卻更依賴顯卡製造商在PCB布線,電子元器件的適配,散熱系統調校等綜合能力。
01 技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡產品概述
技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡整體採用黑色的設計,表面採用磨砂工藝,在提供出色的手感之外還能防止留下指紋痕跡。
在背部,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡的背部設計金屬感十足,具有十分不錯觀賞性。同時,我們能夠看到,散熱鰭片一直延伸到PCB板之外能夠進一步強化散熱效率。
在散熱方面則為是重點,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡採用的是技嘉風之力散熱系統,正面搭載了三個80mm的刀刃式風扇,並採用了特殊的刀刃式設計,透過扇葉的邊緣三角立體造型以及扇葉葉面的導流溝槽,能夠提供更強的進風量。並且還支持正逆轉功能以及風扇智能啟停功能。
正逆轉功能
在內部,搭載了5根高性能覆核導熱管,可以直接與GPU相接觸,最大效率的進行散熱。整套散熱系統搭配起相得益彰,關於溫度方面的測試,將會在下文體現。
在接口方面,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡搭載了2個HDMI 2.1接口,還有2個 DP 1.4a接口。新增的HDMI 2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
在供電方面,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡採用的是單6Pin+單8Pin的設計。同時在顯卡的上方搭載了一個RGB LOGO燈。
關於顯卡的外觀,相信大家已經有所了解,接下來帶大家了解一下NVIDIA Ampere架構。
02 NVIDIA Ampere架構下RTX 3060 Ti
技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡採用了NVIDIA Ampere架構,我們首先來看一下RTX 3060 Ti的提升。
第一代RTX架構 Turing下的RTX 2060 SUPER
第二代RTX架構 Ampere下的RTX 3060 Ti
相較於初代的Turing RTX架構,NVIDIA Ampere架構在算力上有著成倍的增長,這一點在RTX 3060 Ti中依舊有體現,每個時鐘執行2次著色器運算,而Turing為1次,RTX 3060 Ti的著色器性能達到16.2 TFLOPS單精度性能,而Turing為7.2 TFLOPS。
NVIDIA Ampere架構翻倍了光線與三角形的相交吞吐量,RT Core達到31.6 RT TFLOPS,而Turing為21.7 RT TFLOPS。
全新的Tensor Core可自動識別並消除不太重要的DNN權重,處理稀疏網絡的速率是Turing的兩倍,算力高達129.6 Tensor TFLOPS,而Turing為57.4 Tensor TFLOPS。
技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡採用GA104核心擁有174億個電晶體,392平方毫米的面積,基於三星的8nm NVIDIA定製工藝,另外在RTX 3060 Ti中我們都知道仍然採用了GDDR6顯存,不過不同於RTX 3080的Micron,RTX 3060 Ti採用了三星的GDDR6顯存。
我們在發布會中經常聽到性能翻倍的說法,其實是因為本次NVIDIA Ampere的SM在Turing基礎上增加了一倍的FP32運算單元,這就使得每個SM的FP32運算單元數量提高了一倍,同時吞吐量也就變為了一倍。
而通常我們計算顯卡的CUDA數量,並不是把SM中的所有單元加起來計數,而是只統計FP32單元的數量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變為 2:1。
RTX 3060 Ti共有4864個CUDA,其實它有2432個INT32單元,但由於內部的FP32數量翻了一倍,所以最終實現了4864這個驚人的數字。
而這樣粗暴的提升CUDA數量對於遊戲其實有著非常大的幫助,通常在遊戲中浮點運算相比整數計算要常用的多,圖形、算法以及各種計算操作中著色器工作負載通常需要混合使用FP32算數指令,而FP32的加速也有助於光線追蹤降噪著色器。
光追工作原理示意
在此次的NVIDIA Ampere架構中,NVIDIA官方宣布為第二代RT Core,它和第一代有什麼不同呢。首先要知道RT Core的工作原理是,著色器發出光線追蹤的請求,交給RT Core來處理,它將進行兩種測試,分別為邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersection testing)。基於BVH算法來判斷,如果是方形,那麼就返回縮小範圍繼續測試,如果是三角形,則反饋結果進行渲染。
而光線追蹤最耗時的正是求交計算,因此,要提升光線追蹤性能,主要是對兩種求交(BVH/三角形求交)進行加速。
RT Core的變化
在Turing的RT Core中,可以每個周期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 裡,NVIDIA增加了一個新的三角形位置插值模塊以及一個的額外的三角形求交模塊,這樣做的目的是為了提升諸如運動模糊特效時候的光線追蹤性能。
運動模糊渲染原理
第二代RT Core可以讓光線追蹤與著色同時進行,進行的光線追蹤越多,加速就越快,它將光線相交的處理性能提升了一倍,在渲染有動態模糊的影像時,按照NVIDIA自己的實測,比Turing快8倍。
稀疏深度學習
Tensor Core可以看作是GeForce RTX GPU上的AI大腦。可加速用於深度神經網絡處理功能的線性代數,這是現代AI的基礎。例如用於AI超解析度的NVIDIA DLSS和用於AI增強的聲畫處理技術NVIDIA Broadcast應用。
在本次的NVIDIA Ampere架構的Tensor Core也得到了極大地加強,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動識別並消除不太重要的DNN(深度神經網絡)權重,同時依然能保持不錯的精度。
首先原始的密集矩陣會經過訓練,刪除掉稀疏矩陣,再經過訓練稀疏矩陣,從而實現稀疏優化,進而提高Tensor Core的性能。
與此次RTX 30系顯卡一同發布的還有一項新技術——RTX IO。目前很多遊戲動輒幾十G甚至百G的安裝空間,對於存儲空間的負擔暫且不提,但存放在硬碟中的數據,如果顯卡想要讀取到,需要先由CPU從硬碟中讀取壓縮過的數據,經過解壓縮再發送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機械硬碟能夠快20倍,但受制於傳統I/O限制,NVMe高達7GB/秒的高速讀寫對於CPU是極大的負擔。
傳統的數據交換
在這個過程中,會佔用多個CPU核心,壓力急劇增大,佔用較多的內存,而此時其實GPU是處於閒置狀態的。RTX IO的作用就是越過CPU解壓再傳輸數據這一步,直接從PCIE總線讀取硬碟上經過壓縮的數據,並且完成無損GPU解壓,降低CPU佔用,變向提升了性能。
RTX IO可以極大解放CPU負擔
當然這項技術作為系統底層的運行方式改變,還需要藉助微軟發布的DirectStorage來實現,對於目前容量的遊戲來說,RTX IO的改善效果有限,但假以時日等遊戲容量上百G成為常態的時候,這項技術將會發揮巨大的功效。
03 測試平臺簡介
首先介紹一下測試平臺,為了保證此次評測能夠發揮技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡的最佳性能,主板和CPU採用了目前桌面旗艦級配置,具體如下。
配置信息
在測試成績上,基準測試採用3D MARK,遊戲性能測試使用遊戲自帶Benchmark取遊戲平均幀數。
GPU-Z
首先看一下GPU-Z的參數,軟體更新到2.36已經可以正確顯示核心並修復了紋理單元識別錯誤的情況。RTX 3060 Ti採用GA104核心,三星8nm工藝,晶片面積392平方毫米,擁有4864個CUDA,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡的頻率為1410-1770MHz。頻率相較於公版要更高一些,顯卡採用8GB GDDR6顯存,位寬為256bit,顯存帶寬達到了448GB/s,光柵單元和紋理單元為80和152。
04 3D MARK性能測試
理論測試環節我們選擇的是被大家所公認的測試軟體:3DMARK,並使用基於DX11測試1080P解析度下表現的Fire Srike、測試2K解析度Fire Srike Extreme,測試4K解析度下FireStrike Ultra,DX12的測試我們選用2K解析度的Time spy以及4K解析度下的TimeSpy Extreme來進行對比。
3D MARK FS套裝測試
在針對顯卡DX11性能的3DMARK FS套裝測試中,我們主要對比技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡和RTX 2080 SUPER,整體來看各項成績中均小幅領先RTX 2080 SUPER;各項成績差值在1.6-5%之間。
3D MARK TS套裝測試
而在針對DX12環境下的Time Spy和Time Spy Extreme測試中,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡領先RTX 2080 SUPER更多,在TSE成績中領先10.8%。
3D MARK 光追測試
PortRoyal是3DMARK中專門針對光追性能的測試項,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡的測試結果要優於RTX 2080 SUPER,幅度為3.4%左右。
05 遊戲性能測試
在遊戲性能測試中,我們選擇了《古墓麗影:暗影》、《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:奧德賽》、國產遊戲《邊境》、《光明記憶:無限》的benchmark跑分軟體。
《古墓麗影》
《古墓麗影》開光追/DLSS
由於本次的參測顯卡比較多,而古墓麗影分為標準測試和光追DLSS效果的測試,故分為兩張表格進行對比,共2組6測。第一組為預設最高畫質下,RTX OFF/DLSS OFF;第二組為預設最高畫質下,RTX 超高/DLSS ON。
技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡在實際測試中,幀數方面幾乎全面小幅領先RTX 2080 SUPER的分數。
《德軍總部新血脈》遊戲測試
《德軍總部新血脈》由於自帶兩個Benchmark,所以我們的數據取跑分均值。技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡相較RTX 2080 SUPER在1080P解析度下提升5%,2K解析度下提升13%,4K解析度下提升7%。
《孤島驚魂5》遊戲測試
《孤島驚魂5》同樣算是優化比較到位的3A大作,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡比RTX 2080 SUPER在1080P解析度下分數高5%;2K解析度下高14%;4K解析度下高19%。
《邊境測試》
《邊境》同樣是一款來自柳葉刀工作室的國產3A大作,具體發售日期不明,目前僅提供了benchmark跑分軟體。同樣的目前跑分軟體不支持關閉光追選項,所以在測試時我們選擇「RTX 最高/DLSS 性能」下進行。
在測試中,我們可以發現技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡在幀數方面全面領先RTX 2080。
《奧德賽測試》
接下來是《刺客信條:奧德賽》,其中技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡比RTX 2080 SUPER在1080P解析度下分數高3幀;2K解析度下高2幀;4K解析度下高5幀。
《光明記憶:無限》
《光明記憶:無限》是由飛燕群島工作室開發的《光明記憶》新系列,目前還沒有遊戲提供試玩,不過benchmark的跑分軟體官方已經提供,玩家可以在steam上自行下載。另外我們在測試的時候由於無法關閉光追選項,故所有測試成績均為「RTX 最高/DLSS 質量」模式下進行。
這款benchmark跑分軟體在光追效果最高的情況下,運用了多種光線追蹤技術,所以即使強如RTX 3080在4K解析度下也只能跑到35幀。
06 溫度與功耗測試
在溫度功耗測試方面,室溫24℃,我們並沒有採用全封閉式的機箱,而是採用測試平臺的方法,這樣做可以最大限度的保證顯卡除了自身散熱外將風道等外因減小到最低。
功耗測試(點擊查看大圖)
功耗測試中,我們選擇FurMark軟體進行拷機測試,功耗僅計算顯卡自身。作為一款甜品級顯卡技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡的功耗要小得多,在峰值情況下整體平均在228W左右。
溫度測試
溫度方面,本次的技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡溫度相對RTX 3060Ti公版低了9℃,出色的散熱設計在長時間的拷機中,溫度保持在64℃。
07 部分遊戲光追效果展示
上面我們測試了部分遊戲的光追和DLSS性能表現,這些效果具體在遊戲中是什麼表現,下邊筆者選擇了兩款遊戲給大家展示一下。
《堡壘之夜》RTX ON(點擊查看大圖)
《堡壘之夜》RTX OFF(點擊查看大圖)
堡壘之夜的光追效果還是比較明顯的,其中加入了反射、全局照明和路徑追蹤等效果。卡車車身上的反射較為明顯,角色身上的環境光在打開光追後更為寫實,另外仔細看的話遠處建築物的玻璃同樣有光線的反射,整體畫質改善非常明顯。
《魔獸世界9.0》RTX ON(點擊查看大圖)
《魔獸世界9.0》RTX OFF(點擊查看大圖)
第二組對比來自最新的《魔獸世界9.0》,同樣作為一款卡通渲染的網遊來說,魔獸的年代更加久遠,此次加入光追效果在整體視覺上沒有堡壘之夜明顯。不過如遠處的樹木陰影,以及近處石臺下方的陰影都比較明顯。
《控制》RTX ON(點擊查看大圖)
《控制》RTX OFF(點擊查看大圖)
第三組對比為《控制》遊戲,這款遊戲所採用的引擎物理效果非常出色,同時光追開關的對比也是肉眼可見的明顯。包括玻璃上的人物反光,遠處地面的植物反光都比較清晰,同時打開光追後屋頂處的明暗對比也更加明顯。
08 應用延展——直播領域、內容創作
除了光線追蹤的強化,NVIDIA Ampere架構的Tensor Core也得到了極大地加強,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動識別並消除不太重要的DNN(深度神經網絡)權重,同時依然能保持不錯的精度。首先原始的密集矩陣會經過訓練,刪除掉稀疏矩陣,再經過訓練稀疏矩陣,從而實現稀疏優化,進而提高Tensor Core的性能。
這就意味著,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡將在專業領域廣泛應用,例如3D動畫製作渲染、8K視頻剪輯等專業領域,能夠具有更好的表現效果。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且專業的直播軟體,它的強大之處就在於主播不再需要任何的背景布置,只需要一個普通的攝像頭和一張GeForce RTX系列的顯卡即可。
它戳我臉!
這款軟體可以讓你雜亂無章的房間立即變成直播間,其內置了音頻降噪、背景虛化、虛擬背景、頭部追蹤等功能。NVIDIA Broadcast的工作原理是利用AI算法通過DGX超級計算機深度學習而來。
NVENC編碼
同時RTX 30系顯卡擁有目前最好的硬體解碼器,大部分用戶的電腦在直播時打開OBS推流後CPU佔用會直接飆升到50%左右,而基於GPU的NVENC解碼可以極大地減輕CPU負擔。
NVIDIA Studio
對於內容創作者來說,提到軟體可能大部分只會想到內容創作的相關軟體,但NVIDIA專為內容創作者推出的NVIDIA Studio驅動則是承擔著連接創作軟體和顯卡功能的關鍵。
NVIDIA Studio
NVIDIA Studio驅動經過更新與優化,對於最新版本的Adobe系列軟體支持更為穩定,同時附帶更出彩的創作功能。利用NVIDIA CUDA技術,GPU加速特效可實現更快的實時視頻編輯並加速渲染輸出,並讓原本只能進行軟體編碼輸出的視頻輕鬆得到硬體的支持。另外在AI計算方面的優勢,包括自動標記片段、特效追蹤和人臉識別等功能,都有顯著的速度提升。
當然NVIDIA Studio的加速創作絕不止Adobe一家,DaVinci、Keyshot、Blender、D5等專業軟體中都有非常亮眼的表現。不僅能提供強大且穩定的運行環境,更能以GPU加速,有效提升創作效率。
NVIDIA Reflex
以往我們關注延遲大多從顯示器上了解到幾毫秒極速響應,但那只是作為最終端的顯示輸出效果,你是否想過從系統內部到實際看到的畫面有多大延遲?
NVIDIA Reflex
在20系顯卡中NVIDIA反覆提及的「幀能贏」,在30系顯卡中也做了更進一步的突破,除了NVIDIA將推出自己的電競顯示器NVIDIA 360Hz G-SYNC ESPORTS,還有NVIDIA Reflex技術。
以往如果想測量系統延遲需要高速相機以及定製的LED滑鼠電路。而使用帶有NVIDIA Reflex技術的顯示器將內置精確的延遲分析工具,可在CPU和GPU中優化渲染管道,極大減少延遲時間,將系統延遲整體降低至30ms以下。不過就像圖中所示,為此你需要一個支持反射延遲分析的滑鼠。
09 寫在最後
技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡是一款定位於高端的顯卡,在眾多RTX 30系列顯卡當中,具有相當不錯的性價比,用60的價位段買到80S的性能,簡直可以用「加量不加價」來形容。
在性能方面,技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡要比上一代次旗艦RTX 2080 SUPER略強,並且還支持眾多黑科技軟體,能夠勝任多更多領域工作。這還要得益於全新的NVIDIA Ampere架構,以及三星8nm工藝,出廠預設超頻,使得這款顯卡在性能上有了卓越性能的表現。
當然,性能提升作為的代價就是功耗問題,與之相關聯的就是顯卡的散熱,而技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡搭載的超強力散熱系統根本無需散熱問題,能夠將滿載下的顯卡溫度壓到64°,可謂是難得可見。
如果你是一面電競愛好者,那麼這款技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡你不容錯過。
傳送門;https://item.jd.com/10024988594008.html#crumb-wrap
本文屬於原創文章,如若轉載,請註明來源:技嘉RTX 3060 Ti GAMING OC PRO 魔鷹顯卡評測:性能飛躍 溫度更「嘉」http://diy.zol.com.cn/758/7588437.html
http://diy.zol.com.cn/758/7588437.html diy.zol.com.cn true http://diy.zol.com.cn/758/7588437.html report 14144 如果說具體到哪一款顯卡值得等等黨的選購,那大概就是RTX 3060Ti顯卡莫屬了,在性能方面要小幅度領先上一代RTX 2080 SUPER顯卡,但是卻支持眾多的「黑科技軟體應用」,並且在價格上更是讓人大快人心。今天筆者將給大家帶來一款出自技嘉之手的RTX 3060 Ti GAMING OC PRO ...