上個月AMD通過Radeon RX 6800 XT和Radeon RX 6800顯卡的發布重回高端顯卡市場與英偉達角力,許多遊戲玩家都認為英偉達這邊將很快推出新的高端卡型號來回應AMD的較量,當然,英偉達新的高端顯卡型號或許正在籌劃中,不過這並不妨礙他們在發布RTX 3090/3080/3070之後繼續往主流市場布局,推出了GeForce RTX 3060 Ti。
RTX 3060 Ti採用的GA104-200核心
RTX 3060 Ti採用了新的GA104-200核心,它仍然基於GA104核心打造,核心面積392.5mm2,電晶體數量174億,生產工藝依然是三星為NVIDIA定製的8nm工藝。
不過與與RTX 3070採用的GA104-300核心相比,GA104-200整整少了一組GPC。GA104核心的一組GPC包含4個TPC,每個TPC又包含2個SM單元,每個SM單元擁有的CUDA核心是128個。
所以與RTX 3070相比,RTX 3060 Ti少了1024個CUDA核心,其擁有的CUDA核心數量為4864個,相比RTX 3070減少了約17.4%。此外,在頻率方面,RTX 3060 Ti相比RTX 3070也稍有降低,RTX 3060 Ti的基礎頻率為1410MHz,Boost頻率1665MHz。
但是在顯存方面,RTX 3060 Ti與RTX 3070則保持了一致,顯存位寬是完整的256bit,搭配8GB GDDR6顯存,等效數據頻率14Gbps,顯存帶寬一樣是448GB/s。
而由於啟用的SM單元減少,並且頻率降低,RTX 3060 Ti相比RTX 3070的功耗也降低了,RTX 3060 Ti的TGP是200W,RTX 3060 Ti公版顯卡的包裝盒上也將推薦電源的規格降低到600W。
以上是將RTX 3060 Ti與同代更強的RTX 3070對比,而如果將RTX 3060 Ti與上代同樣定位的RTX 2060 SUPER相比較的話,就能看出這一代的60檔次甜點卡進步非常巨大。
首先,這一代的60檔次甜點卡用上了英偉達遊戲卡上第二大的104核心,相當恐怖了,與RTX 2060 SUPER相比,RTX 3060 Ti的核心面積縮小了不少,而電晶體數卻增大了66億個,CUDA核心數量也是從2176暴漲到4864。
Tensor Cores數目有所降低,但是RTX 3060 Ti上的是第三代Tensor Cores,要比RTX 2060 SUPER的第二代Tensor Cores性能強大不少,同樣的RT Cores也進化了,來到了第二代RT Cores,並且數目相比RTX 2060 SUPER上的還增多了,AI性能將迎來大漲。
當然,基於新一代Ampere架構的RTX 3060 Ti顯卡相比RTX 2060 SUPER顯卡還多了這一代安培顯卡的一些通用特性。
NVIDIA Ampere架構簡介
RTX 30系顯卡上的SM單元相比RTX 20系的,最大變化是加倍了針對傳統計算的FP32單元、引入第二代RT Core以及第三代Tensor Core。
大家都知道在Turing架構中,NVIDIA整數型(INT32)和單精度浮點型(FP32)兩種不同的數據類型交給兩種不同的ALU進行計算。不過現代遊戲應用中最為常見的還是FP32,因此為了提高計算效率NVIDIA在NVIDIA Ampere 架構上引入了可同時支持INT32或FP32兩種數據類型的新ALU。也就是說,現在有兩條不同的數據路徑,一條能夠同時處理整數或者單精度浮點,另一條則單純處理處理單精度浮點計算。
負責進行實時光線追蹤運算的專用硬體單元RT Core在NVIDIA Ampere 架構上也更新到了第二代,最主要是增加了動態模糊的加速運算支持。NVIDIA在其中新加入的插值算法可以在保證動態模糊精確性的同時提高了實時光線追蹤效率,官方表示最高可達8倍於上代的速度。另外在基礎的BVH計算上,第二代RT Core也可以比第一代快2倍。
Tensor Core這個負責運行AI計算的硬體單元在NVIDIA Ampere 架構上也升級到了第三代。其實之前發布的A100計算卡上已經用上了新的第三代Tensor Core,它能夠提供比第二代Tensor Core高出4倍的效能,不過遊戲卡上面的Tensor Core進行了一定的精簡,其FP16 FMA計算的吞吐量只有GA100核心中的Tensor Core的一半。
而第三代Tensor Core帶來的更強勁AI運算有些什麼用呢? 答案就是DLSS。隨著RTX 30系顯卡一同發布的,還有DLSS的更新版 - DLSS 8K。顧名思義,DLSS 8K就是通過深度學習技術將畫面解析度拉伸至8K的新版DLSS,具體來說就是把1440P的畫面拉伸至4320P,像素數量跨越了整整9倍。
將不同類型的計算交給不同的單元去處理是從NVIDIA Volta架構就開始採納的一種理念,當時引入的Tensor Core分流了很多AI相關的運算,而在其後引入的RT Core又將實時光線追蹤相關的計算給分流了。但在Turing架構GPU上做不到全部運算都能夠並行執行,到了Ampere架構上,NVIDIA提升了GPU內部各種單元之間的並行性,現在傳統計算單元、RT Core和Tensor Core這三大單元可以同時工作,在原本基礎上繼續縮短幀渲染時間。
再之後就是HDMI 2.1這個備受期待的新輸出埠了。在HDMI 2.1之下,顯卡可以用單線材做到8K60Hz或者4K120Hz的輸出。對於想用大尺寸電視打遊戲的玩家來說是一個不錯的福音。
最後當然就是NVIDIA新推出的RTX IO了。這項技術是NVIDIA藉助微軟此前推出的DirectStorage API來實現的,將會作為插件的形式與後者整合,可以讓顯卡繞開CPU直接讀取SSD數據,從而降低CPU的佔用率。不過由於RTX IO需要依靠Windows的DirectStorage API,並且還需要遊戲開發商做針對性的優化,所以最快我們也要等到明年才能看到這項技術的具體應用。
NVIDIA Reflex
伴隨RTX 30系顯卡一同發布的,有一個對於電競遊戲,或者更仔細地說對於電競選手來說很重要的新東西,那就是NVIDIA Reflex。那麼這個NVIDIA Reflex到底是什麼東西呢?其實它是分為兩部分的,一部分是硬體,一部分是軟體。
硬體部分是一個與我們這次使用的LDAT很相似的東西,叫Reflex Latency Analyzer,它其實可以視作為LDAT的一個進階版本,是直接預安裝在顯示器裡的,可以用來測量玩家從點擊滑鼠直到畫面出現變化之間的時間差,也就是整套系統的所有延遲。
而軟體部分則是NVIDIA Reflex SDK。這個NVIDIA Reflex SDK的作用是降低以及測量渲染延遲的,開發者可以直接整合到遊戲內。而在開啟其低延遲模式後,可以讓CPU與顯卡同步,大幅度減少渲染序列,從而降低渲染延遲。
NVIDIA Broadcast
NVIDIA Broadcast是為直播主們推出的,這用到RTX GPU的AI能力來對直播主的背景消除或替換,還有攝像頭重構圖,甚至幫助麥克風進行背景噪音消除。
在安裝了NVIDIA Broadcast軟體後,它會在攝像頭、耳麥與直播軟體之間建立一個中間者的角色,讓外置設備可以利用到RTX GPU的AI能力來做一些AI增強效果,耳機和麥克風現在支持了降噪功能,AI會分析出哪些是主要音頻,哪些是背景雜音進行降噪,給直播主和觀眾呈現清晰、有用的聲音。
而攝像頭現在有了自動重構圖以及背景處理能力,從攝像頭採集到畫面,可以設置經過Broadcast進行處理,再傳到OBS這些直播軟體中,這可以讓直播主的背景變得更為生動靈活,同時也可以降低直播場景的搭建成本。
RTX 3060 Ti公版顯卡產品介紹
英偉達RTX 3060 Ti公版卡的造型與此前的RTX 3070公版幾乎一模一樣,正面是兩個直徑85mm的風扇,具有待機停轉功能,散熱鰭片是外露的設計,仍然採用了貫穿式的散熱設計,背板尾部是鏤空的,所以尾部的風扇可以直接穿過整塊顯卡,形成的風道也有利於整個機箱的散熱。
上是RTX 3060 Ti,下是RTX 3070
與RTX 3070公版不同的是,RTX 3060 Ti公版的外邊框顏色變成了銀白色,將RTX 3060 Ti公版與RTX 3070公版放一起對比的話,這顏色很容易讓人想起蘋果Mac的深空灰色與銀色款的區別。當然了,還有一個區別肯定是刻在背板的顯卡型號了。
RTX 3060 Ti公版顯卡的厚度是標準的雙槽,長度以及高度分別242mm及99mm,尺寸與RTX 3070公版一樣。並且也是在頂部有個12pin的供電接口,配合上隨包裝附送的8pin轉12pin的供電線,可以與現有的電源兼容。
RTX 3060 Ti公版顯卡的12pin接口那邊有一半是沒接線的,所以它其實是8pin轉6pin,只是為了在物理接口上保證兼容和統一,做成的12pin供電接口設計。視頻輸出接口方面,仍然是3個DP 1.4與一個HDMI 2.1接口的設計,目前所有的30系顯卡都是這樣。
而視頻接口這部分與上一代的RTX 2060 SUPER相比的話,卻可以看到明顯的不同。上一代的RTX 2060 SUPER上面同時具有四種視頻輸出接口,DVI接口是考慮到該型號的目標客戶有一部分還在使用較為老舊的平臺,顯示器可能還是DVI接口的,所以為這一檔顯卡保留了DVI接口,但是到了RTX 3060 Ti上,則去掉了,符合當下的平臺環境,而用於VR的USB-C接口則是在這一代30系顯卡上都被砍掉的,相比來說,HDMI和DP接口還是更主流也更有用些的。
RTX 3060 Ti公版卡拆解
拆解開這張RTX 3060 Ti公版卡,發現其散熱與RTX 3070公版是一樣的,依然有4根8mm直徑的熱管,3根通向顯卡後部,一根則彎曲到顯卡前部,與GPU核心接觸的部分採用的是純銅底座。那麼由於核心相比RTX 3070的運算單元更少,發熱更少,可以預見RTX 3060 Ti公版是要比RTX 3070公版的溫度表現還要好些的。
PCB上,可以看到RTX 3060 Ti使用的是GA104-200核心,周圍依然是8顆三星的GDDR6顯存,型號是K4Z80325BC-HC14,單顆1GB容量,位寬32bit,8顆一共組成8GB的容量、256bit位寬,該顯存數據速率為14Gbps。
供電方面一共是10相供電,其中核心左側的7相和左上方的1相是給核心供電的,而核心右邊的那兩相是給顯存供電的。PWM主控是uP9512R,8相核心供電的MosFET均是來自萬國半導體(Alpha & Omega Semiconductor)的,不過上面只刻了生產批次編號,2相顯存供電的MosFET均是來大中(sinopower)的7342EK-OW21L。
性能測試
考慮到還是有很多玩家用的是英特爾平臺,還不支持PCIE 4.0,並且到了RTX 3060 Ti這種甜點級別來說,我們更考慮實際玩家的處理器情況,最近所以本次測試沒有無腦上最強的CPU,而是選用了Intel Core i7-10700K這款價格和性能都較為適合搭配RTX 3060 Ti顯卡的處理器,主板採用的是華碩ProArt Z490 CREATOR 10G主板,內存用兩根芝奇 皇家戟 DDR4-3600 16GB組成雙通道,其他部分如下,不再贅述。
測試平臺
本次首發評測對比顯卡包括了:RTX 3060 Ti對應等級的上一代N卡RTX 2060 SUPER,還有據消息稱與RTX 3060 Ti性能差不多的RTX 2080 SUPER,以及RTX 3060 Ti同架構的上一級顯卡RTX 3070,對比顯卡也均為英偉達的公版顯卡。
A卡這邊由於其新架構的顯卡目前還只有高端卡,最低的RX 6800也比RTX 3070要性能高上不少,無法與RTX 3060 Ti對位,而如果再拿RX 5700 XT出來對比也沒有意義,畢竟不是同價位也不是同一代的新架構和技術,所以本次對比顯卡就沒有A卡了,希望AMD這邊能儘快推出採用新架構的中端顯卡,好讓玩家看看兩家的角力。
此外,作業系統為最新的20H2版本,系統的電源選項為高性能模式,在BIOS開啟XMP,讓內存運行在3600的頻率,其他方面不做過多改變,均採用默認設置。
基準性能測試
我們以3DMark作為顯卡基準性能測試,測試項目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六個項目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三個項目分別測試的是顯卡在DX11遊戲中的1080p解析度、2K解析度和4K解析度下的性能指數,Time Spy、Time Spy Extreme兩個項目則是顯卡在DX12遊戲中的2K解析度和4K解析度下的性能指數,Port Royal是測試的顯卡實時光線追蹤的性能指數,具體成績見下表,表中所列成績均為3DMark顯卡單項的得分。
通過基準測試可以看到,RTX 3060 Ti相比上一代同樣定位的RTX 2060 SUPER平均強了36%,並且是壓力越大的情況下差距越大,最大差距在模擬4K遊戲環境的Time Spy Extreme項目中達到,RTX 3060 Ti在這裡相比RTX 2060 SUPER強了40%。
RTX 2080 SUPER是上一代圖靈顯卡的次旗艦,以定位來說,RTX 2080 SUPER是相比RTX 3060 Ti定位要至少高兩級的,但是在基準測試中,RTX 3060 Ti卻能剛剛好超過RTX 2080 SUPER一點,再一次實現了新架構跨越兩級的性能提升,最大差距也是在Time Spy Extreme項目中達到,這裡RTX 3060 Ti在這裡相比上一代的次旗艦幾乎高了8%的性能。
而與同一代更高一級的RTX 3070相比的話,RTX 3060 Ti肯定是要弱一些的,但是差距並沒有RTX 3070與RTX 3080那麼大,綜合來看,理論測試下RTX 3060 Ti相比RTX 3070平均弱了14%。
2K解析度遊戲實測
基於RTX 3060 Ti的定位,在單機大作的遊戲實測部分只測試2K解析度,分別設置為傳統光柵化遊戲畫面(即沒有光線追蹤效果)和開啟實時光追遊戲畫面的測試。
傳統光柵化遊戲測試
傳統光柵化遊戲畫面測試這部分均將遊戲畫質設置為預設裡面的最高畫質設置(《地鐵:離去》選擇Ultra畫質),默認不是全屏的手動改為全屏,默認開啟了垂直同步的手動關閉垂直同步,除此之外其他選項均為默認設置,均採用遊戲自帶的Benchmark輸出結果。
我們測的十款遊戲都是關注度較高的遊戲,並且包含了剛發售不久的新一代單機大作比如《刺客信條:英靈殿》、《塵埃5》、《看門狗:軍團》等,從測試來看,RTX 3060 Ti能很好的滿足本世代的遊戲在2K解析度下以最高畫質流暢運行,《刺客信條:英靈殿》達到了62幀,《塵埃5》67.5幀,《看門狗:軍團》也有61幀,可以說是剛剛好達到了3A大作完美的60幀流暢度,不由得再一次感嘆老黃的精湛刀法。
而從性能差距來看,就這十款遊戲的表現來說RTX 3060 Ti平均領先RTX 2060 SUPER高達38%,而領先RTX 2080 SUPER的幅度為1%,弱於RTX 3070的幅度僅為11%。
實時光追遊戲測試
這部分所測幾款遊戲仍然採用預設最高畫質(《地鐵:離去》選擇Ultra畫質),光追效果選項可選的均開為「高」設置,開DLSS的測試中DLSS選項可選的均開為「性能」設置。《光明記憶》和《邊境》均為獨立的Benchmark測試結果。
實時光線追蹤對於顯卡的要求非常高,不過其帶來的精美畫面也是讓人難以忘懷,這種逼真效果必然是接下來遊戲體驗提升的方向,從測試來看,藉助英偉達DLSS技術,RTX 3060 Ti仍然能夠很好的勝任新一代遊戲在開啟高質量的光線追蹤特效下以2K解析度流暢運行,比如《看門狗:軍團》,在測試中達到了68幀,《地鐵:離去》和《古墓麗影:暗影》也分別達到了62.74幀和74幀的流暢度。
而與對比顯卡的比較來看,RTX 3060 Ti相比上一代同樣定位的RTX 2060 SUPER,在實測的遊戲性能方面足足提升了39%,幾乎與理論測試相同,這很罕見。並且RTX 3060 Ti也成功達成了「跨越兩級的性能提升」這樣的成就,穩壓上一代的次旗艦RTX 2080 SUPER一丟丟,遊戲實測大約領先3%。
與RTX 3070的差距相比理論測試也是進一步縮小,實測遊戲性能相比RTX 3070隻是弱了12%。對比RTX 3070與RTX 3060 Ti,前者的指導價大約比後者高出30%,而性能提升15%,可以看出老黃對於每張卡的性能和價格的把握還是很精準的。
溫度測試
我們的顯卡散熱測試均在裸機狀態(如果安裝在機箱內,GPU溫度會高出5℃左右)下進行測試,測試環境溫度約為26℃。待機溫度是開機以後記錄10分鐘,滿載溫度則是完成3DMark Fire Strike壓力測試後記錄下,數據通過GPU-Z的Log to File功能記錄,以下為溫度測試曲線。
溫度方面,RTX 3060 Ti的表現非常的好,不同於上一代的兩張公版顯卡RTX 2060 SUPER和RTX 2080 SUPER,RTX 3060 Ti公版是具有風扇待機停轉功能的,所以RTX 3060 Ti的待機溫度是通過被動散熱達到的,經過10分鐘的待機測試,RTX 3060 Ti公版的最高溫度也僅38攝氏度。而滿載狀態下,RTX 3060 Ti公版的最高溫度也僅僅來到了70攝氏度,相比對比的幾張公版卡都要低,比RTX 3070更是低了5攝氏度,可見RTX 3060 Ti上的GA104-200核心發熱量完全不需要擔心。
功耗測試
通過我們專用的顯卡功耗測試儀器,可以分別精確地測量顯卡PCI-E、外接電源接口瓦特數,顯卡最大功耗在3DMark Fire Strike壓力測試中獲得,待機功耗則是在進入系統後記錄1分鐘取平均值。
待機功耗方面,GeForce RTX 3060 Ti、GeForce RTX 2060 SUPER、GeForce RTX 2080 SUPER、GeForce RTX 3070的待機功耗均值依次為13.4W、13.1W、14.2W、14.9W。
滿載功耗方面,GeForce RTX 3060 Ti、GeForce RTX 2060 SUPER、GeForce RTX 2080 SUPER、GeForce RTX 3070的滿載功耗均值依次為201W、173W、242W、219W。通過前面的測試可以看到RTX 3060 Ti相比RTX 2080 SUPER性能還要強一點,但是功耗卻低了40W之多,足可見這一代安培顯卡的能耗比提升是很明顯的。
超頻性能測試
將功耗上限和溫度上限解鎖到最高之後,經過多番手動超頻嘗試, 這款RTX 3060 Ti公版最終在核心頻率+120MHz,GDDR6顯存數據速率+3Gbps下完成超頻。這個狀態下,這張RTX 3060 Ti公版卡能順利通過3DMark的Fire Strike項目測試並且分數最高, 此時這張RTX 3060 Ti公版卡的Boost頻率為1785MHz,顯存等效頻率為17Gbps。這張RTX 3060 Ti公版卡在超頻狀態下運行3DMark Fire Strike項目的顯卡得分與默頻狀態下顯卡得分的對比如下表所示。
或許是由於核心發熱量低的原因,使得RTX 3060 Ti在高壓下也能經過散熱器即使帶走熱量,讓核心溫度不至於到一個較高的水平,也有可能是公版卡1665MHz的Boost頻率本身比較低,具有較大的超頻空間,結果就是測試下來RTX 3060 Ti的超頻能力顯得非常好,足足提升了12%之多。
總結:性能小勝RTX 2080 SUPER,功耗卻低40W
英偉達的60檔顯卡向來可以說是顯卡市場中的主出貨型號,因為這一檔顯卡一直都是能提供相當不錯的性能而價格又不至於太過昂貴,是大多數遊戲玩家的選擇。而到了安培顯卡這一代,看起來仍然會延續這樣的情況,新的RTX 3060 Ti具有超過上一代的次旗艦RTX 2080 SUPER的性能,功耗低40W,而價格不到3000元,怎麼看都是目前主流預算的裝機平臺中最合適的顯卡選擇。
而與英偉達之前的60檔顯卡來比的話,這是英偉達的60檔顯卡首次用上同一代遊戲卡上第二大的GPU核心,單獨從這一點也可以看出來這一代的RTX 3060 Ti在性能上有多麼強大。
顯卡迷你天梯榜 (完整顯卡天梯榜)
再有一個有趣的點是,雖然RTX 3060 Ti與上一代的RTX 2060 SUPER一樣都是399美元,延續了60檔顯卡的價格水平,但是由於現在人民幣對比美元的匯率不同,這一代的RTX 3060 Ti的國內指導價從RTX 2060 SUPER的3199元人民幣變為2999元人民幣,對於我們來說這也變相的讓這張卡更加香了,不過可惜的是RTX 3060 Ti公版目前也沒有在國內銷售的打算,而非公顯卡從目前顯卡市場整體缺貨的情況來看,應該是會在建議零售價之上銷售的。
不過即使如此,RTX 3060 Ti也是目前主流平臺最合適的顯卡選擇,適合那些搭配有2K顯示器,期望在2K解析度下享受最高遊戲畫質的玩家,同時這張卡的功耗也不高,對電源的要求也相對較低,對於老平臺升級的話,也是很合適的選擇。
在RTX 3060 Ti發布之前,3000多元價位還是RTX 2060 SUPER這種性能的顯卡在售,而現在手持3000多元預算的玩家可以同樣的價格買到多40%的性能,另一方面因為AMD這邊基於RDNA 2架構的新一代顯卡目前還沒有與之對位的新產品,所以RTX 3060 Ti這張能完美勝任2K遊戲環境,功耗僅200W的新顯卡目前就是市場中沒有敵手的存在。