對於電競玩家來說,他們往往對於自己的主機以及所使用的外設都有很高要求,並且每個玩家對於哪些設備最適合自也有不同的見解,例如有的玩家會喜歡輕量化的滑鼠,有的喜歡加配重的。不過有一點是所有電競玩家都一致希望愈高愈好的,那就是遊戲幀數。
那為什麼電競玩家都那麼熱衷於獲得更高的幀數呢?因為更高的幀數可以讓玩家更準確的捕捉對手的動作,從而給出更加精準的對應。要知道電競玩家的反應都很快,可能探一探頭,不到0.2秒的時間就已經看清楚外面是什麼情況並且作出攻擊,留給對面的反應時間其實很少。如果計算機性能只能做到60幀的話,那對手探頭這個動作很可能就會顯得一閃即過,因為兩幀之間相差的時間太長了,看到的只是對方的殘影。
因此,對於電競玩家來說,提升幀數對於他們來說是一個致勝關鍵。那麼要提升幀數有些什麼方法呢?最簡單直接的就是方法就是降低解析度以及畫質了,因為解析度愈低顯卡需要渲染的像素也愈少,壓力也可以減輕不少;而降低畫質也意味著畫面需要渲染的東西少了,顯卡也可以更快的渲染更多幀出來。 不過也不是所有玩家都想犧牲畫面來提升幀數的,這時候升級硬體對他們而言自然就是更加好的選擇。而新推出的RTX 30系顯卡作為近年來NVIDIA最強的一代遊戲顯卡,自然對於電競遊戲來說也是一件神兵利器。
那麼,為什麼RTX 30系顯卡到底有些什麼神奇的地方,可以讓其成為電競利器呢?首先當然就是新的核心了。在新一代的NVIDIA Ampere架構中,遊戲顯卡最強的核心是GA102,即是RTX 3080以及RTX 3090目前所用的核心。它是NVIDIA Ampere遊戲分支架構中規模最大的核心,也是最為完整的Ampere遊戲核心。
以RTX 3080所用的GA102-200核心為例,由於其比起TU102-300多出了12組SM單元,因此它的CUDA核心數量比起上代的遊戲旗艦顯卡RTX 2080Ti足足多了一倍,達到了8704個。可能有人會問了:NVIDIA Ampere遊戲架構是如何做到CUDA核心數翻倍的呢?
這是因為在上代的Turing架構中,INT32以及FP32是交由兩種不同的ALU去計算的,也就是說,在運行以FP32為主的遊戲時,那些運算INT32的ALU是被閒置的。而在RTX 30系顯卡中,除了原本進行FP32運算的ALU外,NVIDIA還在核心內特意引入了一種可以進行FP32或者INT32運算的全新ALU,在遊戲時,所有的ALU都可以同時進行FP32運算,大大提升了計算的效率。
GA100 SM對比GA102 SM
左:GA100 SM;右:GA102 SM
NVIDIA也因此更新了CUDA核心的計數方式,以一個FP32 ALU為一個CUDA核心,所以在NVIDIA Ampere遊戲架構上,每個SM單元擁有的CUDA核心數倍增到了128個,而這也是為什麼RTX 30系的CUDA核心數可以大幅增加的原因。
而除了CUDA核心數有所增加外,RTX 30系顯卡的光追能力也大幅提升了不少。首先是NVIDIA Ampere遊戲架構上用上了第二代的RT Core,與第一代相比主要是增加了對動態模糊的加速運算支持。由於加入了插值算法,所以RTX 30系顯卡可以在保證動態模糊精確性的同時提高實時光線追蹤的效率。
其次就是Tensor Core了。這個專門用於AI運算的單位是RTX系列顯卡可以在開啟實時光追的情況下還可以保持可玩幀數的一大功臣。而在RTX 30系顯卡上,Tensor Core從第二代進化到了第三代,相比之下,第三代Tensor Core可以提供高於第二代4倍的性能。
硬體部分最後的改動就是GDDR6X顯存了。在RTX 3080以及RTX 3090上,NVIDIA都採用了與美光聯合研發的GDDR6X顯存。與之前的GDDR6相比,GDDR6X的信號傳輸機制有著非常大的改變,從以往GDDR顯存只有0和1兩種狀態值的NRZ調製方式變成了使用擁有4種電平值10、11、01及00的PAM4。這也是為什麼GDDR6X顯存的帶寬可以在RTX 3090上實現936GB/s的原因。
而除了本身的性能提升外,隨著RTX 30系顯卡而來的還有其他一些新特性,當中,NVIDIA Reflex這個新東西可以說是對電競玩家最有幫助的。它是由兩部分組成的,一個是硬體部分的Reflex Latency Analyzer,一個是軟體部分的NVIDIA Reflex Low Latency模式。
NVIDIA Reflex Low Latency模式是一個開發者可以選擇在遊戲內植入的功能。玩家在開啟之後,可以同步CPU以及顯卡的處理隊列,從而減少整套平臺的系統延遲。目前《無畏契約》、《堡壘之夜》、《APEX英雄》、《使命召喚:戰區》等遊戲都已經加入了NVIDIA Reflex Low Latency模式,模式選項分別為ON以及ON+Boost,後者是為那些系統瓶頸是在CPU上的玩家準備的,因此如果玩家的CPU不是屬於瓶頸的話,那開啟ON就好了。
至於Reflex Latency Analyzer則是NVIDIA在最新的360Hz顯示器上推出的一個用於測量系列延遲的套件。透過這一套硬體,玩家可以輕易的測量不同遊戲中的系統延遲,從而分析系統不同部分的延遲,例如滑鼠、CPU、顯卡等等,對於玩家優化系統延遲可以起到一個不錯的參考作用。
幀數測試
那麼RTX 30系顯卡,帶來如此強大的性能以及新特性,對於電競玩家來說可以帶來一些什麼遊戲體驗方面的提升呢?筆者這次就分別以技嘉的AORUS RTX 3080 Xtreme、RTX 2080Ti Windforce配合Core i7-10700K來搭建了一套平臺,測試一下這兩款不同時期的遊戲卡皇在幾款熱門的電競遊戲內的幀數表現。而既然是電競遊戲了,那麼相應地也需要一個高刷新率的電競顯示器才行。而我們之前評測過的240Hz刷新率技嘉AORUS FI25F電競顯示器就很符合這次的要求了。
這張RTX 3080 XTREME是一張非常厚實的顯卡。其3槽的厚度配上越肩設計,使得它哪怕是在眾多的3槽RTX 3080中都顯得非常巨大。作為一張非公版PCB設計的顯卡,RTX 3080 XTREME擁有3個8P供電接口,可以為顯卡提供超越公版性能所需的額下動力。另一個特別之處是其擁有2個HDMI 2.1接口及1個HDMI 2.0接口,這也是目前RTX 30系顯卡中很少見的設計,對於那些擁有多個HDMI 2.1顯示設備的玩家來說,這無疑是一個好消息。
這次的測試是會以1080P解析度配合遊戲中的最高畫質來進行,由於幾款遊戲都沒有自帶Benchmark測試,因此成績是摘自實際遊戲比賽的。
可以看到RTX 3080的幀數是要大幅領先於RTX 2080Ti的,在測試的幾款遊戲中都可以有著10%至將近30%的幀數提升。其中,《APEX英雄》的提升是最大的,幀數提升達到了31%,幀數從200出頭去到了274。如果玩家是在使用一個280Hz刷新率的顯示器的話,那麼高出來的幀數就可以充份的餵飽顯示器了。
而《守望先鋒》的提升也很大,在RTX 2080Ti之下只有300幀出頭,而換了RTX 3080之後則是去到了接近遊戲幀數上限的386幀,使得玩家可以在不犧牲畫質的前提下也能夠享受到高幀數。如果是配合新的360Hz顯示器的話相信也可以給到玩家一個如絲般順滑的遊戲體驗。
總結
總的來說,RTX 30系顯卡相對於上一代顯卡在電競遊戲裡的幀數提升還是相當大的,特別是像RTX 3080這樣的次旗艦遊戲顯卡。對於硬核電競玩家而言,這樣的幀數提升是絕對歡迎的,因為更高的幀數意味著可以獲得更加流暢連貫的遊戲體驗。別忘了今年顯示器廠商也推出了高達360Hz刷新率的電競顯示器,RTX 30系顯卡多出來的幀數正正就可以用於填補這額外的刷新率,讓玩家可以更加敏捷的捕捉到對手的一舉一動。