在高端顯卡領域蟄伏多年的AMD終於憑藉RX 6800XT顯卡重返高端消費級顯卡市場,從我們的評測結果來看,這款顯卡的確擁有不小的市場競爭力。不過AMD並未止步於此,優化的RDNA 2架構、增強計算規模的NAVI 21核心,以及無限緩存等核心技術的加持,讓AMD有能力衝擊更高的顯卡領域,AMD Radeon RX 6900XT(下文簡稱RX 6900XT)就是他們打開頂級顯卡市場的敲門磚。今晚10點,這款顯卡的評測內容終於解禁,我們也已經完成了這款顯卡的詳細評測工作,下面就請跟隨本文來看看RX 6900XT的性能究竟有多強,它是否能給NVIDIA帶來足夠的壓力。
AMD Radeon RX 6900XT技術解析
在這個信息大爆炸的時代,我們每天都要通過各種途徑接收大量信息,如果你已經記不太清RDNA 2架構、NAVI 21核心或者無限緩存等技術的詳細內容,其實也完全情有可原。因此,我們不妨首先來簡單了解一下RX 6900XT的核心技術,如果你想詳細了解其技術內容,不妨移步《高端顯卡市場爭奪戰打響!AMD Radeon RX 6800 XT & RX 6800顯卡首發評測》一文,這裡有RDNA 2架構的詳細解析內容,應該能夠滿足你的好奇心。
RNDA 2架構:規模更大、性能更強
RNDA 2架構是一個基於RDNA改進、擴張和加入了大量全新功能的架構,它的規模更大、性能更強,同時擁有時下流行的光線追蹤、VRS等高級功能,還提供了對DirectX 12終極版本的全面支持。憑藉RDNA 2,AMD在圖形計算市場上基本能夠和競爭對手站在同一高度,同時也有了能力推出更具有競爭力的產品。根據AMD的描述,RDNA 2是一個面向遊戲設計的架構,它帶來了三個方面的技術優勢,一是更為出色的功率效率和更高的頻率,二是全新設計的無限緩存帶來的GPU技術突破,三是大量高級技術包括硬體光線追蹤技術的支持。不僅如此,AMD還大幅度提升了RDNA 2架構的性能功耗比。根據AMD的數據,在相同的頻率下,RDNA 2消耗的功耗只有RDNA的0.5倍,在相同的功耗下,RDNA 2架構能達到的頻率是RDNA架構的1.3倍。
AMD RDNA 2架構簡圖
需要注意的是,RDNA和RDNA 2的所有產品採用的是臺積電的7nm工藝,雖然在不斷的工藝發展和生產過程中,臺積電會對後期工藝進行優化,但是僅憑優化一般很難達到功耗降低一半、頻率提升30%這樣的效果的,因此RDNA 2擁有現在的優勢主要還是來自於其架構的設計。另外,AMD還特別提到,RDNA 2的高頻率和AMD目前在CPU中的設計經驗的引入相關,AMD宣稱在新的GPU設計和製造過程中使用了大量在CPU設計中曾使用到的技術或者經驗,再加上優化過的微架構,最終實現了本代GPU超過2GHz的運行頻率以及較低的功耗。
RDNA 2的性能功耗比大幅度提升
CU單元:提升能耗比,引入光線追蹤單元
RDNA 2架構的NAVI 21核心(也就是此前網友們盛傳的「Big NAVI」)在宏觀上可以看做NAVI 10核心的擴大版本——後者擁有2個渲染引擎(Shader Enigne),每個渲染引擎包含了10個雙CU單元,所以總計擁有2560個流處理器單元,而NAVI 21核心擁有4個渲染引擎,所以內部計算資源均相對NAVI 10翻倍(例如NAVI 21擁有80個CU單元和5120個流處理單元)。
RDNA的CU單元,AMD在RDNA 2上基本維持了之前的CU結構,但是在電源和功耗方面做出了重大改進。
下面我們繼續深入探究RDNA 2的CU單元的技術亮點。在NAVI 21核心上,AMD保留了之前的雙CU架構,也就是一個雙CU單元包含了兩個CU,每組CU分別可以執行兩個SIMD 32指令,同時對應這種變化,CU單元的分發前端也改成了Wave 32,1個雙CU單元就有兩個Wave 32指令分發單元,在遇到SIMD 64指令的情況下還可以合併為Wave 64進行分發,這一點和之前的NAVI 10完全相同。不過,AMD宣稱在RDNA 2上對CU單元內2個SIMD 32計算負荷平衡方面進行了優化,以提高計算效能,但是AMD沒有給出更多信息。
值得一提的是,雖然在計算端RDNA 2的CU單元在設計上和RDNA基本相同,但是AMD還是為RDNA 2架構的CU單元加入了大量電源管理方面的內容,以儘可能提升GPU的性能功耗比。AMD宣稱其加入了更多細粒度的門控時鐘設計,能夠更加精確的控制CU單元的電壓和頻率。並且AMD還重新設計了CU的數據路徑(配合無限緩存),以減少在數據傳輸存取過程中所消耗的能量。另外,AMD在RDNA 2架構上正式支持了硬體光線追蹤加速,並且為每個CU單元配備了1個光線追蹤單元RA(Ray Accelerator),後文將對這項技術進行深入解析。
AMD在RDNA 2架構上正式支持了硬體光線追蹤加速,所以RX 6900XT顯卡同樣可以運行「光追遊戲」。
緩存體系:帶來三大優勢
除了基本計算架構外,RDNA 2在緩存體系上相比RDNA做出了重大改進。基於RDNA架構的GPU其緩存體系包含了4個級別,分別是L0、L1和L2,以及顯存控制器單元,而RDNA 2的緩存體系添加了額外的層級。如今,RDNA 2擁有L0、L1、L2和無限緩存(Infinity Cache)、顯存控制單元5個層級。其中無限緩存是全新加入的大容量緩存,其容量高達128MB,根據AMD的架構圖來看,無限緩存被分為4個區塊,每個區塊為32MB,這個數量和4個渲染引擎、4個顯存控制器是相互對應的。在緩存連接方面,AMD使用運行在1.94GHz的、16x64Bit(1024Bit/時鐘周期)的Infinity Fabric總線連接緩存和RDNA 2的引擎,AMD宣稱這個總線的帶寬的峰值是256bit GDDR6顯存的4倍。
RDNA架構的緩存體系,由L0、L1和L2,以及顯存控制器單元組成。
RDNA 2架構的緩存體系的最大變化是加入了無限緩存
那麼AMD使用如此巨量緩存的收益是什麼呢?性能功耗比方面,高速緩存往往會大幅度降低VRAM讀取的頻次,畢竟大量的數據能夠存放在本地緩存中,這裡也涉及到數據命中率的概念,因此可以有效地提高GPU整體的能效比。此外,較大的緩存的另外一個好處是允許廠商使用較小的DRAM晶片或者較少的內存控制器模塊來配置一個相對較小的存儲系統。比如AMD在NAVI 21上就配備了256bit的GDDR6顯存系統,而不是像GTX 3090那樣使用384bit的顯存系統那樣。
相比之下,256bit的顯存系統在電晶體佔用和能耗上要明顯小於384bit的系統——AMD給出的數據顯示,具有無限緩存的256bit顯存系統相比傳統的384bit顯存系統,在能夠提供2.17倍於後者峰值帶寬的情況下,僅消耗後者90%的功耗,有著驚人的效果。
性能方面,AMD宣稱無限緩存的能夠改善GPU在每個時鐘周期內完成的實際工作量或性能,這裡AMD所指的應該是提高GPU的數據命中率,而不是像傳統GPU那樣等待數據從VRAM中取出,這和前文在性能功耗比方面的描述是一致的,而AMD數據顯示無限緩存帶來了34%的延遲降低。另外,AMD還宣稱在光線追蹤計算中,BVH相關的遍歷數據會存放在無限緩存中,這也是AMD設計的硬體光線追蹤加速的重要組成部分。
無限緩存帶來的三大優勢
光線追蹤上線:支持DirectX 12 Ultimate
在RDNA 2上,AMD宣布帶來了硬體光線追蹤、2級VRS可變速率陰影、Mesh渲染(Mesh Shaders)以及採樣器反饋(Sample Feedback)四大DirectX 12高級功能。其中最受關注的是光線追蹤,VRS和Mesh渲染帶來了性能上的提升,但是對最終用戶來說可能沒那麼有吸引力。採樣器反饋則能夠是的開發人員更好的了解正在使用的紋理和以及相關元素塊,這樣能夠更好的管理顯存的使用和需要預加載的數據等。
RDNA 2架構提供了對微軟DirectX 12 Ultimate版本的支持
正如前文所說,RDNA 2架構的每個CU單元配備了1個光線追蹤單元,從而在硬體層面支持光線追蹤技術。AMD的資料顯示,RA單元的光線追蹤交叉性能是傳統軟體執行的10倍,更具體的數據顯示RDNA 2架構的GPU在微軟DXR SDK的Procedural Geometry的測試中帶來了471fps的成績,在軟體模擬下只有34fps,所以性能達到了軟體的13.8倍。另外,RDNA 2目前還可以支持DirecStorage API,這項功能之前在NVIDIA的RTX 30系列GPU上也出現過,其主要用途是使用GPU直接解壓縮遊戲數據,從而繞開了效率較低的CPU,帶來了更好的使用體驗和更少的等待時間,對遊戲玩家來說是非常友好的。
三大特色功能
除了架構、緩存等硬體方面的增強和優化之外,AMD還在這一代顯卡上推出了三大特色功能。首先則是Rage Mode,簡單可以理解為「自動超頻」或者「狂暴模式」,這個功能目前僅支持Radeon RX 6900XT和Radeon RX 6800XT兩款產品。在這個模式下,驅動和配套軟體會尋找GPU是否還有性能提升的空間,並通過不斷的提升GPU頻率來獲得更高的性能。
AMD加入了新的Rage Mode技術,可以實現顯卡自動超頻。
Smart Access Memory(顯存智取技術)是RDNA 2架構的另一大亮點,根據AMD目前的資料,在啟用了這個功能後,CPU端(銳龍5000系列)可以直接通過PCIe 4.0總線訪問GPU的全部本地顯存,所以CPU就可以直接調用GPU的數據而不需要等待GPU轉發。
根據AMD的描述,這項功能在不同的4K遊戲中可以帶來大約5%~11%的性能提升,平均帶來了6%的性能提升。這項功能可以在BIOS中開啟並自動運作,不需要用戶操作。在AMD的數據對比中,通過Rage Mode和Smart Access Memory的聯合應用,能夠為顯卡帶來少則4%,最多則13%的性能提升,尤其是AMD的數據顯示,在啟用了這兩個功能後,Radeon RX 6900XT能略微勝出NVIDIA的RTX 3090。
Smart Access Memory技術能給RX 6900XT帶來非常可觀的性能提升
在RDNA 2的發布會上,AMD展示了FidelityFX中的一個新功能,那就是超級解析度(Super Resolution)。超級解析度可以通過AMD的GPU將較低解析度的原始圖像進行插值、銳化或者引入AI技術等,升格為較高解析度的圖像。和這個功能比較類似的就是NVIDIA的DLSS技術。具體來說,超級解析度能夠在性能和圖形畫質之間提供一個平衡,尤其是在支持光線追蹤、高解析度的遊戲運行時,超解析度技術能夠帶來更高的幀數和近似全尺寸解析度的畫質,大幅度提高遊戲的可玩性。
目前FidelityFX超級解析度功能還沒有上線,因此RX 6000系列用戶短期內還無法使用這個技術。但是一旦這個技術開發完成,AMD就會將其像其他所有的FidelityFX內技術一樣,在GPUOpen平臺上開源發布,並且AMD還明確指出超級解析度技術是跨平臺的,其實現難度較DLSS更低,並且更容易訪問和控制,也更容易在更多遊戲中實現。
超級解析度技術能夠提升遊戲畫面的解析度
更大計算規模
RX 6900XT同樣搭載RDNA 2架構的NAVI 21核心,但在計算規模上明顯增強。例如RX 6900XT的電晶體數量達到268億個,而RX 6800XT的電晶體數量則為230億個。更為重要的是RX 6900XT的CU單元比RX 6800XT多8個,所以前者的光線追蹤計算單元也多8個,同時流處理器數量多512個。而在GPU頻率、顯存類型和容量、顯存帶寬和TDP這幾個方面,RX 6900XT和RX 6800XT則基本保持一致。因此,從規格參數來看,RX 6900XT的紙面性能應該要比RX 6800XT稍強一些,但具體強多少呢,相信測試成績能告訴我們答案。
RX 6900XT規格亮點一覽
AMD Radeon RX 6900XT鑑賞及性能測試
RX 6900XT採用了和RX 6800XT相同的外觀設計,其整體造型比較硬派,而且黑色、銀色和紅色的色彩搭配也是比較經典的遊戲顯卡配色。細節方面,RX 6900XT同樣配備3個散熱風扇,可以保護PCB板並提升顯卡強度的一體式金屬背板也沒有落下。此外,顯卡頂部的Logo下還隱藏了LED燈,開機之後可透出AMD Radeon系列顯卡標誌性的紅色光芒。
RX 6900XT頂部的Logo下隱藏LED燈,開機之後可透出紅色燈效。
在RX 6800XT顯卡的首發評測中我們詳細對比了它和RX 6800在外觀上的差別,其中一點就是RX 6800XT頂部的Logo採用的是白色導光材質,而RX 6800則採用的是紅色導光材質,當時我們猜測RX 6800XT可能支持RGB LED燈效。果然,頂部Logo同樣採用白色導光材質的RX 6900XT可通過軟體控制其燈效模式和燈光色彩,實現當下主流的RGB燈效。
玩家可通過燈效控制軟體調節RX 6900XT頂部Logo的燈光色彩和燈效模式,實現當下主流的RGB燈效。
點擊播放 GIF 0.0M
點擊播放 GIF 0.0M
RX 6900XT燈效鑑賞
這款顯卡採用雙8Pin供電設計
RX 6900XT的視頻輸出面板上設計了兩個DP接口、1個HDMI接口和1個USB-C接口
RX 6900XT同樣配備3個散熱風扇
這款顯卡的一體式金屬背板可保護PCB板上的元器件,同時起到提升顯卡強度的作用。
RX 6900XT也採用了和RX 6800XT相同的散熱設計,其GPU和顯存部分均配備純銅散熱底座,顯存和重要晶片也配備散熱貼片進行降溫處理。
RX 6900XT採用14層PCB設計
RX 6900XT的GPU晶片面積為519平方毫米,擁有268億個電晶體和5120個流處理器,頻率為2015~2250MHz。
RX 6900XT搭載的是來自三星的GDDR6顯存,總顯存容量為16GB。
RX 6900XT採用16相供電設計,每相供電電路均配備IR TDA21472 MOSFET和封閉式電感等元器件。
AMD Radeon RX 6900XT規格參數
GPU:NAVI 21
計算單元數:80個
流處理器數:5120個
光線追蹤單元數:80個
核心遊戲頻率:2015MHz
核心超頻頻率:2250MHz
顯存容量:16GB GDDR6
顯存速率:16Gbps
高速緩存容量:128MB
供電接口:雙8Pin
視頻輸出接口:DP×2,HDMI×1,USB-C×1
參考價格:7999元
性能測試
前文中我們提到,RX 6900XT主要是在流處理器數量上領先RX 6800XT,而核心頻率和顯存規格則保持一致,所以我們認為RX 6900XT在理論性能上應該能小勝RX 6800XT。不過相比靠經驗推測,測試成績明顯更具說服力,所以在測試環節中,我們會把RX 6800XT納入對比顯卡的行列中。
我們知道RX 6900XT的對標產品是來自NVIDIA的RTX 3090,相信不少玩家也非常好奇RX 6900XT的實際性能和RTX 3090相比到底誰強誰弱。於是我們也將NVIDIA GeForce RTX 3090 FE(下文簡稱:RTX 3090 FE)作為對比顯卡之一,從而給大家一個準確的答案。除此之外,狂暴模式和SAM功能是RX 6900XT的一大亮點,我們也比較好奇它們究竟能給RX 6900XT帶來多大的性能提升,所以我們也將對此進行測試。
RX 6900XT的GPU-Z截圖
測試平臺一覽
顯卡:AMD Radeon RX 6900XT
AMD Radeon RX 6800XT
NVIDIA GeForce RTX 3090 FE
處理器:AMD銳龍 9 5950X
內存:DDR4 3200 32GB雙通道
主板:ROG CROSSHAIR VIII DARK HERO
電源:ROG THOR 1200W
3DMark顯卡理論性能測試
前文中我們提到,RX 6900XT和RX 6800XT的GPU頻率和顯存規格保持一致,它們在規格上的主要區別是RX 6900XT多了512個流處理器單元,以及8個光線追蹤單元,這兩方面的提升在3DMark的測試成績上有所體現——RX 6900XT的顯卡總分均小幅領先RX 6800XT。
與RTX 3090的對比方面,RX 6900XT在Fire Strike、Fire Strike Extreme和Fire Strike Ultra這3個場景中的顯卡分數保持領先,但在剩下3個測試場景中落後於RTX 3090,特別是在測試顯卡光線追蹤性能的Port Royal場景中,RTX 3090 FE的領先幅度高達28%,看來NVIDIA的第二代RT Core實力不容小覷。
遊戲性能實測
遊戲性能的實測成績我們不妨同樣從RX 6900XT對比RX 6800XT,以及RX 6900XT對比RTX 3090 FE這兩個部分來分析。首先在RX 6900XT對比RX 6800XT方面,總體來看擁有更多流處理器的RX 6900XT在綜合性能上仍然領先RX 6800XT約4%,但前者並沒有保持全勝戰績,運行部分遊戲的平均幀率落後RX 6800XT約2%。而在和RTX 3090 FE的較量中,RX 6900XT的綜合性能落後前者約6%。並且僅在運行《塵埃5》《刺客信條:英靈殿》時的平均幀率高於RTX 3090 FE,運行其十餘款參測遊戲的平均幀率則有不同程度的落後。
光線追蹤性能測試
在光線追蹤性能測試部分,我們挑選了《看門狗:軍團》《控制》《戰地5》等遊戲來考察RX 6900XT的表現。需要說明的是,在測試中我們統一關閉AMD SAM和NVIDIA DLSS功能,以保證測試成績的可對比性。從我們的測試結果來看,RX 6900XT運行這部分參測遊戲的平均幀率領先RX 6800XT約2%,同時明顯落後於RTX 3090 FE。例如在開啟光線追蹤之後,RTX 3090 FE在4K解析度下運行《控制》的平均幀率為42fps,而RX 6900XT在上述設定下運行這款遊戲的平均幀率僅24fps,兩者差距非常明顯。
AMD SAM+狂暴模式性能測試
在RX 6900XT的技術解析中我們提到,AMD推出的SAM功能和狂暴模式可有效提升RX 6900XT的遊戲性能,所以我們也非常好奇SAM+狂暴模式到底能給RX 6900XT帶來多大的性能提升。於是我們挑選了《刺客信條:英靈殿》《極限競速:地平線4》《無主之地3》這3款遊戲,並分別在2.5K和4K解析度下考察了RX 6900XT在同時開啟SAM和狂暴模式後的遊戲性能。
結果顯示,參測遊戲的平均幀率有非常明顯的提升。例如在2.5K解析度下,RX 6900XT運行《刺客信條:英靈殿》的平均幀率達到127fps,相比默認狀態下的性能提升達41%。此外,開啟SAM和狂暴模式後,RX 6900XT在4K解析度下運行《極限競速:地平線4》的平均幀率達到175fps,不僅在比默認狀態下提升14%,同時還反超RTX 3090 FE。
綜合來看,SAM+狂暴模式的確能給RX 6900XT帶來比較可觀的性能提升。通常情況下,如果玩家想要「免費」提升顯卡性能,超頻自然是首選,但對顯卡進行手動超頻需要足夠的經驗和耐心,同時也仍然存在損壞顯卡的風險。相比手動超頻,SAM+狂暴模式同樣能給玩家帶來非常明顯的性能提升,而且操作簡單,損壞顯卡的風險也非常低,所以也更值得玩家們嘗試。
滿載核心溫度及測試平臺總功耗
我們在這部分測試中主要想考察RX 6900XT的散熱性能和功耗,於是我們使用Furmark(1080p解析度,關閉抗鋸齒)對這款顯卡進行了半個小時的烤機測試。結果顯示,這款顯卡在烤機半個小時之後的核心溫度為81℃(室溫約21℃),與RX 6800XT在相同測試環境下的核心溫度相差不大。而在功耗方面,RX 6900XT在滿載狀態下測試平臺的總功耗在465W左右,略高於RX 6800XT,所以我們也建議玩家們至少為這款顯卡搭配額定功率在850W或更高的電源。
小結
定位頂級遊戲顯卡市場,對標NVIDIA的RX 3090,或許不少玩家都對RX 6900XT在性能上的期待值都比較高。然而GPU頻率和顯存規格與RX6800XT保持一致,只是小幅提升GPU的流處理器數量和光線追蹤單元數量,這讓RX 6900XT的綜合性能相比RX 6800XT僅有3%~4%的提升,所以RX 6900XT在實際性能上的表現難免會讓不少玩家失望。不過好在開啟SAM和狂暴模式之後,RX 6900XT的性能得到明顯提升,這能在一定程度上達到部分玩家期待的水平,同時還是能在部分遊戲性能上比肩NVIDIA的RTX 3090。
價格方面,RTX 3090 FE的售價是11999元,RX 6900XT的售價是7999元。我們認為,AMD或許並不是想要憑藉RX 6900XT與NVIDIA在頂級遊戲顯卡領域一較高下,而是試圖讓RX 6900XT來填補RTX 3090和RTX 3080之間的性能斷層,從而實現錯位競爭。與此同時,AMD還通過SAM+狂暴模式來提升RX 6900XT的性能,使其性能可以達到可媲美RTX 3090的水平,從而在「秀肌肉」的同時,滿足那些對RX 6900XT有較期待的玩家。
隨著RX 6900XT正式上市,AMD和NVIDIA在消費級顯卡市場的競爭也愈發激烈,綜合這款顯卡的性能和價格來看,它也有能力搶奪NVIDIA在頂級顯卡的市場份額,那麼NVIDIA將會如何應對呢?按照NVIDIA的一貫傳統,他們應該會針對RX 6900XT推出一款相同定位的產品,這款產品有可能就是目前網上流傳搭載20GB顯存的RTX 3080。
那麼精準的產品定位加上更加親民的價格是否能讓RX 6900XT在頂級遊戲顯卡市場一展身手,AMD能否憑藉這款顯卡爭奪更多的消費級顯卡市場份額,NVIDIA將會以怎樣的方式予以還擊,從而鞏固自己在消費級顯卡市場的領導地位呢,讓我們拭目以待吧。