傑森·劉易斯(Jason Lewis)在一系列嚴峻的真實3D和GPU渲染測試中,評估了英偉達當前的頂級遊戲GPU與該公司其他GeForce和Titan RTX圖形卡的比較。
如果您是CG Channel的常規讀者,您可能還記得去年,我在GeForce,Titan和Quadro RTX GPU的小組測試中評估了Nvidia最新的Turing顯卡處理3D軟體的性能。在本次後續評測中,我將介紹我第一次沒有使用的GPU:Nvidia當前的高端消費類顯卡GeForce RTX 2080 Ti。
在了解RTX 2080 Ti在一系列DCC應用程式中的性能表現的同時,我將測試Nvidia的RTX硬體可以在多大程度上加速GPU渲染,並嘗試回答讀者針對先前的評論提出的幾個問題:選擇用於生產工作的GPU時,內存容量有多重要?使用Nvidia的Studio GPU驅動程序有多重要?
為了進行比較,我將在原始評論中重新測試其他消費類和消費類卡:當前一代的Titan RTX和GeForce RTX 2080,以及上一代的GeForce GTX 1080和GeForce GTX 1070。這次是Titan V,因為我的原始測試表明Titan RTX在DCC工作上既便宜又更好。我希望在以後的評論中重新使用Nvidia的工作站圖形卡Quadro RTX系列。
不幸的是,我無法測試Nvidia的低端或中端GeForce RTX卡,GeForce RTX 2060和2070及其Super變體。但是,作為測試的一部分,我包括了一個流行的綜合基準3DMark,因此您應該可以通過將我的結果與在線提供的其他3DMark得分進行比較來了解它們的性能。
技術重點:GPU架構和API
在討論測試卡之前,下面快速回顧一下我在上一篇評測中涉及的一些技術術語。如果您已經熟悉它們,則可以跳過。
Nvidia當前一代的Turing GPU架構具有三種類型的處理器內核:CUDA內核,用於通用GPU計算;Tensor核心,專為機器學習操作而設計;RTX卡中新增了RT和RT核,旨在加速射線追蹤計算。
為了利用RT內核,軟體應用程式必須通過圖形API對其進行訪問:對於本篇評論中介紹的應用程式,是虛幻引擎中使用的DXR(DirectX光線跟蹤)或Nvidia自己的OptiX API,大多數離線渲染器使用。
在大多數渲染器中,均提供了OptiX渲染後端,以替代基於Nvidia CUDA API的舊後端。CUDA後端可與更廣泛的Nvidia GPU配合使用,但OptiX可以通過RTX卡的RT核心(通常簡稱為「 RTX加速」)來加速光線跟蹤。
儘管許多製造商生產了自己的GeForce RTX 2080 Ti變體,但出於本次審查的目的,我還是使用了Nvidia自己的Founders Edition卡。
如果您打折的Titan RTX佔據了傳統遊戲卡和工作站卡之間的一半空間,那麼它就是Nvidia當前高端的消費類GPU。
實際上,2080 Ti和Titan RTX具有相似的規格。兩者都使用Nvidia的Tu102 GPU,基本時鐘速度為1,350 MHz,儘管Titan的提升時鐘速度更高:1,770MHz,而超頻的是1,545MHz或1,635MHz。Titan的Tu102也已完全解鎖,具有4,608個CUDA內核,576個Tensor內核和72個RT內核,而2080 Ti的稍帶草稿的版本具有4,352個CUDA內核,544個Tensor內核和68個RT內核。
卡之間的最大區別是它們攜帶的板載GDDR6 RAM數量。2080 Ti具有11GB RAM;Titan的容量為24GB,是後者的兩倍多。價格相差不大:經過測試的2080 Ti的目前市價約為1200美元;泰坦戰艦的價格約為2500美元。
您可以在下表中查看此處測試的其他卡的規格,GeForce RTX 2080,GeForce GTX 1080和GeForce GTX 1070,並在原始組測試中詳細了解它們的優缺點。
與之前的小組測試一樣,本次評測的測試系統是BOXX Technologies APEXX T3工作站,配備AMD Ryzen Threadripper 2990WX CPU,128GB 2666MHz DDR4 RAM,512GB Samsung 970 Pro M.2 NVMe SSD和1000W電源。
測試是使用組測試中使用的部分應用程式完成的,在某些情況下已更新為該軟體的當前版本。基準測試是在Windows 10 Pro for Workstations上運行的,分為四類:
視口和編輯性能
3ds Max 2020,Blender 2.81,Maya 2020,Modo 13.0v1,SolidWorks 2020,Substance Painter 2019,虛幻引擎4.24
渲染
Blender 2.81(使用循環),Cinema 4D R20(使用Radeon ProRender),KeyShot 9,Maverick Studio Build 410,OctaneRender 2019(使用OctaneBench),用於3ds Max的Redshift 3.0.13(測試版),SolidWorks 2020 Visualize,V-Ray下一步(使用V-Ray GPU的3ds Max的V-Ray 4.3)
其他基準測試
Metashape 1.5.1,Premiere Pro CC 2019(視頻編碼),Substance Alchemist 2019,Unreal Engine 4.24(VR性能)
綜合基準
3DMark
在視口和編輯基準中,幀速率分數表示在操縱顯示的3D資產時獲得的數字,這些數字是在五個測試會話中進行平均以消除不一致的情況。在所有渲染基準測試中,都禁用了CPU,因此只有GPU用於計算。測試是在單個32英寸4K顯示器上進行的,其原始解析度為60Hz時為3,840 x 2,160px。
視口和編輯性能
視口基準測試包括許多關鍵的DCC應用程式-諸如3ds Max,Blender和Maya之類的通用3D軟體,以及諸如Substance Painter之類的更專業的工具-以及CAD軟體包SolidWorks和遊戲引擎Unreal Engine。
不出所料,Titan RTX在所有測試中均排名第一,而RTX 2080 Ti僅次於緊隨其後的第二名,但在SolidWorks基準測試中,Titan具有領先優勢。RTX 2080在所有測試中均排名第三,其次是GTX 1080和GTX 1070。
渲染
我將渲染基準分為兩組。第一組應用程式要麼不使用OptiX進行光線跟蹤,要麼無法打開和關閉OptiX後端,因此無法評估RTX加速對性能的影響。
在第二組應用程式中,可以啟用OptiX或僅使用CUDA進行渲染,從而可以在啟用RTX加速時測量性能的提高。
GPU渲染性能遵循與視口性能類似的模式:Titan RTX在所有測試中均排名第一,儘管RTX 2080 Ti緊隨其後。RTX 2080在所有測試中均排名第三,其次是GTX 1080和GTX 1070。
有趣的是,啟用OptiX後性能如何提高,並且該軟體可以將光線跟蹤計算分流到RTX卡的RT核心。在Redshift中,影響相對較小-儘管要記住3.0版仍處於早期訪問中-但是在V-Ray基準中,性能提高了33-35%,在Blender基準中,性能提高了85-105%。
其他基準測試
下一組基準測試旨在測試GPU是否用於更專業的任務。攝影測量應用程式Metashape使用GPU進行圖像處理,Substance Alchemist使用GPU進行紋理烘焙和運行某些濾鏡,Premiere Pro使用GPU進行視頻編碼。
與之前的基準測試一樣,Titan RTX在所有測試中均排名第一,其次是RTX 2080 Ti,RTX 2080,GTX 1080和GTX1070。PremierePro的性能差異最小,Substance Alchemist的性能差異最大。
綜合基準
最後,我們有綜合基準3DMark。綜合基準測試無法準確預測GPU在生產中的性能,但由於在線提供了多種GPU的評分,因此它們確實提供了一種將測試卡與舊型號進行比較的方法。與以前的評論不同,我沒有在此處包含Cinebench,因為具有GPU基準測試的最新版本現已使用6年了。
GPU渲染和GPU內存
查看GPU渲染基準,您可能想知道為什麼有人會花2500美元購買Titan RTX,而GeForce RTX 2080 Ti的性能卻差不多,而價格卻不到一半。答案是它的存儲容量。為了說明為什麼Titan –或其他具有大量圖形內存的GPU –值得DCC專業人士付錢,我設置了一些特別複雜的場景。為了測量基準測試期間的GPU內存使用情況,我使用了EVGA的Precision X1實用程序中的硬體監視器。
如果GPU沒有足夠的圖形內存來執行計算任務,則必須將數據發送到系統RAM。在GPU渲染器中,這稱為核心外渲染。從上面的結果可以看出,這比訪問板載內存要慢得多,可靠性也要差很多。
在V-Ray巨魔場景中,整個場景都適合板載內存的Titan RTX比GeForce RTX 2080 Ti的性能要好得多,而GeForce RTX 2080根本無法渲染場景。2080和2080 Ti都不會渲染其他兩個場景,每次都在V-Ray建築場景中崩潰,並且在Arnold for Maya場景中因內存不足錯誤退出。
GeForce RTX卡的部分問題在於,它們必須使用其圖形內存的很大一部分才能在屏幕上顯示內容,從而減少了可用於渲染的內存。有一個解決方案:將兩個GPU放入您的工作站。大多數GPU渲染應用程式允許您手動指定將哪個GPU用於計算任務,因此,如果禁用用於顯示目的的GPU,則該應用程式將退回到計算GPU,該GPU的所有內存可用於渲染。
為了測試這一點,我在雙GPU設置中再次運行了三個高內存使用情況基準測試,使用Titan RTX僅用於顯示目的,而使用RTX 2080或RTX 2080 Ti進行渲染。
這次,情況有所不同。2080 Ti和2080都擺脫了顯示工作,可以渲染V-Ray巨魔場景。2080必須脫離核心,這會使其速度大大降低,但2080 Ti的性能與Titan相當。在Arnold for Maya場景中,結果相似,儘管在兩個GeForce卡上仍無法渲染V-Ray建築場景。
因此,如果Titan RTX的價格讓您感到不安,一種選擇是購買兩張RTX 2080 Ti卡。但是,尚不清楚GeForce RTX GPU是否可以像Titan RTX和Quadro RTX卡一樣使用Nvidia的NVLink技術來池化GPU內存(您可以在本文中找到詳細的分析)。否則,即使將其24GB的部分圖形內存用於顯示任務,單個Titan RTX仍將比雙2080 Ti設置更具通用性,在雙2080 Ti設置中,專用計算卡上只有11GB的圖形內存才可以。可用於GPU渲染。
Studio和Game Ready驅動程序
最近我被問到的另一件事是,對於DCC工作,Nvidia的Studio驅動程序是否比其Game Ready驅動程序具有任何優勢。為了測試這一點,我在RTX 2080 Ti上使用Studio驅動程序的441.66版本和Game Ready驅動程序的441.66版本在RTX 2080 Ti上運行了所有基準測試,使用Wagnardsoft的Display Driver Uninstaller實用程序來確保從一個版本切換到全新版本時到另一個。
從上面的結果選擇中可以看到,選擇驅動程序對性能沒有實際影響。我進行了更多研究,似乎Studio驅動程序的目的實際上是為了提高使用DCC應用程式時的穩定性,而不是性能。但是,我很長時間以來一直在使用帶有DCC軟體的GeForce GPU,並且從未在穩定性方面遇到任何實際問題,因此,如果您當前正在使用Game Ready驅動程序,並且一切運行正常,那麼我的建議是堅持下去。
資源全部網絡收集整理,如有問題,可聯繫作者進行刪除
歡迎加入「GSan設計高級群」 120/年
詳情點擊:GSan高級群的簡介
- 有償各種資源搜索,英文教程機翻,後臺諮詢 -
感謝您對GSan的支持
GSan和他的小夥伴們QQ群:233623995
官網:cgsan.vip