經歷了漫長的等待,終於在今天,英偉達CEO黃仁勳在自己廚房發布了英偉達最新一代GeForce RTX 30系列顯卡,包括GeForce RTX 3070、RTX 3080和RTX 3090。
黃仁勳稱,無論性能還是能效,安培架構GPU都是圖靈架構的兩倍,而英偉達基於安培架構的全新GPU在性能、能效和功耗上,均達到世界一流水平。
那麼,最新推出的GeForce RTX 30系列顯卡究竟如何?
9月中旬上市,價格同前代泰坦相當
黃仁勳表示,GeForce RTX 30 系列的價格同上一代RTX價格相當,但速度提升一倍。
目前,英偉達官網已經掛出GeForce RTX 30系列顯卡上市情況,作為GeForce RTX 30系列顯卡的旗艦產品,RTX 3090將於9月24日上市,其首發價格為1499美元(國行價11999元),取代了Titan系列,創下單個GPU GeForce卡的價格記錄。
RTX 3080將於9月17日上市,價格為699美元(國行價5499元),RTX 3070的價格為499美元(國行價3899元),與上一代RTX 2080 Super和RTX 2070 Super價格相同。
那麼,GeForce RTX 30系列顯卡自身性能是否與其售價相匹配?
總體來看,RTX 30系列顯卡包攬GPU界的多項第一,首款搭載美光24G GDDR6X 顯卡的遊戲圖形卡,是有史以來最快的存儲裝置;首批支持最新顯示標準HDMI 2.1的PC CPU,能實現4k高刷新率和運行8k遊戲;首批帶有AV1解碼器的離散GPU,使用戶能在臺式機和媒體中心中使用AV1。
圖片源自AnandTech
另外,相比於上一代旗艦級顯卡GeForce RTX 2080 Ti,GeForce RTX 3090的性能要強大很多。
具體而言,RTX 3090的等效CUDA核心數為10496個,大約是RTX 2080 Ti的兩倍以上。同前代泰坦一樣,RTX 3090 擁有24G的顯存,但型號從DDR6升級為DDR6X,顯存速度19.6Gbps,顯存位寬384bit。在散熱效率方面,RTX 3090的TDP達到350W,比前代泰坦增加了100W,這是因為RT3090採用了正反雙面風扇的散熱設計。
另外,RTX 3080等效核心8704個,顯存速度19Gpbs,顯存位寬320bit,TDP320w。RTX 3070 的等效CUDA核心數為5888,比2080和核心數多1536顆,同時前者TDP比後者低30w。
基於安培架構,三項技術性能翻倍
與上一代RTX不同的是,新一代RTX是基於安培架構而非圖靈架構,這使得GeForce RTX 30 系列顯卡性能得到了提升。
雷鋒網此前報導,今年5月份,英偉達推出了安培架構計算卡A100,是當時全球最大的7nm晶片,面積高達826平方毫米,集成540億個電晶體,相比Volta架構實現了高達20倍的性能提升,並且可以同時滿足AI訓練和推理的需求。
不過,此次發布的GeForce RTX 30 系列屬於消費級顯卡,採用的是三星8nm製程工藝,集成280億個電晶體。
根據黃仁勳的介紹,RTX GPU 擁有三項基礎處理技術:英偉達在15年前首次推出的可編程著色器、用於加光線三角形和光線邊界框相交的RT Core,以及稱為Tensor Core的AI處理管線。
Tensor Core可加速用於深度神經網絡功能的線性代數,這也是現代AI的基礎所在。尤其是在圖形領域,可以使用Tensor Core通過英偉達研究多年的DLSS將低解析度的圖像還原稱高解析度,從而提高畫面幀率,增強視頻的畫質。
具體而言,在遊戲中增加光線追蹤會增加計算工作負載,使用著色器會降低幀速率,增加RT core可將著色器工作負載減少60%。
RT Core 實際上每秒執行34 TFLOPS 浮點運算的著色器,而在進行光線追蹤時,圖靈相當於每秒執行45 TFLOPS浮點運算。即使是使用RT Core ,也要消耗大量時間,因此RT Core和著色器必須同時運行。同時使用時,即使是20毫秒,每秒也只有50幀,這對前幾代產品而言,性能仍然落後,例如,2018年,英特爾基於圖靈架構的GeForce RTX 20系列GPU就在光線追蹤方面引起過許多爭議。
不過,要是加上Tensor Core,就可以實現高解析度和高幀率,TRX的性能得以提升。
黃仁勳表示,新款RTX GPU 基於安培架構在性能方面實現了巨大飛躍,安培架構每個時鐘執行2次著色器計算,執行一次著色器算力為30 TFLOPS ,圖靈架構為11,安培架構翻倍了吞吐量。
另外,安培架構的RT Core可達58 RT TFLOPS,圖靈架構為34。安培架構全新的Tensor Core硬體處理稀疏網絡的速率是圖靈的兩倍,可自動識別並忽略次要的DNN權重,相較於圖靈 tensor Core 的89 tensor TFLOPS ,安培為238。
在這三項基礎技術上,新一代RTX性能提升均為上一代的兩倍。
搭配新工具,遊戲愛好者的新選擇
在此次發布會上,除了新一代圖像顯卡,英偉達還推出了Nvidia Reflex、Nvidia Broadcast、Omniverse Machinima和圖像增強工具DLSS 2.0,這對遊戲玩家而言意味著更優質的畫面、更低的延遲以及更安靜的環境。
黃仁勳表示,Nvidia Reflex可在CPU和GPU中優化渲染管道,最多可將延遲時間減少50%,該項工具將同Game Ready Driver一起推出。Nvidia Broadcast可以實現虛擬背景和音頻降噪,還可以實時追中主播頭部,讓主播居於畫面正中央。
Omniverse Machinima是一款面對動畫特效製作人員的動畫製作專業軟體,支持Maya、3D max等主流動畫軟體。
在光追技術方面,黃仁勳表示,「現在,全球排名前二的最受歡迎遊戲,《我的世界》和《堡壘之夜》,都已支持光追。」
另外,英偉達還宣布推出專為電競設計的擁有360Hz刷新率 G-SYNC顯示器,內置精確的延遲分析工具,今年秋天宏基、華碩、微星、外星人等品牌將上市這款顯示器。在英偉達的測試比較中,360Hz顯示器能夠幫助玩家更好地定位和追蹤對手。
總體看來,RTX 30系列顯卡的性能強勁,或將是遊戲愛好者的新選擇。
此次消費級GPU的推出,網友紛紛回應「NVIDIA YES」,這樣一款國行價3899元但性能強勁的GPU,你會購買嗎?
圖片源自英偉達官網
雷鋒網雷鋒網(公眾號:雷鋒網)雷鋒網
相關文章:
黃仁勳烤箱裡端出全球最大7nm晶片!英偉達第八代安培GPU A100發布,AI算力提升20倍,號稱史上最大性能飛躍
大漲167%!英偉達數據中心收入首次超過遊戲業
不是GPU的IPU,為什麼更值得英偉達警惕?
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。