性能翻倍,英偉達最強消費級顯卡出爐-虎嗅網

2020-12-18 虎嗅APP


對於全球遊戲玩家和 AI 從業者來說,一個重要時刻到來了。


剛剛,同樣是在自家廚房,英偉達創始人黃仁勳向世人發布了最新一代消費級顯卡 GeForce RTX 30 系列的最初三個型號 GeForce RTX 3070、RTX 3080、RTX 3090。


「無論性能還是能效,安培架構 GPU 都是圖靈的兩倍,」黃仁勳說道。「從架構、定製流程設計、電路、邏輯、封裝、series IO、顯存、供電、散熱、軟體和算法…… 我們在所有層面壓榨 GPU 的性能,最終實現了世界水平。」


劇透:壁櫥抹刀瓶後有驚喜。


關於這次發布,網上早已有各類信息提前曝光。但大家最為關心的就是 GeForce RTX 30 系列的性能與報價。用老黃的話說就是,與 2080 價位相同,但速度提升了一倍。而 3090 更是 GPU 中的猛獸,黃仁勳稱之為 BFGPU。



這些公版GPU的國行價格也第一時間出現在了英偉達中國官網上:



當今最強 GPU


在深度學習、光線追蹤的一系列熱場後,黃仁勳突然從放置抹刀的瓶子後,拿出了了一塊 RTX 3080,開始正式介紹 RTX30 系列。



總體來說,GeForce RTX 30 系列確實佔據了 GPU 界的多項「第一」:首款有著 24GB  GDDR6X 顯存的遊戲圖形卡;首批支持 HDMI 2.1 的 GPU,一塊顯卡即可實現 4k 高刷新率或 8k 遊戲;首批支持 AV1 編解碼器的獨立 GPU,實現以更少的帶寬觀看更高解析度的視頻流。


最大號的 GeForce RTX 3090,當然還是要從烤箱裡拿出來。


RTX 3090 是世界上第一個 8K 遊戲 GPU。為什麼一定要 8K?在英偉達看來,解析度的提高會讓視覺效果更加清晰銳利,讓玩家更好地辨認出遠方的遊戲元素,以及讓細節更加真實,比如頭髮、衣服縫線和皮膚皺紋。



這款顯卡更類似於 Titan 系列,比上一代「正常範圍內」的最高級顯卡 GeForce RTX 2080 Ti 的性能要強大許多。RTX 3090 將於 9 月 24 日上市,起始價為 1499 美元。如果說沒有傳說中 40G 顯存的新泰坦,它就是旗艦 GPU 了。



在具體參數上,RTX 3090 使用代號為 GA102 的核心,和前代泰坦一樣擁有 24G 顯存,但型號升級為 DDR6X,顯存速度 19.5Gbps,384bit 位寬,擁有 10496 個等效 CUDA 核心,相比 GeForce RTX 2080 Ti,3090 的核心數量增加一倍不止,功耗則達到了 350W。


另外,RTX 3080 是 320bit 位寬,內建 8704 個 CUDA,顯存 10G,功耗 320W。RTX 3070 則有 5888 個 CUDA。



相比之下,2080Ti 的 CUDA 核心是 4300 個,所以黃仁勳在發布中說 3070 性能超過 2080Ti,看來是沒什麼問題的。


單從核心數量上來看,這巨大的提升讓最近買了 RTX 20 系列的人有了四九年入國軍的感覺。不過需要注意的是,英偉達官方標記的數據是等效核心,與之前的物理核心不同。


Nvidia GeForce 性能對比,來源:ANANDTECH


這些顯卡均支持 PCIe 4.0,還有 HDMI 2.1 和 DP 1.4a 等接口,並內含第二代光追核心 RTX Core、第三代張量核心 Tensor Core。



可以看到,RTX 3090 和 RTX 3080 顯存容量差距較大,這或許是在為稍後推出的 RTX 3080 Super 留位置。另外,3090 的 24G 內存和 1399 美元的價格或許能夠讓很多對深度學習有需求的用戶省下買泰坦的預算。如果你真的想要「Titan Ampere」,預計它會是一個顯存 40G,售價 3000 美元的誇張顯卡。


另外需要注意的是 GPU 代工廠,今天發布的 GeForce RTX 30 系列均採用了三星的 8 納米製程「英偉達定製工藝」,選擇三星而不是臺積電,不知是出於什麼樣的考慮。


安培架構,AI 算力再上臺階


這些強大的 GPU,採用的都是今年 5 月剛剛推出的最新 7 納米製程架構安培,其首先被 Tesla A100 所採用。



在當時的 GTC 大會上,英偉達推出的安培架構計算卡 A100,成為了當時人類製造出的最大 7 納米製程晶片。這塊 AI 計算卡採用先進的臺積電7 納米工藝,擁有 540 億個電晶體,它還是一塊 3D 堆疊晶片,面積高達 826mm^2,最大功率達到了 400W。


除了製程提高,安培架構還有一些針對 AI 計算特有的機制,其中的三代 Tensor Core 會對稀疏張量運算進行特別加速:執行速度提高一倍,也支持 TF32、FP16、BFLOAT16、INT8 和 INT4 等精度的加速——系統會自動將數據轉為 TF32 格式加速運算,現在你無需修改任何代碼量化了,直接自動訓練即可。


針對稀疏矩陣的加速可以讓安培架構 GPU 處理 AI 任務的效率提高一倍。


最終在跑 AI 模型時,如果用 PyTorch 框架,相比上一代 V100 晶片,A100 在 BERT 模型的訓練上性能提升 6 倍,BERT 推斷時性能提升 7 倍。


不過由於消費級和專業級晶片的結構不盡相同,我們不能把 Ampere A100 晶片的 AI 訓練性能簡單地直接拿來作為參考,還需要等待官方公布,以及最終實測的數據。


黃仁勳表示,GeForce RTX 30 系列顯卡具備三項基礎處理技術:30TFLOPS 算力的可編程著色器,雙倍吞吐量,用於光追的 RT Core,以及可自動忽略次要 DNN 權重的 Tensor Core。


三個方面,性能相比前一代都是翻倍。



AI 是目前科技領域最強大的技術力量,可以讓計算機從大量數據中學習知識,甚至據此編寫出軟體。在圖形領域,我們仍然可以通過 Tensor Core 的力量增強視頻的畫面。「我們現在可以只計算低解析度圖像的光追,再用 Tensor Core 通過 DLSS 將其還原成高解析度,同時還能提高畫面幀率。」黃仁勳說道。


英偉達通過自己的超級計算機訓練了多種不同場景的圖像,並將訓練好的模型以顯卡驅動的程序安置在你的電腦中。在遊戲運行時,AI 會通過上一幀高清圖對現有低分辨圖進行渲染,最終達到超過原畫的效果。據介紹,在最新版的 DLSS 2.0 上,Tensor Core 可以把 RTX 的性能提升一倍——這也意味著遊戲的有效幀數可以變成兩倍,現在光線追蹤、高解析度和高幀率可以同時擁有了。


用它來打遊戲會是什麼樣


除了新的圖像增強工具 DLSS 2.0,隨著安培架構的 GeForce 顯卡,英偉達推出了 Nvidia Reflex、Nvidia Broadcast、Machinima 等工具,基於 RTX 的強大算力,現在人們不僅可以獲得更好的遊戲畫面,也可以在遊戲時獲得更低的延遲、直播時屏蔽環境噪音,替換背景,實現綠幕效果、甚至直接用遊戲裡的元素創作出你想要的電影。



如今,大型 3D 遊戲的容量已經超過了 200G,大量圖像材質需要從被解壓縮,進而交由 GPU 處理。在使用了 PCIe-4 和固態硬碟之後,CPU 解壓縮成為了這個流程的瓶頸。現在,通過新技術 RTX IO,GPU 可以無損進行解壓縮工作了。


自 Turner Whitted 等人首次發表光線追蹤的論文以來,已過去了 40 年,如今這項技術從計算及圖形的聖杯變成了人人都可以體驗的實時遊戲畫面。黃仁勳還宣布《堡壘之夜》已經支持英偉達的光線追蹤技術。「現在,全球排名前二的最受歡迎遊戲,《我的世界》和《堡壘之夜》,都已支持光追。」黃仁勳說道。


為了讓新一代 GeForce 顯卡能夠充分發揮作用,英偉達還發布了一款誇張的 360Hz 刷新率 G-Sync 屏幕,預計今年秋天就會出現在宏基、華碩、微星、外星人等品牌的電腦配置單上。



幾個月前,黃仁勳在 GTC 上展示了 Turing 進行數百光源的光追實時渲染的 Marbles 撞球遊戲視頻,使用 Turing RTX Quadro 8000,達到 720p 25 幀。而使用安培架構的 GPU,現在我們可以實現 1440p、30 幀,並增加更多的特效,這是超過四倍的性能。


還想要更好的效果?你也可以通過 NVLink 把兩張 GeForce RTX 3090 進行 SLI,以達到性能的大幅度擴展。不過看看一張卡的價格,這種事估計只有玩微軟模擬飛行的時候才會有人幹吧。


最後,對於 RTX 3090 在常規任務中的性能,目前已有了一些傳聞,據稱基於 GA102 的未定型顯卡在未優化完整的遊戲中以 4K 解析度跑起來比 RTX 2080 Ti 的幀數高 40%,而優化過的遊戲中性能更是要高出 50%,在針對安培架構進行優化最佳情況下,性能提升可高達 70%。想要在 4K 解析度下看高刷新率畫面,現在不是問題了。


採用英偉達大量最新技術的遊戲《賽博朋克 2077》,預定在今年 11 月 19 日與人們見面。


在星際迷航中,劇中人會使用 Holodeck 創造虛擬實境環境進行任務,現在這種科幻的夢想很大程度上成為了現實。「未來,GeForce 就是你的 Holodeck,你的光速飛船,你的時間機器。」黃仁勳說道。


正如人們所預料,RTX 3090 的性能絕對強勁。現在,問題來到了我們這邊,1 萬元一塊的泰坦級顯卡,你會不會買?


相關焦點

  • 性能翻倍,英偉達最強消費級顯卡RTX3090出爐:半價買泰坦
    剛剛,同樣是在自家廚房,英偉達創始人黃仁勳向世人發布了最新一代消費級顯卡 GeForce RTX 30 系列的最初三個型號 GeForce RTX 3070、RTX 3080、RTX 3090。「無論性能還是能效,安培架構 GPU 都是圖靈的兩倍,」黃仁勳說道。
  • 英偉達最強消費級顯卡RTX 3090出爐:半價買泰坦
    剛剛,同樣是在自家廚房,英偉達創始人黃仁勳向世人發布了最新一代消費級顯卡 GeForce RTX 30 系列的最初三個型號 GeForce RTX 3070、RTX 3080、RTX 3090。「無論性能還是能效,安培架構 GPU 都是圖靈的兩倍,」黃仁勳說道。
  • 英偉達發布RTX30系列顯卡,性能翻倍價格是泰坦一半
    剛剛,英偉達發布了新的GeForce RTX 30系列GPU,性能相比上一代GPU翻倍,功率效率也是上一代的1.9倍,英偉達稱其為史上最大的晶片跨越。正是在21年前,英偉達發布了世界首款GPU、也是第一款以Geforce為名的顯示核心——Geforce 256。因此,英偉達官方網站也打出了全新標語「21天,21年」來紀念這一時刻。21年過去了,GeForce系列也已經有了全面的性能提升。
  • 英偉達RTX A6000專業顯卡發布,性能竟然超RTX 3090!
    最近,英偉達就發布了一款名為RTX A6000的顯卡,旨在作為專業工作負載的圖形加速卡。RTX A6000具備了RTX消費級顯卡上同樣的光線追蹤特性,採用了完整的GA102晶片,意味著擁有10752個CUDA核心,可提供高達38.7 TFLOPs的單精度計算性能(比GeForce RTX 3090高出3.1 TLFOPs)。
  • 英偉達30移動顯卡性能曝光,3080顯卡性能超過了桌面3070?
    英偉達的30移動顯卡確定一月份發布了,當然這一次顯卡的一些參數是曝光了,這一代的顯卡可能是有提升的一代了!現在曝光的名稱是,英偉達移動顯卡有RTX 3070 Max-P、RTX 3070 Max-Q,基於GA104M打造,顯存是16gb,這是比賽桌面版的顯卡高很多的,3080移動顯卡使用的是GA104 GPU,有6144CUDA核心。
  • 神似而並非泰坦顯卡,RTX3090是被老黃砍掉專業性能的遊戲卡皇
    作為第一張真正意義上的8K遊戲卡—RTX3090,可以說是史上性能提升性能最強、功耗最爆炸的遊戲旗艦卡。一方面RTX3090能夠給你帶來出乎意料的性能,同時也給你帶來意想不到的驚喜功耗!這僅僅是頻率保守的公版顯卡,一些性能極好的非公版顯卡解鎖TDP之後可以達到480W,RTX3090果然是名副其實的新核彈。作為配有24GB顯存的RTX3090很容易被人誤解為和TITAN RTX 定位一樣,是同時兼顧遊戲性能和專業性能的遊戲專業卡。實際上,RTX3090並非定位是泰坦顯卡,而是被老黃砍掉專業性能的遊戲卡皇。
  • 英偉達下一代MX顯卡曝光 性能有望達到GTX 1650 Max-Q的水平
    英偉達下一代MX顯卡曝光 性能有望達到GTX 1650 Max-Q的水平 來源:IT之家 • 2020-02-11 15:55:00
  • 《機甲戰士5:僱傭兵》DLSS實測 性能翻倍,省下幾千顯卡錢
    [PConline 雜談]2月底的時候我們實測過英偉達最新的DLSS 2.0技術,能讓RTX 2060在光線追蹤效果全開的情況下再提升50%左右的幀數,且畫質與關閉DLSS時相差無幾,屬實是一項非常了不起的技術。而它的缺點也顯而易見,現在支持DLSS技術的遊戲掰手指頭都能數過來。
  • 英偉達發布RTX 30系顯卡,性能超2080Ti,價格3899元起
    發布的三款顯卡,國內售價3899元起,連最低配版的性能都超過了上一代旗艦2080 Ti。看完發布會的網友這次真的要喊出「NVIDIA YES」了。三塊顯卡:性價比真的高,但旗艦真的貴今天,廚房和煤氣灶第二次充當老黃髮布GPU的主場。
  • 英偉達泰坦RTX顯卡正式公布!定價2499刀是2080Ti兩倍但性能提升...
    不久前,英偉達新的泰坦顯卡——Titan RTX疑似被「洩露」,而現在官方也正式公布了這張強力顯卡,並表示它會採用與2080Ti一樣的圖靈架構。此外他們還公布了新卡的參數配置以及售價。  英偉達泰坦RTX有6個圖形處理群集,36個紋理處理簇,4608個CUDA核心,基礎頻率1350 Mhz,加速頻率1770 Mhz,有24GB GDDR6總顯存,576個紋理單元。
  • 英偉達八代GPU史上的超級大飛躍 較前一代圖靈架構性能提升20倍
    近日,英偉達 CEO 黃仁勳正式發布了新一代 GPU 架構 Ampere 安培,這是英偉達推出的第八代 GPU 架構,較前一代 2018 年發布的圖靈架構性能提升高達 20 倍。據悉,英偉達每代顯卡架構均以頂級科學家命名,這一次以法國物理學家安培命名。
  • nvidia顯卡設置最高性能
    最近有小夥伴向小編問道自己配置英偉達顯卡的電腦玩起遊戲來畫面有些卡頓,應該怎麼才能將英偉達顯卡設置成最高性能?下面小編就來跟大家說一說,英偉達的顯卡如何設置成最高性能。nvidia顯卡設置最高性能1、要想對英偉達顯卡進行設置,首先我們要確定電腦上的顯卡驅動安裝好了。2、確定顯卡的驅動安裝正常。我們直接右鍵桌面的空白處,就可以打開英偉達的控制面板了。3、也可以通過打開「控制面板」→「硬體和聲音」打開。4、打開後在左邊一框的「3D設置」下列,單擊第二項「管理3D設置」。
  • 泰坦顯卡稱霸天梯圖,六年歷史值得紀念!
    在顯卡天梯圖中,位於卡皇位置的並不是大家熟悉的RTX 2080Ti,而是英偉達公司泰坦系列的第五代產品泰坦RTX。提起英偉達公司的泰坦系列顯卡,許多人可能會覺得很陌生,這是因為這個系列的顯卡價格實在太貴,宣傳力度也不大,大家沒聽過也就不奇怪了。
  • 顯卡市場霸主—英偉達崛起之路:先制霸遊戲機市場,再到GPU市場
    在顯卡市場雖然有AMD這個強悍的對手,但是自家顯卡無論是在性能還是銷量、用途上都完全碾壓對手。然而,英偉達這家幾乎壟斷獨立顯卡市場的顯卡巨頭,卻只用30多年時間就迅速崛起,這實在讓人感到驚訝。其實,它只是上世紀90年代美國—那個半導體科技飛速發展時代的一個優勝者,當然也經歷了不少挫折與艱辛。
  • 英偉達 RTX 3090 遊戲測試數據曝光:光追性能較 2080 Ti 提升一倍
    9 月 1 日消息 根據外媒 TechPowerUp 的報導,英偉達 RTX 3090 的官方測試數據已經流出,光追性能在《我的世界》中相較 RTX 2080 Ti 翻倍。
  • 英偉達或於2021年1月推出新一代遊戲顯卡
    打開APP 英偉達或於2021年1月推出新一代遊戲顯卡 ITheat熱點科技 發表於 2020-12-16 16:48:27
  • 顯卡排行天梯圖在線查詢 新版英偉達AMD顯卡性能排行榜
    英偉達和AMD兩家公司作為目前消費級顯卡最大的兩家公司,佔據了主要的顯卡市場份額,因此用戶在選購顯卡的時候也基本上考慮這兩家的顯卡產品,下面我們來對比英偉達和AMD兩家顯卡的型號。
  • ROG將於下個月上市其PG259QN顯示器,是消費級市場首款360Hz刷新率...
    在今年的CES展上,華碩ROG公布了其刷新率高達360Hz的顯示器,經過了半年時間,華碩ROG已經準備好將這款顯示器推向市場了,這意味著華碩ROG將成為首家向普通消費級市場推出360Hz高刷新率顯示器的廠商。
  • 英偉達(NVDA.US)RTX 30系列顯卡會對PS 5造成衝擊嗎?
    英偉達(NVDA.US)RTX 30系列顯卡會對PS 5造成衝擊嗎?(NVDA.US)最新基於8nm 安培架構的RTX 30系列顯卡,似乎是改變了市場上的遊戲規則,因為它與前一代顯卡相比帶來了一個巨大的性能提升。
  • 怎麼設置顯卡性能更高
    主板上的集成顯卡不能滿足我們的性能要求。獨立顯卡也成為筆記本電腦的標準配置。如果您的筆記本獨立顯卡是AMD,建議繼續使用集成顯卡。如何設置NVIDIA顯卡玩高性能的遊戲?接下來,小編將介紹設置NVIDIA顯卡進行高性能遊戲的操作步驟。很多人可能只在遊戲中設置圖像質量選項,例如消除混疊等;他們不注意視頻卡驅動程序控制面板中的設置。