RTX 30顯卡為何性能暴增?這要從NVIDIA Ampere架構的變化說起

2020-12-16 電腦報

《賽博朋克2077》終於如約上市了,不知道各位玩家有沒有搶到心儀的RTX 30顯卡呢?之所以NVIDIA這一代顯卡如此受歡迎,一方面是因為性能提升幅度非常驚人、特別是在光追遊戲大作中的表現更加成熟;另一方面就是價格大幅下調,"半價買上代旗艦"這樣的性價比,誰不愛呢?那麼,RTX 30系列顯卡為何能做到如此大的提升?這首先就要從NVIDIA全新打造的Ampere架構相對Turing架構的進化說起。

GPU進化史上的奇蹟!NVIDIA Ampere架構帶來多項革命性升級

★安培VS圖靈:SM單元大幅改進,效率巨幅進化!

要想提升GPU性能,只有提升頻率和改進架構提升效率兩個途徑,不過單純提升頻率必然會帶來功耗的激增,因此NVIDIA在將製造工藝提升到8nm的前提下,也對新一代的Ampere架構進行了大刀闊斧的改進。

從圖中可以看到,相對於第一代RTX顯卡使用的Turing架構來講,NVIDIA Ampere架構中全新設計的SM模塊提供了兩倍的FP32單元,每個時鐘周期可以執行一次128bit FMA浮點運算操作,同時,增加的FP32單元在需要的時候也可以轉為INT32單元,應對程序需求的方式更加靈活,效率也變得更高,這也是NVIDIA Ampere架構比Turing架構更加先進的革命性設計之一。

此外,NVIDIA Ampere架構相比Turing架構還增加了一倍的L1緩存帶寬和一倍的緩存分區大小,NVIDIA Ampere的第二代RT Core和第三代Tensor Core還分別提供了兩倍於Turing架構的三角形相交計算能力和稀疏矩陣計算能力。總而言之,NVIDIA Ampere架構相比Turing架構大幅改進了SM架構,從而帶來了近乎翻倍的效率提升,這也是RTX 30系列顯卡相比第一代RTX顯卡的先天優越性所在。

★安培VS圖靈:RT Core與Tensor Core全面升級,量變帶來質變!

NVIDIA Ampere架構的SM單元、RT Core和Tensor Core都進行了升級,RT Core升級到了第二代,Tensor Core升級到了第三代

NVIDIA Ampere架構中的第二代RT Core可以同時高效實現光追和動態模糊計算

NVIDIA Ampere第三代的Tensor Core相比Turing架構的第二代Tensor Core性能高出一倍以上

前面我們也提到,從Ampere到 Turing,RT Core從第一代升級到了第二代,Tensor Core也從第二代升級到了第三代,除了前面提到的純性能提升外,更高的性能也帶來的更多的應用可能。NVIDIA Ampere架構的第二代RT Core由於架構的改進,現在可以同時實現高效的光追與動態模糊特效的計算,這就是一個量變到質變的表現,切切實實為玩家和設計師用戶帶來了新的體驗和可能,這也是上代Turing架構RT Core無法做到的。NVIDIA Ampere架構的第三代Tensor Core部分,雖說每個SM單元的Tensor Core減少一半,但實際上的性能不降反升,從數據來看,效率相比第二代Tensor Core提升了一倍以上。第三代Tensor Core的性能大幅提升反映在遊戲中就是DLSS效率突飛猛進,RTX 3090搭配最強悍的Ultra Performance DLSS模式甚至首次實現了8K解析度下流暢運行光追遊戲大作,這也是從Turing到Ampere為玩家體驗帶來的質的改變。

★安培VS圖靈:每瓦性能幾乎翻倍,能效比革命性進步!

NVIDIA Ampere架構的每瓦性能約為Turing架構的1.9倍

從圖中可以看到,Ampere架構的核心布局採用了新的設計,晶片中間區域是圖形芯軌,周圍區域則是存儲系統芯軌,兩塊區域分離之後可以獲得更高的晶片利用率與執行效率。因此,在每瓦性能方面,Ampere架構相對圖靈架構幾乎翻倍,此外,先進的8nm工藝也功不可沒。溫度和噪音方面,NVIDIA Ampere架構的RTX 30顯卡在30dbA工作噪音下的溫度為78℃,Turing架構的RTX 20顯卡在32dbA的噪音下溫度為81℃,而前者的遊戲幀率幾乎是後者的兩倍,升級幅度非常明顯。

★安培VS圖靈:新一代GDDR6X顯存加持,高解析度遊戲性能無可比擬

RTX 3090/RTX 3080首次採用GDDR6X顯存,速率為GDDR6的兩倍

NVIDIA Ampere架構的RTX 3090/3080顯卡還有一個巨大的升級值得重點介紹,那就是使用了NVIDIA與美光合作開發的GDDR6X顯存。由於GDDR6X顯存採用了PAM4信號編碼,也就是每個周期利用4個電平信號進行數據傳輸,效率相比GDDR6的兩個電平信號大幅增加,從而帶來了更高的顯存數據帶寬。這一點也是Turing架構的RTX 20顯卡所不具備的。

★安培VS圖靈:從性能到接口,首次全面滿足8K輸出需求

RTX 30系列顯卡提供HDMI 2.1接口,可單數據線輸出8K/60Hz HDR視頻信號,同時還提供了對AV1的硬體解碼加速,支持8K/60fps視頻實時解碼

視頻輸出方面,採用NVIDIA Ampere架構的RTX 30系列顯卡首次提供了對HDMI 2.1接口的支持,可以實現單數據線8K/60Hz或者4K/120Hz的HDR畫面輸出。此外,RTX 30系列也是全球首批支持AV1硬體解碼的顯卡,可以流暢解碼8K/60fps視頻,為視頻剪輯師用戶提供了強大生產力支持。

其實,除了製造工藝、架構和硬體規格方面的大幅度升級,NVIDIA Ampere架構的RTX 30顯卡還帶來了大量實用的黑科技。

RTX 30顯卡又增加了一大把實用黑科技

★NVIDIA REFLEX低延遲技術

與RTX 30顯卡一同登場的NVIDIA REFLEX低延遲技術可以提供更低的遊戲畫面與操作延遲,提升對戰中的勝率

啟用REFLEX技術的情況下,熱門電競遊戲的系統延遲時間都得到了明顯降低

NVIDIA REFLEX低延遲技術通過將渲染隊列的延遲時間降低為0、大幅降低處理器負擔、提升GPU頻率來降低整個系統的延遲,讓玩家在電競遊戲中的操作更加快捷、順滑。當然,要達到最佳效果,也需要RTX 30顯卡的Shader單元、RT Core、TENSOR Core同時加速來提供強大的運算能力。從統計數據來看,RTX 3080在開啟硬體光追+DLSS+Async的情況下,響應速度是RTX 2080的1.9倍!此外,REFLEX低延遲技術還需要支持高刷新率的G-Sync電競顯示器來配合才能達到最佳效果。例如360Hz刷新率的G-Sync電競顯示器,而且這些顯示器中還首次集成了可監測延遲的REFLEX硬體模塊。同時,操控外設方面也需要支持REFLEX技術的電競滑鼠配合實現最好的低延遲操控體驗,目前華碩、羅技、賽睿、雷蛇都有支持該技術的滑鼠產品。

★RTX IO快速載入技術

RTX IO技術可直接將壓縮數據讀取到顯存,CPU佔用率縮減為1/20、載入速度相較HDD提升百倍

針對大型遊戲載入特別佔處理器資源、效率較低的問題,NVIDIA推出了RTX IO技術,通過這項技術,就能讓GPU來處理數據解壓,從而大幅度降低CPU的佔用率。從圖上可以看到,在PCIe 4.0固態硬碟上達到同樣讀取速度的時候,如果採用傳統的方式,會佔用24個CPU核心,而採用RTX IO技術後,只需要佔用0.5個CPU核心,這在遊戲中就可以體現為載入地圖數據和模型文件的時候更加流暢,避免卡頓。當然,這項技術不止可以用在遊戲中,也可以用在需要載入大量素材文件的3D渲染工作中,獲得更流暢的操作體驗。要享受這項技術,需要遊戲或應用軟體支持微軟的DirectStorage API,當然,也需要RTX 30系列顯卡。

★基於RTX 30系列顯卡的NVIDIA STUDIO

RTX 30系列顯卡的高超算力為內容創作提供了強大的動力

RTX 3090高達24GB的顯存可以輕鬆應對高細節幾何建模、多應用3D渲染動畫、8K RED RAW的AI剪輯等高運算量專業應用

在達文西視頻剪輯中,RTX 3080的效率甚至超過了RTX 2080 SUPER的兩倍

NVIDIA的NVIDIA STUDIO為設計師用戶提供了效率極高的生產力解決方案,而搭載RTX 30系列顯卡的NVIDIA STUDIO在性能和效率方面的表現更是空前強大。從官方提供的數據來看,RTX 3080在各種主流渲染器中的加速性能都遠超RTX 2080 SUPER,在LUXMARK和V-Ray中甚至超過了RTX 2080 SUPER的兩倍。視頻剪輯部分,RTX 3080也表現出了驚人的性能,DaVinci測試中的成績遠遠領先RTX 2080 SUPER,甚至有些項目幾乎達到了RTX 2080 SUPER的2.5倍性能。

此外,我們知道很多複雜3D建模與高碼率8K視頻剪輯是非常吃顯存的,而RTX 3090具備的24GB超大顯存無疑是針對這些應用而來,為設計師用戶提供更高效的解決方案。

★NVIDIA OMNIVERSE MACHINIMA

NVIDIA OMNIVERSE MACHINIMA可以讓用戶使用遊戲素材打造電影級視頻

NVIDIA OMNIVERSE MACHINIMA是基於RTX 30系列GPU強大計算能力打造的遊戲敘事APP,能夠讓玩家利用現有的遊戲素材,通過RTX 30顯卡AI技術製作出電影級的視頻。NVIDIA OMNIVERSE MACHINIMA可以從支持該技術的遊戲中獲取素材、工具,然後通過賦予材質、Audio2Face(聲音轉表情)、增加物理效果、AI採集動作,最後使用RTX光線追蹤渲染從而製造出堪比電影畫質的視頻。

★NVIDIA BRODCAST

得益於RTX 30系列顯卡強大的視頻加速和AI計算能力,玩家可以輕鬆打造家庭工作室

NVIDIA BROADCAST工具可以為玩家提供強大的直播應用解決方案,它主要包括了音頻降噪(降低錄音的環境噪音)、虛擬背景(通過AI摳出人像,並提供各種直播時需要的虛擬背景)、攝像頭自動構圖(可以保證改變動態視頻圖像比例時,自動將目標位於視覺中央)等實用功能。從圖上可以看到,麥克風、音箱(或耳機)、攝像頭等設備連接到電腦後,通過NVIDIA BROADCAST工具可以被AI技術強化形成虛擬設備,從而獲得各種強大的功能。雖說只要是RTX顯卡都可以使用NVIDIA BROADCAST,但要達到最佳效果和流暢度,還是得搭配使用NVIDIA Ampere架構的RTX 30系列顯卡。

綜上所述,NVIDIA Ampere架構為RTX 30顯卡帶來了超強的性能與極高的效率,為用戶提供了空前強大的遊戲與生產力工具解決方案,確實是當下最值得升級的顯卡產品。那麼,玩家在選擇RTX 30系列顯卡的時候,有沒有一些值得優先推薦的型號呢?我們不妨來看看NVIDIA核心合作廠商技嘉旗下的RTX 30系列顯卡產品。

技嘉RTX 30顯卡軍團全面出擊,滿足不同玩家升級需求

作為NVIDIA主力合作夥伴,技嘉旗下全線RTX 30顯卡早已上市銷售,下面就為大家梳理一下技嘉RTX 30系列顯卡大家族。

旗艦級:AORUS系列

技嘉AORUS系列的RTX 30顯卡面向頂級發燒玩家,採用了配備3風扇正逆轉的零死角散熱系統,在顯卡頂部還提供了可自定義內容的液晶屏,性能、散熱與個性化都做到了極致,堪稱豪華非公版RTX 30顯卡中的代表作。AORUS RTX 30系列顯卡根據後綴名區分定位(目前包含了從RTX 3090到RTX 3070的型號),例如AORUS GeForce RTX 3090 MASTER 24G超級雕、AORUS GeForce RTX 3090 XTREME 24G大雕,其中XTREME大雕系列定位就高於MASTER超級雕系列,堪稱終極旗艦。

對於喜歡水冷的玩家,也可以選擇AORUS GeForce RTX 3080 XTREME WATERFORCE 10G水雕(一體水冷)或AORUS GeForce RTX 3080 XTREME WATERFORCE WB 10G水雕(分體水冷),也是非常頂級的選擇。總之,追求極致性能和極致個性化的玩家,技嘉AORUS RTX 30顯卡值得優先考慮。

性能級:魔鷹系列

技嘉RTX 30顯卡中,後綴名中帶有GAMING OC的屬於魔鷹系列,主要面向追求實用的性能級用戶。魔鷹系列RTX 30顯卡也採用了3風扇正反逆轉散熱設計,支持炫彩魔光燈效技術,用料與做工也達到了同級產品的領先水平,性能方面也明顯超越公版。魔鷹系列覆蓋了從RTX 3090到RTX 3060 Ti所有型號,例如GeForce RTX 3060 Ti GAMING OC PRO 8G魔鷹,就是3000元級RTX 30顯卡中的爆款甜品,非常適合主流玩家選擇。

專業級:雪鷹系列

針對設計師用戶,技嘉則推出了VISION OC雪鷹系列RTX 30顯卡,例如GeForce RTX 3080 VISION OC 10G雪鷹,採用了銀白配色、金屬拉絲質感顯卡風罩,配合炫彩魔光燈效更符合設計師的審美品味。雪鷹系列包含了RTX 3090、RTX 3080和RTX 3070的型號,可以滿足不同預算的設計師用戶需求。

超值級:獵鷹系列

針對追求超高性價比的玩家,技嘉也貼心地推出了Eagle與Eagle OC獵鷹系列RTX 30顯卡,覆蓋從RTX 3090到RTX 3070的型號,同時定價相當香!以GeForce RTX 3080 EAGLE 10G為例,它的售價僅為5499元,也就是NVIDIA的最低限價,其他獵鷹系列的售價也基本上都是NVIDIA最低限價,因此性價比非常突出,非常適合追求極致性價比的玩家選擇。

總結:升級採用NVIDIA Ampere架構的RTX 30顯卡,暢快遊戲、高效工作!

NVIDIA Ampere架構為RTX 30系列顯卡帶來了第二代RT Core、第三代Tensor Core以及更靈活高效的CUDA單元結構,不管是遊戲性能還是生產力性能都相對第二代同級型號有著巨大的提升,而價格卻大幅下調,性價比高到驚人,引發了新一輪的升級狂潮。

而且,經過NVIDIA的不懈努力,目前RTX 30系列顯卡的供貨也逐漸走向平穩,主流的RTX 3070與RTX 3060Ti也相對更容易買到了。這也是入手RTX 30顯卡搶先體驗《賽博朋克2077》這款裡程碑級的光追遊戲大作的最佳機會喲!

相關焦點

  • RTX 30顯卡為何性能暴增?這要從NVIDIA Ampere架構的變化說起
    《賽博朋克2077》終於如約上市了,不知道各位玩家有沒有搶到心儀的RTX 30顯卡呢?之所以NVIDIA這一代顯卡如此受歡迎,一方面是因為性能提升幅度非常驚人、特別是在光追遊戲大作中的表現更加成熟;另一方面就是價格大幅下調,"半價買上代旗艦"這樣的性價比,誰不愛呢?那麼,RTX 30系列顯卡為何能做到如此大的提升?
  • 魯大師PC顯卡性能排行:NVIDIA rtx 2080奪冠!
    測試數據來源於魯大師數據中心:1、2018年6月1日-9月30日進行性能評測數據;2、為避免伺服器數據作弊以及過於小眾的測試樣本,低於5000個樣本基數的產品均不進入消費級榜單。本次排行榜去除了所有的核心顯卡,核顯顯卡與CPU息息相關,與市場實際的顯卡購買行為關聯並不足夠。獨立顯卡的榜單表現更為準確。
  • 如何做到性能翻倍 NVIDIA Ampere架構解析_影馳 GeForce RTX 3080...
    持續了一個月的「顯卡發布季」已經告一段落,截止目前NVIDIA發布了GeForce RTX 3060 Ti/3070/3080/3090共4個型號的顯卡,相比上一代顯卡,RTX 30系顯卡再次做到了性能翻倍的神話。
  • NVIDIA CES特別直播:30系筆記本&桌面級RTX 3060登場
    GeForce RTX 30系列筆記本電腦將於本月底發布NVIDIA宣布推出70多款搭載GeForce RTX 30系列筆記本電腦GPU的機型,包括NVIDIA Ampere架構RTX 3080、3070和3060。售價999美元起的新一代筆記本電腦有著高達2倍的性能提升,並為輕薄筆記本電腦引入第三代Max-Q技術。
  • 如何做到性能翻倍 NVIDIA Ampere架構解析
    持續了一個月的「顯卡發布季」已經告一段落,截止目前NVIDIA發布了GeForce RTX 3060 Ti/3070/3080/3090共4個型號的顯卡,相比上一代顯卡,RTX 30系顯卡再次做到了性能翻倍的神話。
  • 索泰發布GeForce RTX 30顯卡 搭載最新NVIDIA Ampere架構
    在英偉達發布 RTX 30 系列顯卡之後,索泰也同步發布了 PGF 玩家力量至尊、天啟和 X-GAMING 三大系列顯卡,共 9 款非公版 GeForce RTX 30 顯卡產品,9 在外觀、散熱、用料上各不相同。
  • 性能暴增50%!NVIDIA全新顯卡架構Volta解析
    如今Pascal還未顯出頹勢,今天凌晨的GTC 2017主題演講上,NVIDIA CEO黃仁勳發布了Volta架構顯卡,新一輪升級又要來了。MI25顯卡,儘管還沒上市,但AMD早前公布過這款顯卡的一些信息,比如帶寬、浮點性能,不過Vega核心的電晶體、核心面積等關鍵參數還是個謎。
  • 技嘉推出新一代GeForce RTX 30系列顯卡!導入NVIDIA Ampere架構顯示晶片
    2020年9月,技嘉科技與NVIDIA一同發布最新一代採用NVIDIA Ampere架構的GeForce RTX 30系列GPU,技嘉首先推出Geforce RTX 3090 GAMING OC 24G, Geforce RTX 3090 EAGLE OC 24G, Geforce RTX 3080 GAMING OC 10G, Geforce RTX 3080 EAGLE OC 10G等4款顯卡
  • 雙倍的性能,雙倍的快樂:英偉達RTX 30系顯卡架構解析
    目前英偉達舉辦了關於30系安培顯卡的技術講解會,詳細地介紹了新一代的安培架構,也介紹了在安培顯卡上所採用的全新的圖形特性。而在本文中我們也將淺顯地介紹安培架構,此外也將為大家帶來英偉達在30系顯卡上所採用的眾多黑科技。
  • 雙倍的性能,雙倍的快樂:英偉達RTX 30系顯卡架構解析
    架構的革新:CUDA數量大幅提升對於新一代顯卡來說,架構的改進能夠極大地提升顯卡的性能,而光線追蹤遊戲的加入又讓英偉達的顯卡在架構上有著革命性的變化,這種變化在20系顯卡中就已經初顯端倪,英偉達在20系顯卡中除了傳統的FP32計算單元之外也額外加入了RT計算單元以及Tensor Core計算單元
  • 性能、功能的爆炸式翻倍增長——GeForce RTX 30系Ampere架構GPU...
    NVIDIA宣稱全新的顯卡帶來了更多的高級功能、更強大的性能和更超值的價格。由於新的RTX 30系列整體表現超出玩家預期,並且定價相對更為合理,很快就引發了市場聚焦式的關注。為了更清楚地向大家介紹全新的RTX 30系列顯卡,本文將從多個方面、多個角度為大家帶來針對Ampere核心的架構、產品及技術上的深入分析和介紹。
  • NVIDIA安培架構RTX 30系顯卡性能曝光:提升31%超給力
    電腦硬體更新頻率之快令人驚嘆,很多網友感嘆,我連光追特效都還沒有體驗過,NVIDIA下一代安培架構RTX 30系顯卡的性能跑分已經曝光了,據說提升高達31%,真的是非常給力,看來又可以再等等了!網傳NVIDIA下一代安培設計方案Ampere(安培)GPU已經公布,但讓遊戲粉絲們魂牽夢縈的RTX顯卡還披著神秘面紗。據悉NVIDIA目前正在對RTX 30系列高端型號的設計進行評估,一款顯卡的誕生,仍然要經歷非常多的複雜步驟,至少也得三個月。
  • NVIDIA RTX 30系列架構詳解:8nm安培GPU的兩倍性能從何而來?
    在RTX 30系列顯卡發布之後,玩家的不滿似乎釋然了,相比當前的圖靈顯卡,安培架構的RTX 3090/3080/3070顯卡一下子變得真香了,因為它們性能翻倍不說,國內價格反而下降了。
  • 英偉達 NVIDIA 顯卡,架構和對應型號解析
    這裡只講英偉達桌面型顯卡 ,筆記型顯卡和品牌臺式機OEM型號就不講了。桌面型顯卡,就是臺式機電腦用的。筆記型顯卡,就是筆記本電腦用的。英偉達桌面型顯卡的架構,是以科學家的名字來命名的。當顯卡的GPU晶片不變,僅僅是改個名字,就冒充新型號,然後被當成新產品來重新售賣。顯卡的數據和性能一模一樣,或者即使有微小變化,也完全可以忽略不計,這樣的顯卡就被叫做馬甲卡。上面我用「/」的,完全就是同一個顯卡!完全沒有任何改變!其實嚴格來說,當GPU晶片不變,僅僅是通過增加少量流處理器,或者對顯存進行超頻,來達到提高性能,這也算是馬甲卡。
  • Nvidia RTX 3080顯卡又要沒了?這可能得看AMD是否給力
    最近關於2020年Nvidia新顯卡的信息頻出,雖然各家媒體眾說紛紜,但是有一點可以確定,那就是基於7nm工藝安培架構的RTX 3080顯卡性能非常爆炸,如果爆料沒錯的話RTX 3080顯卡的CUDA核心會從現在5000左右暴增到8000+,由此帶來的性能暴漲自然是不必多說。
  • NVIDIA Ampere架構解析:相比上一代做了哪些提升
    NVIDIA發布了GeForce RTX 3060 Ti/3070/3080/3090共4個型號的顯卡,相比上一代顯卡,RTX 30系顯卡再次做到了性能翻倍的神話。 除了性能上的提升,新的NVIDIA Ampere架構還帶來了第二代RT Core和第三代Tensor,雖然RTX 30系顯卡擁有諸多提升,但價格卻與上一代顯卡相同。 在9月2日發布會當天,雖然過程僅有短短的40分鐘,卻震驚了全世界的用戶。
  • 性能、功能的爆炸式翻倍增長——GeForce RTX 30系Ampere架構GPU核心深入解讀
    新顯卡全部採用了三星8nm製造工藝和新的Ampere架構,創始人版本則擁有全新設計的外觀和散熱系統。NVIDIA宣稱全新的顯卡帶來了更多的高級功能、更強大的性能和更超值的價格。由於新的RTX 30系列整體表現超出玩家預期,並且定價相對更為合理,很快就引發了市場聚焦式的關注。
  • 為何RTX 30顯卡缺貨至今無解 NVIDIA高層終於說了實話
    自NVIDA新一代RTX 30系列發布至今以來,一直伴隨著缺貨的問題讓很多玩家和用戶感到頭疼。NVIDIA公司CFO Colette Kress日前參加了瑞銀TMT全球技術大會,在採訪中回應了缺貨的問題。他表示NVIDIA面臨著壓倒性的高需求,因此供應鏈遇到了挑戰。
  • 為何成為NVIDIA新寵 揭曉Ampere架構性能提升的秘密
    長久以來,NVIDIA在專業級別GPU領域不斷進行創新,此前已經推出過Kepler、Maxwel、Pascal以及Turing等架構,此次,最新的Ampere架構在圖形處理、AI、光線追蹤等性能上又有進一步的提升。
  • RTX 30系列顯卡發布:性能成倍提升,20系用戶已哭暈
    就在今天凌晨,英偉達終於召開了發布會,發布了全新一代RTX 30系顯卡,搭載全新的Ampere(安培)架構GPU。跳過不重要的部分,直接進入主題,大家期待已久的,RTX30系列顯卡,新一代GPU,擁有280億個電晶體,基於三星的8nm,英偉達定製工藝,三大處理核心均為圖靈GPU的兩倍速率,顯存則採用鎂光的G6X;老黃表示,不管是性能還是能效,Ampere(安培)都是過去圖靈的兩倍……兩倍?