RTX 30顯卡為何性能暴增?這要從NVIDIA Ampere架構的變化說起

2020-12-16 電腦報

《賽博朋克2077》終於如約上市了，不知道各位玩家有沒有搶到心儀的RTX 30顯卡呢？之所以NVIDIA這一代顯卡如此受歡迎，一方面是因為性能提升幅度非常驚人、特別是在光追遊戲大作中的表現更加成熟；另一方面就是價格大幅下調，"半價買上代旗艦"這樣的性價比，誰不愛呢？那麼，RTX 30系列顯卡為何能做到如此大的提升？這首先就要從NVIDIA全新打造的Ampere架構相對Turing架構的進化說起。

GPU進化史上的奇蹟！NVIDIA Ampere架構帶來多項革命性升級

★安培VS圖靈：SM單元大幅改進，效率巨幅進化！

要想提升GPU性能，只有提升頻率和改進架構提升效率兩個途徑，不過單純提升頻率必然會帶來功耗的激增，因此NVIDIA在將製造工藝提升到8nm的前提下，也對新一代的Ampere架構進行了大刀闊斧的改進。

從圖中可以看到，相對於第一代RTX顯卡使用的Turing架構來講，NVIDIA Ampere架構中全新設計的SM模塊提供了兩倍的FP32單元，每個時鐘周期可以執行一次128bit FMA浮點運算操作，同時，增加的FP32單元在需要的時候也可以轉為INT32單元，應對程序需求的方式更加靈活，效率也變得更高，這也是NVIDIA Ampere架構比Turing架構更加先進的革命性設計之一。

此外，NVIDIA Ampere架構相比Turing架構還增加了一倍的L1緩存帶寬和一倍的緩存分區大小，NVIDIA Ampere的第二代RT Core和第三代Tensor Core還分別提供了兩倍於Turing架構的三角形相交計算能力和稀疏矩陣計算能力。總而言之，NVIDIA Ampere架構相比Turing架構大幅改進了SM架構，從而帶來了近乎翻倍的效率提升，這也是RTX 30系列顯卡相比第一代RTX顯卡的先天優越性所在。

★安培VS圖靈：RT Core與Tensor Core全面升級，量變帶來質變！

NVIDIA Ampere架構的SM單元、RT Core和Tensor Core都進行了升級，RT Core升級到了第二代，Tensor Core升級到了第三代

NVIDIA Ampere架構中的第二代RT Core可以同時高效實現光追和動態模糊計算

NVIDIA Ampere第三代的Tensor Core相比Turing架構的第二代Tensor Core性能高出一倍以上

前面我們也提到，從Ampere到 Turing，RT Core從第一代升級到了第二代，Tensor Core也從第二代升級到了第三代，除了前面提到的純性能提升外，更高的性能也帶來的更多的應用可能。NVIDIA Ampere架構的第二代RT Core由於架構的改進，現在可以同時實現高效的光追與動態模糊特效的計算，這就是一個量變到質變的表現，切切實實為玩家和設計師用戶帶來了新的體驗和可能，這也是上代Turing架構RT Core無法做到的。NVIDIA Ampere架構的第三代Tensor Core部分，雖說每個SM單元的Tensor Core減少一半，但實際上的性能不降反升，從數據來看，效率相比第二代Tensor Core提升了一倍以上。第三代Tensor Core的性能大幅提升反映在遊戲中就是DLSS效率突飛猛進，RTX 3090搭配最強悍的Ultra Performance DLSS模式甚至首次實現了8K解析度下流暢運行光追遊戲大作，這也是從Turing到Ampere為玩家體驗帶來的質的改變。

★安培VS圖靈：每瓦性能幾乎翻倍，能效比革命性進步！

NVIDIA Ampere架構的每瓦性能約為Turing架構的1.9倍

從圖中可以看到，Ampere架構的核心布局採用了新的設計，晶片中間區域是圖形芯軌，周圍區域則是存儲系統芯軌，兩塊區域分離之後可以獲得更高的晶片利用率與執行效率。因此，在每瓦性能方面，Ampere架構相對圖靈架構幾乎翻倍，此外，先進的8nm工藝也功不可沒。溫度和噪音方面，NVIDIA Ampere架構的RTX 30顯卡在30dbA工作噪音下的溫度為78℃，Turing架構的RTX 20顯卡在32dbA的噪音下溫度為81℃，而前者的遊戲幀率幾乎是後者的兩倍，升級幅度非常明顯。

★安培VS圖靈：新一代GDDR6X顯存加持，高解析度遊戲性能無可比擬

RTX 3090/RTX 3080首次採用GDDR6X顯存，速率為GDDR6的兩倍

NVIDIA Ampere架構的RTX 3090/3080顯卡還有一個巨大的升級值得重點介紹，那就是使用了NVIDIA與美光合作開發的GDDR6X顯存。由於GDDR6X顯存採用了PAM4信號編碼，也就是每個周期利用4個電平信號進行數據傳輸，效率相比GDDR6的兩個電平信號大幅增加，從而帶來了更高的顯存數據帶寬。這一點也是Turing架構的RTX 20顯卡所不具備的。

★安培VS圖靈：從性能到接口，首次全面滿足8K輸出需求

RTX 30系列顯卡提供HDMI 2.1接口，可單數據線輸出8K/60Hz HDR視頻信號，同時還提供了對AV1的硬體解碼加速，支持8K/60fps視頻實時解碼

視頻輸出方面，採用NVIDIA Ampere架構的RTX 30系列顯卡首次提供了對HDMI 2.1接口的支持，可以實現單數據線8K/60Hz或者4K/120Hz的HDR畫面輸出。此外，RTX 30系列也是全球首批支持AV1硬體解碼的顯卡，可以流暢解碼8K/60fps視頻，為視頻剪輯師用戶提供了強大生產力支持。

其實，除了製造工藝、架構和硬體規格方面的大幅度升級，NVIDIA Ampere架構的RTX 30顯卡還帶來了大量實用的黑科技。

RTX 30顯卡又增加了一大把實用黑科技

★NVIDIA REFLEX低延遲技術

與RTX 30顯卡一同登場的NVIDIA REFLEX低延遲技術可以提供更低的遊戲畫面與操作延遲，提升對戰中的勝率

啟用REFLEX技術的情況下，熱門電競遊戲的系統延遲時間都得到了明顯降低

NVIDIA REFLEX低延遲技術通過將渲染隊列的延遲時間降低為0、大幅降低處理器負擔、提升GPU頻率來降低整個系統的延遲，讓玩家在電競遊戲中的操作更加快捷、順滑。當然，要達到最佳效果，也需要RTX 30顯卡的Shader單元、RT Core、TENSOR Core同時加速來提供強大的運算能力。從統計數據來看，RTX 3080在開啟硬體光追+DLSS+Async的情況下，響應速度是RTX 2080的1.9倍！此外，REFLEX低延遲技術還需要支持高刷新率的G-Sync電競顯示器來配合才能達到最佳效果。例如360Hz刷新率的G-Sync電競顯示器，而且這些顯示器中還首次集成了可監測延遲的REFLEX硬體模塊。同時，操控外設方面也需要支持REFLEX技術的電競滑鼠配合實現最好的低延遲操控體驗，目前華碩、羅技、賽睿、雷蛇都有支持該技術的滑鼠產品。

★RTX IO快速載入技術

RTX IO技術可直接將壓縮數據讀取到顯存，CPU佔用率縮減為1/20、載入速度相較HDD提升百倍

針對大型遊戲載入特別佔處理器資源、效率較低的問題，NVIDIA推出了RTX IO技術，通過這項技術，就能讓GPU來處理數據解壓，從而大幅度降低CPU的佔用率。從圖上可以看到，在PCIe 4.0固態硬碟上達到同樣讀取速度的時候，如果採用傳統的方式，會佔用24個CPU核心，而採用RTX IO技術後，只需要佔用0.5個CPU核心，這在遊戲中就可以體現為載入地圖數據和模型文件的時候更加流暢，避免卡頓。當然，這項技術不止可以用在遊戲中，也可以用在需要載入大量素材文件的3D渲染工作中，獲得更流暢的操作體驗。要享受這項技術，需要遊戲或應用軟體支持微軟的DirectStorage API，當然，也需要RTX 30系列顯卡。

★基於RTX 30系列顯卡的NVIDIA STUDIO

RTX 30系列顯卡的高超算力為內容創作提供了強大的動力

RTX 3090高達24GB的顯存可以輕鬆應對高細節幾何建模、多應用3D渲染動畫、8K RED RAW的AI剪輯等高運算量專業應用

在達文西視頻剪輯中，RTX 3080的效率甚至超過了RTX 2080 SUPER的兩倍

NVIDIA的NVIDIA STUDIO為設計師用戶提供了效率極高的生產力解決方案，而搭載RTX 30系列顯卡的NVIDIA STUDIO在性能和效率方面的表現更是空前強大。從官方提供的數據來看，RTX 3080在各種主流渲染器中的加速性能都遠超RTX 2080 SUPER，在LUXMARK和V-Ray中甚至超過了RTX 2080 SUPER的兩倍。視頻剪輯部分，RTX 3080也表現出了驚人的性能，DaVinci測試中的成績遠遠領先RTX 2080 SUPER，甚至有些項目幾乎達到了RTX 2080 SUPER的2.5倍性能。

此外，我們知道很多複雜3D建模與高碼率8K視頻剪輯是非常吃顯存的，而RTX 3090具備的24GB超大顯存無疑是針對這些應用而來，為設計師用戶提供更高效的解決方案。

★NVIDIA OMNIVERSE MACHINIMA

NVIDIA OMNIVERSE MACHINIMA可以讓用戶使用遊戲素材打造電影級視頻

NVIDIA OMNIVERSE MACHINIMA是基於RTX 30系列GPU強大計算能力打造的遊戲敘事APP，能夠讓玩家利用現有的遊戲素材，通過RTX 30顯卡AI技術製作出電影級的視頻。NVIDIA OMNIVERSE MACHINIMA可以從支持該技術的遊戲中獲取素材、工具，然後通過賦予材質、Audio2Face（聲音轉表情）、增加物理效果、AI採集動作，最後使用RTX光線追蹤渲染從而製造出堪比電影畫質的視頻。

★NVIDIA BRODCAST

得益於RTX 30系列顯卡強大的視頻加速和AI計算能力，玩家可以輕鬆打造家庭工作室

NVIDIA BROADCAST工具可以為玩家提供強大的直播應用解決方案，它主要包括了音頻降噪（降低錄音的環境噪音）、虛擬背景（通過AI摳出人像，並提供各種直播時需要的虛擬背景）、攝像頭自動構圖（可以保證改變動態視頻圖像比例時，自動將目標位於視覺中央）等實用功能。從圖上可以看到，麥克風、音箱（或耳機）、攝像頭等設備連接到電腦後，通過NVIDIA BROADCAST工具可以被AI技術強化形成虛擬設備，從而獲得各種強大的功能。雖說只要是RTX顯卡都可以使用NVIDIA BROADCAST，但要達到最佳效果和流暢度，還是得搭配使用NVIDIA Ampere架構的RTX 30系列顯卡。

綜上所述，NVIDIA Ampere架構為RTX 30顯卡帶來了超強的性能與極高的效率，為用戶提供了空前強大的遊戲與生產力工具解決方案，確實是當下最值得升級的顯卡產品。那麼，玩家在選擇RTX 30系列顯卡的時候，有沒有一些值得優先推薦的型號呢？我們不妨來看看NVIDIA核心合作廠商技嘉旗下的RTX 30系列顯卡產品。

技嘉RTX 30顯卡軍團全面出擊，滿足不同玩家升級需求

作為NVIDIA主力合作夥伴，技嘉旗下全線RTX 30顯卡早已上市銷售，下面就為大家梳理一下技嘉RTX 30系列顯卡大家族。

旗艦級：AORUS系列

技嘉AORUS系列的RTX 30顯卡面向頂級發燒玩家，採用了配備3風扇正逆轉的零死角散熱系統，在顯卡頂部還提供了可自定義內容的液晶屏，性能、散熱與個性化都做到了極致，堪稱豪華非公版RTX 30顯卡中的代表作。AORUS RTX 30系列顯卡根據後綴名區分定位（目前包含了從RTX 3090到RTX 3070的型號），例如AORUS GeForce RTX 3090 MASTER 24G超級雕、AORUS GeForce RTX 3090 XTREME 24G大雕，其中XTREME大雕系列定位就高於MASTER超級雕系列，堪稱終極旗艦。

對於喜歡水冷的玩家，也可以選擇AORUS GeForce RTX 3080 XTREME WATERFORCE 10G水雕（一體水冷）或AORUS GeForce RTX 3080 XTREME WATERFORCE WB 10G水雕（分體水冷），也是非常頂級的選擇。總之，追求極致性能和極致個性化的玩家，技嘉AORUS RTX 30顯卡值得優先考慮。

性能級：魔鷹系列

技嘉RTX 30顯卡中，後綴名中帶有GAMING OC的屬於魔鷹系列，主要面向追求實用的性能級用戶。魔鷹系列RTX 30顯卡也採用了3風扇正反逆轉散熱設計，支持炫彩魔光燈效技術，用料與做工也達到了同級產品的領先水平，性能方面也明顯超越公版。魔鷹系列覆蓋了從RTX 3090到RTX 3060 Ti所有型號，例如GeForce RTX 3060 Ti GAMING OC PRO 8G魔鷹，就是3000元級RTX 30顯卡中的爆款甜品，非常適合主流玩家選擇。

專業級：雪鷹系列

針對設計師用戶，技嘉則推出了VISION OC雪鷹系列RTX 30顯卡，例如GeForce RTX 3080 VISION OC 10G雪鷹，採用了銀白配色、金屬拉絲質感顯卡風罩，配合炫彩魔光燈效更符合設計師的審美品味。雪鷹系列包含了RTX 3090、RTX 3080和RTX 3070的型號，可以滿足不同預算的設計師用戶需求。

超值級：獵鷹系列

針對追求超高性價比的玩家，技嘉也貼心地推出了Eagle與Eagle OC獵鷹系列RTX 30顯卡，覆蓋從RTX 3090到RTX 3070的型號，同時定價相當香！以GeForce RTX 3080 EAGLE 10G為例，它的售價僅為5499元，也就是NVIDIA的最低限價，其他獵鷹系列的售價也基本上都是NVIDIA最低限價，因此性價比非常突出，非常適合追求極致性價比的玩家選擇。

總結：升級採用NVIDIA Ampere架構的RTX 30顯卡，暢快遊戲、高效工作！

NVIDIA Ampere架構為RTX 30系列顯卡帶來了第二代RT Core、第三代Tensor Core以及更靈活高效的CUDA單元結構，不管是遊戲性能還是生產力性能都相對第二代同級型號有著巨大的提升，而價格卻大幅下調，性價比高到驚人，引發了新一輪的升級狂潮。

而且，經過NVIDIA的不懈努力，目前RTX 30系列顯卡的供貨也逐漸走向平穩，主流的RTX 3070與RTX 3060Ti也相對更容易買到了。這也是入手RTX 30顯卡搶先體驗《賽博朋克2077》這款裡程碑級的光追遊戲大作的最佳機會喲！

RTX 30顯卡為何性能暴增?這要從NVIDIA Ampere架構的變化說起

相關焦點

RTX 30顯卡為何性能暴增？這要從NVIDIA Ampere架構的變化說起

魯大師PC顯卡性能排行:NVIDIA rtx 2080奪冠!

如何做到性能翻倍 NVIDIA Ampere架構解析_影馳 GeForce RTX 3080...

NVIDIA CES特別直播:30系筆記本&桌面級RTX 3060登場

如何做到性能翻倍 NVIDIA Ampere架構解析

索泰發布GeForce RTX 30顯卡搭載最新NVIDIA Ampere架構

性能暴增50%!NVIDIA全新顯卡架構Volta解析

技嘉推出新一代GeForce RTX 30系列顯卡！導入NVIDIA Ampere架構顯示晶片

雙倍的性能，雙倍的快樂：英偉達RTX 30系顯卡架構解析

雙倍的性能,雙倍的快樂:英偉達RTX 30系顯卡架構解析

性能、功能的爆炸式翻倍增長——GeForce RTX 30系Ampere架構GPU...

NVIDIA安培架構RTX 30系顯卡性能曝光:提升31%超給力

NVIDIA RTX 30系列架構詳解:8nm安培GPU的兩倍性能從何而來?

英偉達 NVIDIA 顯卡,架構和對應型號解析

Nvidia RTX 3080顯卡又要沒了?這可能得看AMD是否給力

NVIDIA Ampere架構解析:相比上一代做了哪些提升

性能、功能的爆炸式翻倍增長——GeForce RTX 30系Ampere架構GPU核心深入解讀

為何RTX 30顯卡缺貨至今無解 NVIDIA高層終於說了實話

為何成為NVIDIA新寵揭曉Ampere架構性能提升的秘密

RTX 30系列顯卡發布:性能成倍提升,20系用戶已哭暈

RTX 30顯卡為何性能暴增?這要從NVIDIA Ampere架構的變化說起

相關焦點

RTX 30顯卡為何性能暴增？這要從NVIDIA Ampere架構的變化說起

魯大師PC顯卡性能排行:NVIDIA rtx 2080奪冠!

如何做到性能翻倍 NVIDIA Ampere架構解析_影馳 GeForce RTX 3080...

NVIDIA CES特別直播:30系筆記本&桌面級RTX 3060登場

如何做到性能翻倍 NVIDIA Ampere架構解析

索泰發布GeForce RTX 30顯卡 搭載最新NVIDIA Ampere架構

性能暴增50%!NVIDIA全新顯卡架構Volta解析

技嘉推出新一代GeForce RTX 30系列顯卡！導入NVIDIA Ampere架構顯示晶片

雙倍的性能，雙倍的快樂：英偉達RTX 30系顯卡架構解析

雙倍的性能,雙倍的快樂:英偉達RTX 30系顯卡架構解析

性能、功能的爆炸式翻倍增長——GeForce RTX 30系Ampere架構GPU...

NVIDIA安培架構RTX 30系顯卡性能曝光:提升31%超給力

NVIDIA RTX 30系列架構詳解:8nm安培GPU的兩倍性能從何而來?

英偉達 NVIDIA 顯卡,架構和對應型號解析

Nvidia RTX 3080顯卡又要沒了?這可能得看AMD是否給力

NVIDIA Ampere架構解析:相比上一代做了哪些提升

性能、功能的爆炸式翻倍增長——GeForce RTX 30系Ampere架構GPU核心深入解讀

為何RTX 30顯卡缺貨至今無解 NVIDIA高層終於說了實話

為何成為NVIDIA新寵 揭曉Ampere架構性能提升的秘密

RTX 30系列顯卡發布:性能成倍提升,20系用戶已哭暈

索泰發布GeForce RTX 30顯卡搭載最新NVIDIA Ampere架構

為何成為NVIDIA新寵揭曉Ampere架構性能提升的秘密