超能課堂(245):GDDR6X顯存的超高帶寬背後應用了什麼新技術?

2020-12-15 超能網

這幾天PC業界最火爆的新聞肯定就是NVIDIA發布新一代RTX 30系列顯卡，沒有之一。新的顯卡自然是使用了搭配有一系列新技術的新核心，比如說第二代RT Core啊，第三代Tensor Core啊這些。而對於RTX 3080和RTX 3090這兩張高端顯卡，它們GPU核心的外部，作為倉庫的顯存也有很大的變化，具體一點就是從GDDR6升級成了全新的GDDR6X。

想必還有很多讀者記得當年在高端Pascal顯卡上面出現的GDDR5X顯存，它是NVIDIA和美光聯手合作研發出來的顯存種類，隨後被提交給了JEDEC進行標準化。不過可惜的是，除了美光之外，沒有其他內存廠採用該標準生產顯存產品，而顯卡市場上，除了高端的幾張Pascal顯卡外，也沒有別的顯卡採用GDDR5X顯存，就連NVIDIA自己也在之後就轉向了更高速的GDDR6顯存。

NVIDIA在2018年的Turing顯卡上面首次應用了GDDR6顯存，在當時，GDDR6顯存能夠提供比疲態盡顯的GDDR5高的多的帶寬，也讓GDDR5X黯然失色。在GDDR6顯存正值壯年的現在，NVIDIA卻再次聯手美光，在短短的兩年之後就推出了它的進階版本，那麼到底是什麼原因讓NVIDIA決心換用GDDR6X，它的背後隱藏了哪些技術，又能帶來哪些好處呢？本期超能課堂就講一講GDDR6X顯存和它背後的全新技術。

帶寬最高提升50%，突破1000GB/s大關

顯存是顯卡用來存放各種計算、渲染用素材的倉庫，GPU在執行圖形計算任務的時候，會不停地從這個倉庫裡面拿東西，而CPU也會不停地把數據傳遞過來，要GPU塞進倉庫裡面備用。那麼這個倉庫的大小，存取素材的快慢會很明顯地影響到GPU的工作效率，也就是說，顯存的大小和顯存的帶寬都會對顯卡的整體性能產生影響。

而在如今，1080p解析度早已普及，不少玩家已經開始用上1440p解析度或者是4K解析度的顯示器或電視，在更高的解析度下，遊戲的材質、紋理等原始數據的體積越來越大，在進行圖形計算時所需的數據交換帶寬越來越高，這就需要顯卡設計廠使用有更高帶寬和容量的顯存系統，這也是NVIDIA和AMD兩家一直在提升他們顯卡的顯存規格的緣由。

上一代的GDDR6顯存將數據的預取寬度從GDDR5時代的8-bit拓寬到了16-bit，這讓它的等效頻率再次倍增，能夠達到14~16Gbps左右，在顯存位寬相同的情況下，其帶寬較8Gbps的GDDR5顯存高75%~100%，進步非常巨大。而GDDR6X做到了更高的等效頻率，其範圍為19~21Gbps，也就是說，同顯存位寬的情況下，它能夠增加35%~50%的顯存帶寬，達到912GB/s~1008GB/s，正式突破了1000GB/s這個大關。

但是GDDR6X如果強行用傳統方式，也就是提升運行頻率的方式去獲取帶寬的話，會遇到非常大的困難，比如說受到工藝的制約，它的運行頻率去不到更高，即便是能夠實現更高的等效頻率，其信號的純淨度也會大打折扣，在電氣性能上無法滿足要求。

那麼該如何去推高它的等效頻率呢？NVIDIA和美光選擇從信號的調製方式上入手。

PAM4信號調製方式

原本的GDDR系顯存在傳輸數據時使用的是非常原始的二進位信號，再具體一點，該系列顯存使用的是NRZ（Non-Return-to-Zero）調製，或者叫做PAM2調製。這種信號調製方式很簡單，它用高電平代表1，低電平代表0。如果要提高它的數據傳輸速率，只要提高顯存的時鐘頻率即可。但現在由於受到製程工藝等各方面因素的限制，顯存的時鐘頻率在現階段已經很難再攀高，那麼該怎麼辦呢？廠商想到了用新的信號調製機制來提高信號傳輸的效率，他們選擇了已經有較為廣泛的PAM4。

PAM是一種用模擬信號脈衝編碼信息的信號調製方式，PAM4是其中較為簡單的一種。與NRZ這種僅有高和低兩種狀態的二進位信號不同的是，PAM4有4種不同的電平值，也就是有4種不同的狀態，而每種狀態對應著一組0和1的組合，也就是說，它的每個狀態對應了2個bit的數據量，較NRZ是翻倍的。

如果這麼說還有些模糊的話，這裡可以將PAM4信號類比成MLC快閃記憶體存放數據的方式。我們知道，MLC快閃記憶體的每個單元可以存放2-bit的數據，在電信號層面上它表現為4種不同的電平，每個電平之間有固定的電壓間隔，主控在讀取和寫入的時候都按照固定的規則將數據和電信號進行轉換。

那麼GDDR6X也是如此，根據NVIDIA公布出來的信息，GDDR6X有四種不同的電平信號，每個電平信號之間的電壓差為250mV。

在採用PAM4調製之後，顯存系統的信號純淨度有了一個很大的提升，有圖為證：

上為GDDR6，下為GDDR6X

在換用PAM4之後，如果繼續沿用原本的16n突發讀取長度，那麼每次將會讀取到32-bit的數據，為了保證兼容性，GDDR6X將Burst Length降回了GDDR5時代的8n，這樣每次的預取數據仍然為16-bit。

NVIDIA的黑魔法加持

為了更好的配合和利用GDDR6X顯存，NVIDIA還應用了一些自己的黑魔法技術，比如MTA（Max Transition Avoidance）編碼就是其中之一。

MTA編碼是NVIDIA的專利技術，它是一項用於配合PAM4信號調製方式的技術，原理是將原本全長為16-bit的突發數據分割成兩部分進行發送，以降低信號在傳輸過程中出現的誤碼、損耗等問題。

更高的能效比

不可否認的是，當代顯卡上的顯存能耗是越來越高了，一個是運行的頻率高了，另一個因素是容量大了。而GDDR6X的一大特點就是能夠提供更高的能效比。

美光提供的數據顯示，同樣的8顆顯存，等效頻率為21Gbps的GDDR6X顯存的能效比跟14Gbps的GDDR6顯存在每比特能耗上要低15%。要知道，在此同時GDDR6X還提供了多50%的顯存帶寬。

GDDR6X產品及應用

由於GDDR6X顯存是NVIDIA和美光聯手研發的，它暫時還沒有被JEDEC給標準化，所以也沒有第二家能夠生產GDDR6X顯存的內存生產商。

目前美光提供兩種GDDR6X顆粒，容量密度均為8Gb（單顆1GB），兩種顆粒的區別只有頻率，後綴為19的顆粒等效頻率為19Gbps，後綴21的顆粒等效頻率為21。很明顯，在RTX 3080上出現的就是型號為MT61K256M32JE-19的顆粒，但RTX 3090的顯存顆粒現在還不明朗。

由於GDDR6X採用了完全不同的信號調製方式，所以GPU的內存控制器需要進行重新設計才能支持它，目前NVIDIA應該也只是計劃只在GA102核心上做它的支持，而定位更低的GA104、GA106等核心應該都只支持GDDR6。在RTX 3070及之下的RTX 30系顯卡和未來可能的GTX 26系列顯卡上，我們看到的應該仍然是GDDR6顯存。

總結：GDDR6X可能不會很普及，但它代表了未來方向

GDDR6X在GDDR家族中首次應用了PAM4信號調製方式，提升了信號傳輸的效率，能夠以更低的時鐘頻率達成同樣的等效頻率。PAM4信號調製方式也並不是什麼新的技術，它在高速乙太網中早已經被廣泛應用，而且目前正處於規劃中的PCIe 6.0總線也計劃將信號調製方式從NRZ切換到PAM4上去，在頻率提升已經達到物理極限的時候，更高效率的信號調製方式就是新的用來提升帶寬的手段了。

由於GDDR6X和GDDR5X類似，是NVIDIA和美光合作開發的，所以短時間內我們很難看到採用GDDR6X的A卡，也很難說美光會不會將GDDR6X提交給JEDEC進行標準化。就之前GDDR5X的情況來看，GDDR6X應該不會像GDDR6那麼普及，主流級別的顯卡將仍然採用GDDR6顯存，而專業級的GPU則會選擇有更大帶寬的HBM。

或許我們不會看到標準化的GDDR6X，但未來比GDDR6更新的標準可能會吸收GDDR6X上所使用的新信號調製方式。它可能不會很普及，但它確實是顯存發展的一個未來方向。

相關焦點

和gddr6有什麼區別?

而解析度越高，遊戲的材質紋理貼圖數據就會越大、進行圖形計算時所需的數據交換帶寬也要求更高，這時就需要更大容量的顯存及顯存帶寬。二、gddr6x和gddr6有什麼區別1、GDDR6X擁有更高的顯存帶寬 GDDR6X和GDDR6的主要區別體現在它們的等效頻率上，GDDR6的等效頻率為14~16Gbps左右，而GDDR6X的等效頻率為
鎂光GDDR6X顯存已量產 RTX3090將搭載

近日，據wccftech報導，美光宣布推出了新一代的GDDR6X顯存晶片。它將應用於 NVIDIA 的 GeForce RTX 30 系列顯卡上，現在已經大規模投入量產。與之前出現的GDDR4X、GDDR5X顯存一樣，GDDR6X與DDR6相比，將在頻率上更高。目前GDDR6X的頻率已達到19Gbps，未來可能會提升至21Gbps。而GDDR6頻率的極限在16Gbps以下下，一般情況下在14Gbps左右。
...揭GTX660/660Ti顯存之謎(全文)_NVIDIA GeForce GTX 660_顯卡...

在先前的GPU鍊金試驗室中，我們揭開了Tahiti與Pitcairn的效率之謎，直面了Kepler架構對處理器的依賴以及新Scheduling過程的真相，那麼在今天的鍊金試驗室中，我們又將面對哪個隱藏在現象背後的真相呢？　　所謂隱藏在現象背後的真相，要從NVIDIA最近很熱門的「小秘密」——非對稱顯存體系說起。
滄海桑田話存貯內存/顯存發展編年史

第2頁：昔日經典：SDRAM時代的悲喜劇　　自Intel Celeron系列以及AMD K6處理器以及相關的主板晶片組推出後，EDO DRAM內存性能再也無法滿足需要了，內存技術必須徹底得到個革新才能滿足新一代CPU架構的需求，SDRAM應用而生，至此終於進入內存的近代史。
20G顯存的RTX3080ti擱淺,其實發布了可能也買不到!

在10G顯存的RTX3080全面缺貨之後，很多人聽到還有20G顯存的RTX3080ti之後，就打算繼續等待了，畢竟憑藉RTX3080的性能，10G顯存多少有些吝嗇了，而AMD這邊的新卡都是清一色的16G顯存，這就導致更多人看不上10G顯存的RTX3080，即使有幸買到了，也擔心會被20G顯存版來一波背刺
告別渣畫質,視頻會議帶寬降90%,英偉達公開Maxine服務背後重要技術

最近，英偉達團隊發布的新論文揭露了這背後的技術。如果讓打工人用幾個關鍵詞總結 2020 年的生活，「視頻會議」應該是其中一個。受疫情影響，這一年來，遠程辦公和視頻會議正在成為新的潮流。在忍受會議枯燥的同時，很多人迷上了 AI 換臉，期望能夠實現「一邊開會，一邊摸魚」的夢想。此前機器之心也介紹過這樣的熱門項目。
48G顯存!NVIDIA安培核彈RTX A6000上市:性能超RTX 3090!

英偉達方面昨日正式推出了首款採用安培架構的專業圖形卡RTX A6000，定位工作站專業顯卡，還支持NVIDIA vGPU虛擬化技術，英偉達商店價格為4650美元，明顯低於圖靈架構的專業卡。IT之家提醒，專業卡與遊戲卡用途不同，設計也不同，雖然也能打遊戲，但RTX A6000的48GB顯存是所有遊戲都填不滿的。當然，RTX A6000採用的是GDDR6顯存，顯存帶寬實際上在大部分專業應用中感知不強。
拍樂雲趙加雨:視頻會議技術提升在線教育課堂互動體驗

本屆教育科技大會以"新業態 · 新動能 · 新教育"為主題，邀請頂級專家學者、技術大咖，圍繞中國教育科技的現狀、發展、創新、變革、機遇等多方面問題進行深度剖析，並將以最新、最全、最優的視角，全方位深入教育本質，聚焦業態發展。
...創造新課堂——我市中小學在2020年全國新媒體新技術教學應用...

「2020年新媒體新技術教學應用研討會暨第十三屆全國中小學創新課堂教學實踐觀摩活動」成果揭曉。我市中小學在2020年全國新媒體新技術教學應用比賽中取得優異成績。幾位教師充分利用數位化、網絡化、智能化的信息技術，探索「網際網路+」的課堂教學新形態，將「以學習者為中心」作為核心理念，深入挖掘學科核心素養的內涵，探索深度融合的新技術、新模式和新方法，為學生創設情感參與、操作行為參與和思維參與的環境、條件和機會，充分凸顯了「新媒體新技術」支撐下課堂生成資源的再利用。
超能課堂:一路走來,內存頻率是如何增長了百倍?

SDR SDRAM：66MHz-133MHz在此之前的上古時代太久遠，技術上的差別可以把這部分略過，所以從插座變成DIMM的SDR SDRAM開始。如果對內存以往的歷史感興趣，可以通過我們以前的《超能課堂：從KB到GB，內存條所經過的7個歷程》去了解。
騰訊雲音視頻技術支撐遠程會議在線課堂流量帶寬實現倍增

老師正在用騰訊教育在線課堂產品上課中新網2月24日電疫情期間，遠程會議、在線課堂等業務井噴帶來了音視頻流量的急劇增長。騰訊雲視頻業務總經理李鬱韜日前透露，疫情期間騰訊雲在音視頻領域的整體流量帶寬實現翻倍增長。
5G承載網絡切片技術和應用方案分析

通信世界網消息（CWW）5G網絡切片是5G 獨立組網（SA）的標誌性技術之一，也是5G賦能垂直行業的重要利器。2020年我國運營商、研究機構、設備商和產業各界全面啟動了5G網絡切片的系列技術規範研製、切片管理系統研發、端到端測試驗證和行業應用試點工作。
康普專稿:2020三大關鍵詞:帶寬、邊緣設備、PoE

導讀：2020年這些新標準、新產品和新服務將推動邊緣設備對更高帶寬和更多PoE供電的需求，影響將覆蓋智能家居和智慧城市、智能樓宇和體育館，以及礦場、工廠和倉庫等廣泛的聯網環境。康普預計，2020年這些新標準、新產品和新服務將推動邊緣設備對更高帶寬和更多PoE供電的需求，影響將覆蓋智能家居和智慧城市、智能樓宇和體育館，以及礦場、工廠和倉庫等廣泛的聯網環境。帶寬需求催生多種連接方式如上所述，2019年我們見證了一系列Wi-Fi CERTIFIED 6認證產品的面世，包括無線接入點（AP）和消費電子設備等產品。
AMD Radeon Instinct MI100加速卡曝光:32GB顯存功耗僅200W

今天，硬體曝料專家@KOMACHI_ENSAKA 給出消息稱，發現了一款新的AMD專業加速卡「Radeon Instinct MI100」，應該就是Arcturus核心，核心基礎頻率1090MHz、加速頻率
RTX 3090再戰8K解析度3A遊戲:纖毫畢現,清晰銳利新視界

GDDR6X顯存讓帶寬起飛8K解析度下遊戲的貼圖數據以及顯存佔用是非常驚人的，3A遊戲吃滿20G顯存簡直是家常便飯。從最早的3D加速卡一路走來，顯存從使用與傳統DDR區別不大的GDDR2，到使用GDDR3、GDDR5，再到使用專為超高帶寬設計的HBM，其類型更換、升級的速度遠比傳統的DDR內存來的快。NVIDIA在2018年的Turing顯卡上面首次應用了GDDR6顯存，在當時，GDDR6顯存能夠提供比疲態盡顯的GDDR5高的多的帶寬，也讓GDDR5X黯然失色。
技術課堂 | eMTC物聯網是什麼,和NB-IoT有什麼關係?

作為最受追捧的物聯網技術，NB-IoT的火熱程度毋庸置疑。其實，除了它倆之外，還有一項技術，應用也很廣泛，曾經一度被認為會三分天下有其一。它就是我們今天文章的主角——eMTC。目前通信行業最大的派系——3GPP組織(3GPP是什麼?)，就是其中的陣營之一。eMTC和NB-IoT，都是3GPP推出的技術標準。
勝友網絡:專注教育新技術應用,從內容+軟硬體出發,提供在線實時...

勝友網絡成立於2014年，是一家在線教育解決方案提供商，專注於教育行業的新技術應用，教學場景覆蓋包括1對1、小班課、大班課、雙師課堂等。公司產品基於思科協作技術，以核心編解碼和雲帶寬儲備為兩大核心，從內容、硬體、軟體三個層面出發，為高校、培訓機構、教育機構提供在線實時互動教學的軟硬體綜合解決方案及精品在線課程分發服務，從而達到教育的信息化和網際網路式應用，實現以雙向和多向互動為核心的新技術課堂。商業模式方面，勝友網絡採用內容＋軟體+硬體的模式對外運營。
新技術推動課堂再升級, ClassIn平臺入校做了什麼?

經濟觀察網記者李靜 10月24日，翼鷗教育創始人、CEO宋軍波在「新技術革命與教育融合創新發展」論壇上表示，今年疫情讓全社會看到了人工智慧、大數據等新技術發揮的巨大能量，對於教育行業來說為了借力人工智慧、大數據等新技術推動學習方式變革，教育科技企業的新技術、新產品被廣泛應用於公立校的課堂中。在北京一零一中學，老師可以在電子大屏打開ClassIn，通過教學工具和學生手中pad、筆記本電腦互動授課，實現「教學過程留痕」，還可通過課堂數據智能分析結果，為學校搭建高性價比、數據化、雲端化的智能型精準高效課堂。
聲網發布極速直播、低碼高清技術可節省50%帶寬成本

中新網12月11日電 10日，實時互動雲服務開創者及引領者聲網Agora在北京發布了首款定義輕互動直播場景的「極速直播」與可降低50%直播帶寬成本的「低碼高清」兩大新產品，同時聲網還對面向智能硬體、VR/AR等自編解場景的「實時碼流加速產品-RTSA」進行全新升級。
高帶寬微星GeForce GTX1060飆風5G特價

該技術可以讓散熱管和均熱板完全契合，達到更好的散熱效果。8008MHz 顯存類型 GDDR5 顯存容量 6GB 顯存位寬 192bit 最大解析度

超能課堂(245):GDDR6X顯存的超高帶寬背後應用了什麼新技術?

相關焦點

和gddr6有什麼區別?

鎂光GDDR6X顯存已量產 RTX3090將搭載

...揭GTX660/660Ti顯存之謎(全文)_NVIDIA GeForce GTX 660_顯卡...

滄海桑田話存貯 內存/顯存發展編年史

20G顯存的RTX3080ti擱淺,其實發布了可能也買不到!

告別渣畫質,視頻會議帶寬降90%,英偉達公開Maxine服務背後重要技術

48G顯存!NVIDIA安培核彈RTX A6000上市:性能超RTX 3090!

拍樂雲趙加雨:視頻會議技術提升在線教育課堂互動體驗

...創造新課堂——我市中小學在2020年全國新媒體新技術教學應用...

超能課堂:一路走來,內存頻率是如何增長了百倍?

騰訊雲音視頻技術支撐遠程會議在線課堂 流量帶寬實現倍增

5G承載網絡切片技術和應用方案分析

康普專稿:2020三大關鍵詞:帶寬、邊緣設備、PoE

AMD Radeon Instinct MI100加速卡曝光:32GB顯存 功耗僅200W

RTX 3090再戰8K解析度3A遊戲:纖毫畢現,清晰銳利新視界

技術課堂 | eMTC物聯網是什麼,和NB-IoT有什麼關係?

勝友網絡:專注教育新技術應用,從內容+軟硬體出發,提供在線實時...

新技術推動課堂再升級, ClassIn平臺入校做了什麼?

聲網發布極速直播、低碼高清技術 可節省50%帶寬成本

高帶寬微星GeForce GTX1060飆風5G特價

滄海桑田話存貯內存/顯存發展編年史

騰訊雲音視頻技術支撐遠程會議在線課堂流量帶寬實現倍增

AMD Radeon Instinct MI100加速卡曝光:32GB顯存功耗僅200W

聲網發布極速直播、低碼高清技術可節省50%帶寬成本