22年後再戰高性能顯卡市場 Intel Xe GPU架構詳解:王之野望

2021-01-18 快科技

作為CPU界的王者，Intel對高性能GPU市場一直沒有死心，1998年就推出了i740獨顯，12年後又推出Larrabee，22年後的今天又重燃戰鼓，推出了Xe GPU架構。

Intel重新殺入高性能GPU市場的傳聞已久，並挖來了AMD RTG部門前主管、首席架構師Raja Koduri坐鎮GPU業務，這次是否會不一樣呢？

今天的2020年架構日上，Intel終於詳細地解開了Xe GPU的面紗，這裡我們就來管中窺豹一探Intel歷時多年重新打造的GPU架構。

對於Xe架構，我們之前的報導已經多次提到Intel對它的期望是希望用一種架構去滿足多種使用場景，從筆記本到遊戲卡再到高性能超算，都是Xe架構，推動GPU算力從萬億次（TFLOPS）向千萬億次（PFLOPS）邁進。

Intel Xe架構總覽：一種架構通殺四方、適應AI、雲時代

對於Xe GPU架構，官方的定義是「並行矢量矩陣架構」，已經突出了這個架構的特點，那就是高度並行，適合擴展多種場景。

Xe GPU架構有三大重點——軟體第一、並行第二，同時適應全新的工作負載，比如AI、視覺雲計算等等，這也是Intel作為GPU後來的一個優勢，研發GPU架構的時候可以不用照顧太多之前的積累，直接面向未來潛力巨大的場景，比如AI、雲計算等等。

Xe GPU希望用一個架構統一所有應用場景，不過實際情況還是很複雜的，不同場景對性能、功耗的要求不同，可以細分為集成+低能耗、中端、發燒級、數據中心/AI、HPC百億億次計算等等。

在這些細分場景中，Intel打造了三種不同的架構——Xe LP低功耗、Xe HP高性能、Xe HPC，不過實際上已經擴展到了四種，後面會再詳細說。

雖然有三四種不同的架構，不過Intel現在做的主要是兩種——適用於HPC的Xe HPC及低功耗的Xe LP，後者適合核顯、筆記本及低端獨顯，包括之前曝光最多的DG1顯卡。

Intel Xe GPU架構詳解：EU、存儲、AI、顯示、視頻單元全都改了

目前進度最好的還是Xe LP低功耗版，Xe GPU的結構介紹都是基於Xe LP的，具體如下：

Xe LP架構簡單來說就是在提升FLOPS浮點性能的同時，還要考慮功耗，所以能效很重要，性能及能效兼顧。

提升性能就要提升計算規模，Xe架構在Gen11基礎上全面提升了執行單元的規模，EU單元從Ice Lake處理器上的Gen11核顯最多64個提升到了96個，每周期Texel紋理、Pixel像素渲染能力也從32、16提升到48、24，總體性能1.5倍於目前Gen11顯卡水平。

考慮到Gen11的規模實際上已經是目前Gen9.5的2倍多，理論上Tiger Lake上的Gen12核顯性能是現有核顯的至少3倍。

能效方面，在同樣的電壓下，Xe LP GPU的頻率大幅提升，從之前1.1GHz左右提升到了1.7GHz，還有其他手段一起降低了功耗，能效也全面改進了。

下面就是Gen11與Xe架構EU單元的具體對比了。

存儲單元方面，Xe LP GPU的改變也不小，L1新增了數據緩存，並支持端對端壓縮，L3緩存從Gen11的3MB大幅提升到16MB，同時GTI（Graphics Technology Interface 圖形技術接口）帶寬翻倍。

在AI上，Xe架構之前的GPU主要是支持FP32、FP16及Int16浮點，而Xe GPU開始支持INT8指令，AI性能是FP32的4倍。

多媒體引擎上，Xe GPU架構的解碼、編碼帶寬翻倍，支持AV1加速，同時支持4K/8K60播放，還有HDR、杜比音效等等。

顯示輸出方面，Xe GPU支持4屏擴展，支持雙eDP，接口支持DP 1.4、HDMI 2.0、TBT4及USB4，並支持8K UHD輸出，還有360Hz高刷、自適應Sync，全面達到頂級水平。

為何說軟體第一？Intel Xe GPU驅動及軟體優化

前面提到Xe GPU架構的時候，Intel第一個強調的是軟體，很多人可能並不理解，實際上Intel這次是抓到重點了，軟體支持是GPU最容易翻車的地方，Intel的核顯GPU多年來理論性能不弱，但是遊戲表現一言難盡，就是驅動和優化是最大的鍋。

這次Intel對軟體及驅動的重視終於提上來了，這也跟Raja Koduri本人的風格有一定關係，2013年他回到AMD的時候，當年AMD第一個改革的就是催化劑驅動，全面放棄之前的界面及設計，變成了現在的腎上腺素Adrenalin驅動。

在圖形軟體方面，不同場景下的GPU面對的挑戰也是不同的，3D渲染、計算、多媒體、性能、穩定性等等都很重要。

在驅動及編譯器效率上，Xe GPU改變了調度設計，支持AI優化指令，降低了DX11中的驅動開銷（overhead），減少了API延遲等等。

針對GPU優化，Xe GPU可以自適應優化，在後臺就最大化GPU性能。

Xe GPU還支持了VRS可變幀率渲染，根據渲染場景的不同來選擇降低或者提升渲染內容，之前在Ice Lkae的Gen11上首先應用了。

還有就是IGCC控制面板，這裡面提供了不少遊戲輔助弓箭手，包括截屏、銳化、直播等等，如果大家用過NVIDIA的GFE及AMD的RIS，就知道Intel這是在一比一的致敬兩位對手了，這對遊戲玩家來說也是好事。

最後就是遊戲支持，這個才是考驗GPU廠商的關鍵，目前已經得到英雄薩姆4、GRID、Gear Tactics、Ring of Elysium、Chvalry II等遊戲支持的，這個只能慢慢來了。

Intel Xe GPU產品線：Xe LP首發三款、One More Thing驚喜亮相

在尾聲階段，來看看Intel Xe GPU最終的產品線，目前主要是Xe LP及Xe HPC兩個架構有結果，其中LP架構會有三款產品。

最快見到的Tiger Lake處理器上的Gen12核顯，然後就是DG1，這個是針對移動內容創造者的，還有就是針對伺服器的SG1，後兩者規格應該差不多。

然後就是One More Thing了，前面說到了Xe GPU有LP、HP及HPC三種，現在Intel又增加了一個選擇——Xe HPG，專門為發燒級遊戲玩家設計的。

Xe HPG最大的特點就是支持RT光線追蹤，硬體光追這個未來遊戲的最大賣點也追上來了，至此AMD、NVIDIA及Intel三家都明確了支持光追了。

現在Xe GPU的架構就變成了Xe LP、Xe HPG、Xe HP及Xe HPC四大金剛了，未來會覆蓋核顯到HPC超算在內的多個場景。

最最後就是四款GPU架構的工藝及封裝了，Xe LP會使用Intel的10nm SuperFin工藝，Xe HPG及Xe HP則是增強版10nm SuperFin工藝，其中Xe HP還會使用EMIB 2.5D封裝技術。

在往上，Xe HPC的計算卡之前原定是7nm工藝首發，現在隨著7nm延期，也退回到了10nm SuperFin工藝了，不過封裝技術是最先進的Foveros及Co-EMIB。

總之，今天公布的Xe架構可以讓大家過過癮，然而這些東西依然是紙面上的，停留在架構上的，有關DG1顯卡、HPG光追卡的最終規格、性能、價格、上市時間等信息還得等等，最快也要年底左右了

相關焦點

GPU-Z曝光Intel新顯卡Xe Pod:或替代UHD 620/630

今天GPU-Z發布了新版（2.36.0），而更新細節中還意外曝光了Intel的新顯卡。從更新說明上看，新版GPU-Z增加了對Intel Xe MAX Graphics、Xe Graphics、Xe Pod、Xe SG-18M Server GPU、Intel Comet Lake iGPU（Xeon W-1250、Xeon W-10855M）等顯卡的支持這個Intel Xe Pod到底是什麼角色？
高性能低功耗intel Corei7 4790售1819元

【PConline上海站行情】intel Core i7 4790依然四核八線程、Turbo Boost 2.0加速技術、超線程技術、智能高速緩存、雙通道DDR3內存控制器，稍有不同的是核芯顯卡規格單獨成行，非常醒目。
Intel 2018架構日詳解:新CPU&新GPU齊公布牙膏時代有望明年結束

在架構的後端部分，Intel已經做了包括增加高速緩存大小、增加核心執行寬度、增加L1存儲帶寬等改進。Sunny Cove架構的L1數據緩存從32KB升級為48KB，通常當緩存容量增大時，緩存未命中的概率將以平方根的比例降低，因此Sunny Cove架構的L1緩存未命中率理論上可減少22％。
蘇姿豐發布RDNA2架構RX 6000系列新顯卡,與英偉達RTX 3000決戰...

顯卡的競爭或許只是晶片大戰的冰山一角，蘇姿豐將帶領AMD和英偉達在更多行業晶片領域上演「終極之戰」。 AMD新卡堪稱性價比之王，遇上老牌霸主能否並駕齊驅？剛剛，AMD 召開了本月最後一次發布會。
顯卡天梯圖4.30版本(含intel第十代酷睿核顯)

極速空間顯卡天梯圖升級到4.30版本。新增intel第十代酷睿核顯和4.21版本相比，主要變化是新增了intel核顯的專屬位置。intel的高端核顯Iris plus G7已經能和Vega10一較高低了，跑分看起來也和低端獨顯接近了，但在一些遊戲中的表現會打折，具體參考解讀第三點。
NVIDIA RTX 30系列架構詳解:8nm安培GPU的兩倍性能從何而來?

在當前的顯卡市場上，佔據80%的NVIDIA公司被玩家愛且恨著——他們帶來了最近十多年來最好的顯卡，同時也讓高端遊戲卡的價格高企，發燒顯卡至少五位數起。但是NVIDIA工藝雖然並不算激進，但性能、能效進步還是挺大的，安培顯卡各方面指標都是大幅勝過現在的圖靈卡，而且價格做到了不升反降，這也是不追求激進工藝的好處，反正之前12nm都能贏，現在上8nm更加穩妥了。安培GPU架構詳解之：FP32單元翻倍 CUDA核心改了什麼？
Intel首席架構師曬多款獨顯:GPU黃金時代來了

12月9日消息，Intel高級副總裁、首席架構師Raja Koduri在社交媒體上曬出幾款Intel的獨顯，包括剛剛發布的新華三XG310 PCIe GPU 擴展卡。Raja Koduri興奮地表示，很高興看到這些東西能在一起，Intel首個數據中心GPU（基於Xe-LP微架構）已經量產，基於Xe HP架構的GPU也在面向客戶出出樣。
GPU-Z 更新:曝光英特爾 Xe Pod 顯卡

IT之家 11 月 28 日消息根據外媒 TechPowerUp 的消息，旗下軟體 GPU-Z 更新至 2.36.0，更新內容中曝光了一些尚未發布的新款 GPU。據介紹，GPU-Z 優化了對 AMD Radeon RX 6800 XT 和 RX 6800 顯卡的支持，支持 NVIDIA 新款的 GeForce RTX 3060 Ti，這款顯卡預計將在 12 月 2 日發布。
一個頂倆十一代酷睿用上Xe架構GPU:筆記本還要獨顯嗎?

在這些升級中，GPU升級可能是對筆記本影響最大的一次，因為它可能會改變目前的高性能輕薄本的設計，一個高性能集顯就可以取代傳統的CPU+獨顯，帶來的好處涉及到性能、功耗及售價等多個方面。基於此，十一代酷睿Tiger Lak處理器這次使用了Xe架構的GPU單元，這是Intel在1998年之後再次推出高性能GPU，Xe架構未來會擴展到多個領域，從筆記本到遊戲卡再到數據中心、超算，性能設計極富彈性。
Intel的Xe顯卡將採用MCM封裝,最多4核心500W TDP

在CES 2020是Intel終於拿出了Xe架構的DG1獨立顯卡，不過這款顯卡短小的外形看起來性能不怎麼樣，初步爆料它可以應付1080p的遊戲，當然Intel在獨顯市場的野心絕不止於此，根據最新流出的消息，Intel正在準備用類似MCM的方式打造高端顯卡，最頂級那塊可封入4個Xe核心，功耗高達
AMD發布CDNA架構Instinct MI100加速顯卡加速百億億次級時代到來

北京時間11月16日晚10點，AMD正式發布了首款基於全新CDNA架構的Instinct MI100加速顯卡，以及配套的ROCm 4.0生態系統首次正式亮相的CDNA架構專門為高性能計算所打造，而基於該架構的AMD Instinct MI100
軟體優化可將CPU性能提升28倍 Intel詳解OneAPI戰略-Intel,優化...

在日前的SC 19大會上，Intel發布了全新的Xe架構GPU及多款10nm產品，這是Intel應對未來HPC高性能計算的關鍵。與此同時，Intel還正式宣布了OneAPI統一編程模型，它可能不被DIY玩家熟悉，但這很有可能會改變未來十年各種XPU晶片的發展。
從圖靈架構發布看未來顯卡發展之勢

什麼是圖靈架構？要解決這個問題，我們首先要弄明白什麼是架構。其實架構用大眾理解的話來說可以等效為一種工作模式。舉個例子，我們都知道汽車的裝配模式目前最科學最有效率的是流水線化作業，這就是汽車製造業的「架構」。而顯卡架構的革新和優化，對整個工作單元的產出和效率提升有著決定性的作用。
信長之野望14:勢力範圍+劇情DLC 免安裝破解下載

遊戲名稱：信長之野望14：勢力範圍　　英文名稱：NOBUNAGA'S AMBITION: Sphere of Influence
7nm GPU又要等了 NV黃仁勳:沒必要升級Volta及Turing架構

AMD今年推出了7nm Navi架構的RX 5700系列顯卡，年底據說還會有代號NVIDIA Killer（N卡殺手）的Navi 23顯卡，性能可以達到頂級水平，顯然是對著RTX 2080 Ti虎視眈眈，旗艦級顯卡市場也要洗牌了。
Ampere架構GPU帶來了什麼

NVIDIA 中國區高級技術市場經理施澄秋表示：「在過去20年裡，NVIDIA在各式各樣的圖形和可視化運算及AI等不同領域，都針對GPU做出相應優化。NVIDIA GPU無論是在軟硬體設計，還是功能改進，都針對不同用戶產生了不同性能飛躍，包括現在很流行的AEC、BIM、CAM等。」
從GPU誕生說起:AMD統一渲染架構回顧及展望-AMD,ATI,統一渲染,顯卡...

驀然回首看ATI顯卡發展之路》一文，文章就AMD（ATI）的顯卡發展之路進行了詳細回顧，對歷代比較有代表性的顯卡以及重大事件著墨較多。撰文之時，Radeon HD 5000風華正茂，Radeon HD 6000還在孕育當中。時光飛梭，如今Radeon HD 6000已部署完畢，具有顛覆意義的APU也橫空出世，傳統GPU與CPU的概念將逐步走向融合。
英偉達停產麥克斯韋架構顯卡為新一代顯卡鋪路

【環球科技綜合報導】據美國科技網站EXTREME TECH報導，3月英偉達的帕斯卡架構在2016年的遊戲開發者大會(GDC)上嶄露頭角，但其並未透露更多新一代顯卡的詳細信息，令許多讀者對此感到不快。有傳言說為了使帕斯卡架構GP104核心快速取代GM204核心，英偉達可能停產GTX 980 Ti、980及970。
Intel付得起xPU的巨額尾款嗎?

eASIC與ASIC最大的不同之處就在於在客戶購買定製晶片後，還能夠通過重新編程將晶片不同部分重新連接從而完成新的任務。客戶可以使用FPGA創建設計將固定布局烘焙到單個設計掩模中，最終eASIC也將不再可編程，從而獲得近似ASIC的功耗性能。市場中還存在eFPGA這種產品，當然在使用上則會更靠近FPGA，主要是將ASIC進行片上連接，此處不進行詳細講解。
NVIDIA將下代遊戲顯卡定為安培架構 GTX 2080到手僅需幾個月

近日，根據外媒3DCenter、Beyond3D披露，NVIDIA將有望在4月推出全新一代GeForce遊戲顯卡，不再使用目前遊戲顯卡廣泛應用的Pascal帕斯卡架構，也不是遊戲玩家期待的Tesla、Quadro、Titan等高性能計算產品所採用的Volta伏特架構

22年後再戰高性能顯卡市場 Intel Xe GPU架構詳解:王之野望

相關焦點

GPU-Z曝光Intel新顯卡Xe Pod:或替代UHD 620/630

高性能低功耗intel Corei7 4790售1819元

Intel 2018架構日詳解:新CPU&新GPU齊公布 牙膏時代有望明年結束

蘇姿豐發布RDNA2架構RX 6000系列新顯卡,與英偉達RTX 3000決戰...

顯卡天梯圖4.30版本(含intel第十代酷睿核顯)

NVIDIA RTX 30系列架構詳解:8nm安培GPU的兩倍性能從何而來?

Intel首席架構師曬多款獨顯:GPU黃金時代來了

GPU-Z 更新:曝光英特爾 Xe Pod 顯卡

一個頂倆 十一代酷睿用上Xe架構GPU:筆記本還要獨顯嗎?

Intel的Xe顯卡將採用MCM封裝,最多4核心500W TDP

AMD發布CDNA架構Instinct MI100加速顯卡 加速百億億次級時代到來

軟體優化可將CPU性能提升28倍 Intel詳解OneAPI戰略-Intel,優化...

從圖靈架構發布看未來顯卡發展之勢

信長之野望14:勢力範圍+劇情DLC 免安裝破解下載

7nm GPU又要等了 NV黃仁勳:沒必要升級Volta及Turing架構

Ampere架構GPU帶來了什麼

從GPU誕生說起:AMD統一渲染架構回顧及展望-AMD,ATI,統一渲染,顯卡...

英偉達停產麥克斯韋架構顯卡 為新一代顯卡鋪路

Intel付得起xPU的巨額尾款嗎?

NVIDIA將下代遊戲顯卡定為安培架構 GTX 2080到手僅需幾個月

Intel 2018架構日詳解:新CPU&新GPU齊公布牙膏時代有望明年結束

一個頂倆十一代酷睿用上Xe架構GPU:筆記本還要獨顯嗎?

AMD發布CDNA架構Instinct MI100加速顯卡加速百億億次級時代到來

英偉達停產麥克斯韋架構顯卡為新一代顯卡鋪路