22年後再戰高性能顯卡市場 Intel Xe GPU架構詳解:王之野望

2021-01-18 快科技

作為CPU界的王者,Intel對高性能GPU市場一直沒有死心,1998年就推出了i740獨顯,12年後又推出Larrabee,22年後的今天又重燃戰鼓,推出了Xe GPU架構。

Intel重新殺入高性能GPU市場的傳聞已久,並挖來了AMD RTG部門前主管、首席架構師Raja Koduri坐鎮GPU業務,這次是否會不一樣呢?

今天的2020年架構日上,Intel終於詳細地解開了Xe GPU的面紗,這裡我們就來管中窺豹一探Intel歷時多年重新打造的GPU架構。

對於Xe架構,我們之前的報導已經多次提到Intel對它的期望是希望用一種架構去滿足多種使用場景,從筆記本到遊戲卡再到高性能超算,都是Xe架構,推動GPU算力從萬億次(TFLOPS)向千萬億次(PFLOPS)邁進。

Intel Xe架構總覽:一種架構通殺四方、適應AI、雲時代

對於Xe GPU架構,官方的定義是「並行矢量矩陣架構」,已經突出了這個架構的特點,那就是高度並行,適合擴展多種場景。

Xe GPU架構有三大重點——軟體第一、並行第二,同時適應全新的工作負載,比如AI、視覺雲計算等等,這也是Intel作為GPU後來的一個優勢,研發GPU架構的時候可以不用照顧太多之前的積累,直接面向未來潛力巨大的場景,比如AI、雲計算等等。

Xe GPU希望用一個架構統一所有應用場景,不過實際情況還是很複雜的,不同場景對性能、功耗的要求不同,可以細分為集成+低能耗、中端、發燒級、數據中心/AI、HPC百億億次計算等等。

在這些細分場景中,Intel打造了三種不同的架構——Xe LP低功耗、Xe HP高性能、Xe HPC,不過實際上已經擴展到了四種,後面會再詳細說。

雖然有三四種不同的架構,不過Intel現在做的主要是兩種——適用於HPC的Xe HPC及低功耗的Xe LP,後者適合核顯、筆記本及低端獨顯,包括之前曝光最多的DG1顯卡。

Intel Xe GPU架構詳解:EU、存儲、AI、顯示、視頻單元全都改了

目前進度最好的還是Xe LP低功耗版,Xe GPU的結構介紹都是基於Xe LP的,具體如下:

Xe LP架構簡單來說就是在提升FLOPS浮點性能的同時,還要考慮功耗,所以能效很重要,性能及能效兼顧。

提升性能就要提升計算規模,Xe架構在Gen11基礎上全面提升了執行單元的規模,EU單元從Ice Lake處理器上的Gen11核顯最多64個提升到了96個,每周期Texel紋理、Pixel像素渲染能力也從32、16提升到48、24,總體性能1.5倍於目前Gen11顯卡水平。

考慮到Gen11的規模實際上已經是目前Gen9.5的2倍多,理論上Tiger Lake上的Gen12核顯性能是現有核顯的至少3倍。

能效方面,在同樣的電壓下,Xe LP GPU的頻率大幅提升,從之前1.1GHz左右提升到了1.7GHz,還有其他手段一起降低了功耗,能效也全面改進了。

下面就是Gen11與Xe架構EU單元的具體對比了。

存儲單元方面,Xe LP GPU的改變也不小,L1新增了數據緩存,並支持端對端壓縮,L3緩存從Gen11的3MB大幅提升到16MB,同時GTI(Graphics Technology Interface 圖形技術接口)帶寬翻倍。

在AI上,Xe架構之前的GPU主要是支持FP32、FP16及Int16浮點,而Xe GPU開始支持INT8指令,AI性能是FP32的4倍。

多媒體引擎上,Xe GPU架構的解碼、編碼帶寬翻倍,支持AV1加速,同時支持4K/8K60播放,還有HDR、杜比音效等等。

顯示輸出方面,Xe GPU支持4屏擴展,支持雙eDP,接口支持DP 1.4、HDMI 2.0、TBT4及USB4,並支持8K UHD輸出,還有360Hz高刷、自適應Sync,全面達到頂級水平。

為何說軟體第一?Intel Xe GPU驅動及軟體優化

前面提到Xe GPU架構的時候,Intel第一個強調的是軟體,很多人可能並不理解,實際上Intel這次是抓到重點了,軟體支持是GPU最容易翻車的地方,Intel的核顯GPU多年來理論性能不弱,但是遊戲表現一言難盡,就是驅動和優化是最大的鍋。

這次Intel對軟體及驅動的重視終於提上來了,這也跟Raja Koduri本人的風格有一定關係,2013年他回到AMD的時候,當年AMD第一個改革的就是催化劑驅動,全面放棄之前的界面及設計,變成了現在的腎上腺素Adrenalin驅動。

在圖形軟體方面,不同場景下的GPU面對的挑戰也是不同的,3D渲染、計算、多媒體、性能、穩定性等等都很重要。

在驅動及編譯器效率上,Xe GPU改變了調度設計,支持AI優化指令,降低了DX11中的驅動開銷(overhead),減少了API延遲等等。

針對GPU優化,Xe GPU可以自適應優化,在後臺就最大化GPU性能。

Xe GPU還支持了VRS可變幀率渲染,根據渲染場景的不同來選擇降低或者提升渲染內容,之前在Ice Lkae的Gen11上首先應用了。

還有就是IGCC控制面板,這裡面提供了不少遊戲輔助弓箭手,包括截屏、銳化、直播等等,如果大家用過NVIDIA的GFE及AMD的RIS,就知道Intel這是在一比一的致敬兩位對手了,這對遊戲玩家來說也是好事。

最後就是遊戲支持,這個才是考驗GPU廠商的關鍵,目前已經得到英雄薩姆4、GRID、Gear Tactics、Ring of Elysium、Chvalry II等遊戲支持的,這個只能慢慢來了。

Intel Xe GPU產品線:Xe LP首發三款、One More Thing驚喜亮相

在尾聲階段,來看看Intel Xe GPU最終的產品線,目前主要是Xe LP及Xe HPC兩個架構有結果,其中LP架構會有三款產品。

最快見到的Tiger Lake處理器上的Gen12核顯,然後就是DG1,這個是針對移動內容創造者的,還有就是針對伺服器的SG1,後兩者規格應該差不多。

然後就是One More Thing了,前面說到了Xe GPU有LP、HP及HPC三種,現在Intel又增加了一個選擇——Xe HPG,專門為發燒級遊戲玩家設計的。

Xe HPG最大的特點就是支持RT光線追蹤,硬體光追這個未來遊戲的最大賣點也追上來了,至此AMD、NVIDIA及Intel三家都明確了支持光追了。

現在Xe GPU的架構就變成了Xe LP、Xe HPG、Xe HP及Xe HPC四大金剛了,未來會覆蓋核顯到HPC超算在內的多個場景。

最最後就是四款GPU架構的工藝及封裝了,Xe LP會使用Intel的10nm SuperFin工藝,Xe HPG及Xe HP則是增強版10nm SuperFin工藝,其中Xe HP還會使用EMIB 2.5D封裝技術。

在往上,Xe HPC的計算卡之前原定是7nm工藝首發,現在隨著7nm延期,也退回到了10nm SuperFin工藝了,不過封裝技術是最先進的Foveros及Co-EMIB。

總之,今天公布的Xe架構可以讓大家過過癮,然而這些東西依然是紙面上的,停留在架構上的,有關DG1顯卡、HPG光追卡的最終規格、性能、價格、上市時間等信息還得等等,最快也要年底左右了

相關焦點

  • GPU-Z曝光Intel新顯卡Xe Pod:或替代UHD 620/630
    今天GPU-Z發布了新版(2.36.0),而更新細節中還意外曝光了Intel的新顯卡。從更新說明上看,新版GPU-Z增加了對Intel Xe MAX Graphics、Xe Graphics、Xe Pod、Xe SG-18M Server GPU、Intel Comet Lake iGPU(Xeon W-1250、Xeon W-10855M)等顯卡的支持這個Intel Xe Pod到底是什麼角色?
  • 高性能低功耗intel Corei7 4790售1819元
    【PConline上海站 行情】intel Core i7 4790依然四核八線程、Turbo Boost 2.0加速技術、超線程技術、智能高速緩存、雙通道DDR3內存控制器,稍有不同的是核芯顯卡規格單獨成行,非常醒目。
  • Intel 2018架構日詳解:新CPU&新GPU齊公布 牙膏時代有望明年結束
    在架構的後端部分,Intel已經做了包括增加高速緩存大小、增加核心執行寬度、增加L1存儲帶寬等改進。Sunny Cove架構的L1數據緩存從32KB升級為48KB,通常當緩存容量增大時,緩存未命中的概率將以平方根的比例降低,因此Sunny Cove架構的L1緩存未命中率理論上可減少22%。
  • 蘇姿豐發布RDNA2架構RX 6000系列新顯卡,與英偉達RTX 3000決戰...
    顯卡的競爭或許只是晶片大戰的冰山一角,蘇姿豐將帶領AMD和英偉達在更多行業晶片領域上演「終極之戰」。 AMD新卡堪稱性價比之王,遇上老牌霸主能否並駕齊驅? 剛剛,AMD 召開了本月最後一次發布會。
  • 顯卡天梯圖4.30版本(含intel第十代酷睿核顯)
    極速空間顯卡天梯圖升級到4.30版本。新增intel第十代酷睿核顯和4.21版本相比,主要變化是新增了intel核顯的專屬位置。intel的高端核顯Iris plus G7已經能和Vega10一較高低了,跑分看起來也和低端獨顯接近了,但在一些遊戲中的表現會打折,具體參考解讀第三點。
  • NVIDIA RTX 30系列架構詳解:8nm安培GPU的兩倍性能從何而來?
    在當前的顯卡市場上,佔據80%的NVIDIA公司被玩家愛且恨著——他們帶來了最近十多年來最好的顯卡,同時也讓高端遊戲卡的價格高企,發燒顯卡至少五位數起。但是NVIDIA工藝雖然並不算激進,但性能、能效進步還是挺大的,安培顯卡各方面指標都是大幅勝過現在的圖靈卡,而且價格做到了不升反降,這也是不追求激進工藝的好處,反正之前12nm都能贏,現在上8nm更加穩妥了。安培GPU架構詳解之:FP32單元翻倍 CUDA核心改了什麼?
  • Intel首席架構師曬多款獨顯:GPU黃金時代來了
    12月9日消息,Intel高級副總裁、首席架構師Raja Koduri在社交媒體上曬出幾款Intel的獨顯,包括剛剛發布的新華三XG310 PCIe GPU 擴展卡。Raja Koduri興奮地表示,很高興看到這些東西能在一起,Intel首個數據中心GPU(基於Xe-LP微架構)已經量產,基於Xe HP架構的GPU也在面向客戶出出樣。
  • GPU-Z 更新:曝光英特爾 Xe Pod 顯卡
    IT之家 11 月 28 日消息 根據外媒 TechPowerUp 的消息,旗下軟體 GPU-Z 更新至 2.36.0,更新內容中曝光了一些尚未發布的新款 GPU。據介紹,GPU-Z 優化了對 AMD Radeon RX 6800 XT 和 RX 6800 顯卡的支持,支持 NVIDIA 新款的 GeForce RTX 3060 Ti,這款顯卡預計將在 12 月 2 日發布。
  • 一個頂倆 十一代酷睿用上Xe架構GPU:筆記本還要獨顯嗎?
    在這些升級中,GPU升級可能是對筆記本影響最大的一次,因為它可能會改變目前的高性能輕薄本的設計,一個高性能集顯就可以取代傳統的CPU+獨顯,帶來的好處涉及到性能、功耗及售價等多個方面。  基於此,十一代酷睿Tiger Lak處理器這次使用了Xe架構的GPU單元,這是Intel在1998年之後再次推出高性能GPU,Xe架構未來會擴展到多個領域,從筆記本到遊戲卡再到數據中心、超算,性能設計極富彈性。
  • Intel的Xe顯卡將採用MCM封裝,最多4核心500W TDP
    在CES 2020是Intel終於拿出了Xe架構的DG1獨立顯卡,不過這款顯卡短小的外形看起來性能不怎麼樣,初步爆料它可以應付1080p的遊戲,當然Intel在獨顯市場的野心絕不止於此,根據最新流出的消息,Intel正在準備用類似MCM的方式打造高端顯卡,最頂級那塊可封入4個Xe核心,功耗高達
  • AMD發布CDNA架構Instinct MI100加速顯卡 加速百億億次級時代到來
    北京時間11月16日晚10點,AMD正式發布了首款基於全新CDNA架構的Instinct MI100加速顯卡,以及配套的ROCm 4.0生態系統首次正式亮相的CDNA架構專門為高性能計算所打造,而基於該架構的AMD Instinct MI100
  • 軟體優化可將CPU性能提升28倍 Intel詳解OneAPI戰略-Intel,優化...
    在日前的SC 19大會上,Intel發布了全新的Xe架構GPU及多款10nm產品,這是Intel應對未來HPC高性能計算的關鍵。與此同時,Intel還正式宣布了OneAPI統一編程模型,它可能不被DIY玩家熟悉,但這很有可能會改變未來十年各種XPU晶片的發展。
  • 從圖靈架構發布看未來顯卡發展之勢
    什麼是圖靈架構?要解決這個問題,我們首先要弄明白什麼是架構。其實架構用大眾理解的話來說可以等效為一種工作模式。舉個例子,我們都知道汽車的裝配模式目前最科學最有效率的是流水線化作業,這就是汽車製造業的「架構」。而顯卡架構的革新和優化,對整個工作單元的產出和效率提升有著決定性的作用。
  • 信長之野望14:勢力範圍+劇情DLC 免安裝破解下載
    遊戲名稱:信長之野望14:勢力範圍   英文名稱:NOBUNAGA'S AMBITION: Sphere of Influence
  • 7nm GPU又要等了 NV黃仁勳:沒必要升級Volta及Turing架構
    AMD今年推出了7nm Navi架構的RX 5700系列顯卡,年底據說還會有代號NVIDIA Killer(N卡殺手)的Navi 23顯卡,性能可以達到頂級水平,顯然是對著RTX 2080 Ti虎視眈眈,旗艦級顯卡市場也要洗牌了。
  • Ampere架構GPU帶來了什麼
    NVIDIA 中國區高級技術市場經理施澄秋表示:「在過去20年裡,NVIDIA在各式各樣的圖形和可視化運算及AI等不同領域,都針對GPU做出相應優化。NVIDIA GPU無論是在軟硬體設計,還是功能改進,都針對不同用戶產生了不同性能飛躍,包括現在很流行的AEC、BIM、CAM等。」
  • 從GPU誕生說起:AMD統一渲染架構回顧及展望-AMD,ATI,統一渲染,顯卡...
    驀然回首看ATI顯卡發展之路》一文,文章就AMD(ATI)的顯卡發展之路進行了詳細回顧,對歷代比較有代表性的顯卡以及重大事件著墨較多。撰文之時,Radeon HD 5000風華正茂,Radeon HD 6000還在孕育當中。時光飛梭,如今Radeon HD 6000已部署完畢,具有顛覆意義的APU也橫空出世,傳統GPU與CPU的概念將逐步走向融合。
  • 英偉達停產麥克斯韋架構顯卡 為新一代顯卡鋪路
    【環球科技綜合報導】據美國科技網站EXTREME TECH報導,3月英偉達的帕斯卡架構在2016年的遊戲開發者大會(GDC)上嶄露頭角,但其並未透露更多新一代顯卡的詳細信息,令許多讀者對此感到不快。有傳言說為了使帕斯卡架構GP104核心快速取代GM204核心,英偉達可能停產GTX 980 Ti、980及970。
  • Intel付得起xPU的巨額尾款嗎?
    eASIC與ASIC最大的不同之處就在於在客戶購買定製晶片後,還能夠通過重新編程將晶片不同部分重新連接從而完成新的任務。客戶可以使用FPGA創建設計將固定布局烘焙到單個設計掩模中,最終eASIC也將不再可編程,從而獲得近似ASIC的功耗性能。市場中還存在eFPGA這種產品,當然在使用上則會更靠近FPGA,主要是將ASIC進行片上連接,此處不進行詳細講解。
  • NVIDIA將下代遊戲顯卡定為安培架構 GTX 2080到手僅需幾個月
    近日,根據外媒3DCenter、Beyond3D披露,NVIDIA將有望在4月推出全新一代GeForce遊戲顯卡,不再使用目前遊戲顯卡廣泛應用的Pascal帕斯卡架構,也不是遊戲玩家期待的Tesla、Quadro、Titan等高性能計算產品所採用的Volta伏特架構