近日,英特爾公司宣布多項重要的技術進展,這也是英特爾多年來一直致力於通過統一的軟體體驗打造跨架構解決方案的又一裡程碑。其中,英特爾oneAPI Gold工具包將於今年12月正式交付;英特爾軟體棧推出新功能,作為公司軟硬體聯合設計方法的一部分。同時,英特爾正式發布其首款數據中心獨立圖形顯卡。該伺服器GPU基於Xe-LP微架構,專為高密度、低時延的安卓雲遊戲和流媒體服務而設計。
英特爾高級副總裁、首席架構師兼架構、圖形與軟體部門總經理Raja Koduri表示:「今天是英特爾oneAPI和XPU宏大計劃的重要時刻。隨著oneAPI Gold版本的發布,開發者編程體驗將更加豐富,oneAPI不僅擁有開發者熟悉的CPU編程庫和工具,也包含矢量-矩陣-空間這種混合架構的編程庫和工具。同時,我們還推出了基於Xe-LP微架構的首款數據中心GPU,以滿足快速增長的雲遊戲和流媒體市場需求。」
重要性:隨著世界進入到數十億智能設備的時代,數據呈指數級增長,需要將重心從單獨的CPU轉移到跨CPU、GPU、FPGA和其他加速器的混合架構,英特爾將其稱為「XPU」願景。英特爾伺服器GPU的推出是英特爾在XPU時代擴展產品組合的最新一步。
這個計算時代也需要全面的軟體棧。通過英特爾oneAPI工具包,開發者能夠使用一種通用、開放且基於行業標準的編程模型訪問英特爾XPU。這不僅能夠釋放底層硬體的性能潛力,同時能降低軟體開發和維護成本,並且在部署加速計算方面,英特爾oneAPI工具包較在專用的、受限於特定廠商的方案風險更低。
英特爾推出oneAPI Gold工具包:英特爾oneAPI行業計劃在SuperComputing 2019大會上首次提出,這是英特爾為實現統一、簡化的跨架構編程模型所提出的願景:能夠提供毫不妥協的性能,不受限於單一廠商專用的代碼限制,且能實現原有代碼的集成。藉助oneAPI,開發者可以針對他們要解決的特定問題選擇最佳的加速器架構,且無需為新的架構和平臺再次重寫軟體。
英特爾oneAPI工具包充分利用了先進的硬體性能和指令,如用於CPU的英特爾AVX-512(高級矢量擴展)和英特爾深度學習加速(英特爾DL Boost),以及XPU獨有的功能。oneAPI工具包基於經受過長久考驗的英特爾開發者工具,為開發者提供熟悉的程式語言和標準,同時與現有代碼保持完全的連續性。
今天,英特爾宣布,英特爾oneAPI Gold工具包將於12月在本地和英特爾DevCloud上免費提供,同時還將提供包含英特爾技術諮詢工程師全球支持的商業版本。英特爾還會將英特爾Parallel Studio XE和英特爾System Studio工具套件遷移到oneAPI產品中。
此外,英特爾DevCloud平臺可供開發者在各種英特爾架構上測試代碼和工作負載,現已增加了新的英特爾銳炬Xe GPU硬體。英特爾銳炬Xe MAX 圖形顯卡現在也可供公開訪問;同時,Intel Xe -HP已開放給特定的開發者使用。
oneAPI得到了業界的支持,近期微軟Azure和谷歌的TensorFlow已經宣布支持oneAPI;眾多領先的研究機構、公司和大學也支持oneAPI。
oneAPI生態合作夥伴
除此之外,伊利諾伊大學香檳分校的貝克曼高級科學技術研究所今天宣布,將建立一個新的oneAPI卓越中心(CoE)。他們正在使用oneAPI編程模型將生命科學應用程式NAMD擴展到其他計算環境。NAMD能夠模擬大型生物分子系統,正在幫助解決諸如COVID-19這樣的全球性挑戰。這個卓越中心將和研究GROMACS的斯德哥爾摩大學(SERC)卓越中心,以及海德堡大學(URZ)卓越中心一道,共同研究如何為其它廠商的GPU提供oneAPI支持。
關於英特爾全新伺服器GPU:通過首款面向數據中心的獨顯產品,英特爾在增強雲遊戲與媒體體驗方面進一步擴展了豐富的平臺級創新。利用英特爾至強可擴展處理器與全新英特爾伺服器GPU的組合,加之開源和授權的英特爾軟體組件,即可以較低的總體擁有成本(TCO),為安卓雲遊戲以及OTT實時視頻直播的高密度媒體轉編碼提供高密度、低時延的解決方案。
英特爾伺服器GPU採用英特爾能效最高的圖形架構——英特爾Xe-LP微架構,擁有低功耗、獨立片上系統設計,並配備128比特管道和8GB專用板載低功耗DDR4顯存。
英特爾伺服器GPU
通過將英特爾伺服器GPU和英特爾至強可擴展處理器強強聯合,服務提供商可在不改變伺服器數量的情況下,單獨擴展顯卡容量,以在每個系統上支持更多流和訂閱用戶,並同時實現較低的總體擁有成本(TCO)。通過新華三XG310 X16 PCIe3.0 GPU擴展卡——在3/4長、全高尺寸內封裝四顆英特爾伺服器GPU晶片,即可在一個典型雙卡系統中支持超過100個安卓雲遊戲並發用戶。這一數量最高可擴展至160個並發用戶,實際數量取決於具體的遊戲和伺服器配置。開發人員可利用目前Media SDK中的通用API,這一API也將於明年遷移到oneAPI視頻處理庫當中。目前,英特爾正在與包括Gamestream、騰訊和Ubitus在內的諸多軟體和服務合作夥伴合作,共同將英特爾伺服器GPU推向市場。
新華三XG310 PCIe GPU擴展卡
騰訊先遊雲遊戲助理總經理方亮表示:「英特爾是我們安卓雲遊戲解決方案上非常重要的合作夥伴。英特爾至強可擴展處理器和英特爾伺服器GPU,打造了一個高密度、低時延、低功耗、低TCO的解決方案,讓我們能夠在每臺雙卡伺服器上生成超過100個遊戲實例,諸如《王者榮耀》、《傳說對決》。」
基於Xe-LP微架構的英特爾伺服器GPU目前正在發貨。與近期推出的英特爾銳炬XeMAX獨顯一道,該GPU將隨著英特爾Xe架構產品和軟體計劃的不斷深入發展進一步為全球用戶提升視覺計算體驗。
英特爾圖形軟體更新:英特爾將GPU從入門級圖形顯卡擴展到高性能計算(HPC)的核心策略之一,就在於實施同一套代碼庫。為了實現這一目標,英特爾的軟體堆棧現在支持多代圖形顯卡,包括最近發布的第11代英特爾酷睿移動處理器集成的銳炬Xe顯卡和英特爾銳炬Xe MAX獨立顯卡。擴展代碼庫以支持Linux更為普遍的數據中心產品,是可擴展的Xe架構策略的下一個關鍵步驟。英特爾對Linux驅動程序進行了優化,將重點放在作業系統之間的代碼重用,並進一步關注Linux 3D性能,目前提供了三個經過充分驗證和集成的發行版堆棧。
英特爾今天宣布,英特爾創建了Project Flipfast來提升在Linux作業系統上的遊戲體驗。Flipfast棧可以允許終端用戶在虛擬機上運行圖形應用,同時通過虛擬機和主機之間的零拷貝共享來保持本機GPU性能和主機集成完整性。Flipfast棧驅動器可提升遊戲性能,該技術將可直接用於數據中心遊戲流應用程式。
英特爾還宣布,英特爾隱式SPMD程序編譯器(ISPC)將在底層硬體接口oneAPI零級別(Level Zero)之上運行。oneAPI零級別是整個硬體抽象層,為oneAPI平臺中的設備量身定製,提供底層的、直接到硬體的接口。由oneAPI支持的ISPC是C程式語言的一種變體,支持單程序、多數據編程,用於在英特爾CPU上加速英特爾Osray光線追蹤引擎。英特爾為ISPC增加了Xe支持,以無縫加速英特爾oneAPI渲染工具包組件(如Osray)。
下一步計劃:11月12日至13日,在線上舉行的oneAPI開發者峰會上,創新者、研究人員和開發人員將展示40個使用oneAPI的合作和項目。主題涉及從COVID-19的藥物再利用測試,到作物產量預測等等。在本周開始的SuperComputing 2020上,英特爾與業界領袖和研究機構將通過主題演講、技術會議、爐邊對話、演示和其他活動,重點介紹oneAPI應用和英特爾oneAPI工具。有關英特爾在SuperComputing 2020上活動的完整信息,請訪問intel.com。
英特爾oneAPI和圖形軟體棧的更新,以及英特爾伺服器GPU的推出,標誌著英特爾向XPU架構時代邁出裡程碑式的一步。基於英特爾六大技術支柱創新以及異構架構,並通過oneAPI中基於開放標準的統一可擴展軟體抽象層來實現,這些進展為更佳的體驗奠定了堅實基礎。