攜oneAPI Gold版本和伺服器GPU 英特爾領先業界進入XPU時代

2020-12-15 中國經濟網

  英特爾公司今日宣布多項重要的技術進展,這也是英特爾多年來一直致力於通過統一的軟體體驗打造跨架構解決方案的又一裡程碑。其中,英特爾? oneAPI Gold工具包將於今年12月正式交付;英特爾軟體棧推出新功能,作為公司軟硬體聯合設計方法的一部分。同時,英特爾正式發布其首款數據中心獨立圖形顯卡。該伺服器GPU基於Xe-LP微架構,專為高密度、低時延的安卓雲遊戲和流媒體服務而設計。

  英特爾高級副總裁、首席架構師兼架構、圖形與軟體部門總經理Raja Koduri表示:「今天是英特爾oneAPI和XPU宏大計劃的重要時刻。隨著oneAPI Gold版本的發布,開發者編程體驗將更加豐富,oneAPI不僅擁有開發者熟悉的CPU編程庫和工具,也包含矢量-矩陣-空間這種混合架構的編程庫和工具。同時,我們還推出了基於Xe-LP微架構的首款數據中心GPU,以滿足快速增長的雲遊戲和流媒體市場需求。」

  重要性:隨著世界進入到數十億智能設備的時代,數據呈指數級增長,需要將重心從單獨的CPU轉移到跨CPU、GPU、FPGA和其他加速器的混合架構,英特爾將其稱為「XPU」願景。英特爾?伺服器GPU的推出是英特爾在XPU時代擴展產品組合的最新一步。

  這個計算時代也需要全面的軟體棧。通過英特爾oneAPI工具包,開發者能夠使用一種通用、開放且基於行業標準的編程模型訪問英特爾XPU。這不僅能夠釋放底層硬體的性能潛力,同時能降低軟體開發和維護成本,並且在部署加速計算方面,英特爾? oneAPI工具包較在專用的、受限於特定廠商的方案風險更低。

  英特爾推出oneAPI Gold工具包:英特爾oneAPI行業計劃在SuperComputing 2019大會上首次提出,這是英特爾為實現統一、簡化的跨架構編程模型所提出的願景:能夠提供毫不妥協的性能,不受限於單一廠商專用的代碼限制,且能實現原有代碼的集成。藉助oneAPI,開發者可以針對他們要解決的特定問題選擇最佳的加速器架構,且無需為新的架構和平臺再次重寫軟體。

  英特爾oneAPI工具包充分利用了先進的硬體性能和指令,如用於CPU的英特爾?AVX-512(高級矢量擴展)和英特爾?深度學習加速(英特爾? DL Boost),以及XPU獨有的功能。oneAPI工具包基於經受過長久考驗的英特爾開發者工具,為開發者提供熟悉的程式語言和標準,同時與現有代碼保持完全的連續性。

  今天,英特爾宣布,英特爾oneAPI Gold工具包將於12月在本地和英特爾DevCloud上免費提供,同時還將提供包含英特爾技術諮詢工程師全球支持的商業版本。英特爾還會將英特爾?Parallel Studio XE和英特爾?System Studio工具套件遷移到oneAPI產品中。

  此外,英特爾DevCloud平臺可供開發者在各種英特爾架構上測試代碼和工作負載,現已增加了新的英特爾?銳炬? Xe GPU硬體。英特爾銳炬Xe MAX 圖形顯卡現在也可供公開訪問;同時,Intel Xe -HP已開放給特定的開發者使用。

  oneAPI得到了業界的支持,近期微軟Azure和谷歌的TensorFlow已經宣布支持oneAPI;眾多領先的研究機構、公司和大學也支持oneAPI。

  圖註:oneAPI生態合作夥伴

  除此之外,伊利諾伊大學香檳分校的貝克曼高級科學技術研究所今天宣布,將建立一個新的oneAPI卓越中心(CoE)。他們正在使用oneAPI編程模型將生命科學應用程式NAMD擴展到其他計算環境。NAMD能夠模擬大型生物分子系統,正在幫助解決諸如COVID-19這樣的全球性挑戰。這個卓越中心將和研究GROMACS的斯德哥爾摩大學(SERC)卓越中心,以及海德堡大學(URZ)卓越中心一道,共同研究如何為其它廠商的GPU提供oneAPI支持。

  關於英特爾全新伺服器GPU:通過首款面向數據中心的獨顯產品,英特爾在增強雲遊戲與媒體體驗方面進一步擴展了豐富的平臺級創新。利用英特爾?至強?可擴展處理器與全新英特爾伺服器GPU的組合,加之開源和授權的英特爾軟體組件,即可以較低的總體擁有成本(TCO)①,為安卓雲遊戲以及OTT實時視頻直播的高密度媒體轉編碼提供高密度、低時延的解決方案。

  英特爾伺服器GPU採用英特爾能效最高的圖形架構——英特爾Xe-LP微架構,擁有低功耗、獨立片上系統設計,並配備128比特管道和8GB專用板載低功耗DDR4顯存。

  圖註:英特爾伺服器GPU

  通過將英特爾伺服器GPU和英特爾? 至強? 可擴展處理器強強聯合,服務提供商可在不改變伺服器數量的情況下,單獨擴展顯卡容量,以在每個系統上支持更多流和訂閱用戶,並同時實現較低的總體擁有成本(TCO)。通過新華三XG310 X16 PCIe3.0 GPU擴展卡——在3/4長、全高尺寸內封裝四顆英特爾伺服器GPU晶片,即可在一個典型雙卡系統中支持超過100個安卓雲遊戲並發用戶。這一數量最高可擴展至160個並發用戶,實際數量取決於具體的遊戲和伺服器配置②。開發人員可利用目前Media SDK中的通用API,這一API也將於明年遷移到oneAPI視頻處理庫當中。目前,英特爾正在與包括Gamestream、騰訊和Ubitus在內的諸多軟體和服務合作夥伴合作,共同將英特爾伺服器GPU推向市場。

  圖註:新華三XG310 PCIe GPU擴展卡

  騰訊先遊雲遊戲助理總經理方亮表示:「英特爾是我們安卓雲遊戲解決方案上非常重要的合作夥伴。英特爾至強可擴展處理器和英特爾伺服器GPU,打造了一個高密度、低時延、低功耗、低TCO的解決方案,讓我們能夠在每臺雙卡伺服器上生成超過100個遊戲實例,諸如《王者榮耀》、《傳說對決》。」

  基於Xe-LP微架構的英特爾伺服器GPU目前正在發貨。與近期推出的英特爾?銳炬? Xe MAX獨顯一道,該GPU將隨著英特爾Xe架構產品和軟體計劃的不斷深入發展進一步為全球用戶提升視覺計算體驗。

  英特爾?圖形軟體更新:英特爾將GPU從入門級圖形顯卡擴展到高性能計算(HPC)的核心策略之一,就在於實施同一套代碼庫。為了實現這一目標,英特爾的軟體堆棧現在支持多代圖形顯卡,包括最近發布的第11代英特爾?酷睿?移動處理器集成的銳炬Xe顯卡和英特爾銳炬Xe MAX獨立顯卡。擴展代碼庫以支持Linux更為普遍的數據中心產品,是可擴展的Xe架構策略的下一個關鍵步驟。英特爾對Linux驅動程序進行了優化,將重點放在作業系統之間的代碼重用,並進一步關注Linux 3D性能,目前提供了三個經過充分驗證和集成的發行版堆棧。

  英特爾今天宣布,英特爾創建了Project Flipfast來提升在Linux作業系統上的遊戲體驗。Flipfast棧可以允許終端用戶在虛擬機上運行圖形應用,同時通過虛擬機和主機之間的零拷貝共享來保持本機GPU性能和主機集成完整性。Flipfast棧驅動器可提升遊戲性能,該技術將可直接用於數據中心遊戲流應用程式。

  英特爾今天還宣布,英特爾?隱式SPMD程序編譯器(ISPC)將在底層硬體接口oneAPI零級別(Level Zero)之上運行。 oneAPI零級別是整個硬體抽象層,為oneAPI平臺中的設備量身定製,提供底層的、直接到硬體的接口。 由oneAPI支持的ISPC是C程式語言的一種變體,支持單程序、多數據編程,用於在英特爾CPU上加速英特爾?Osray光線追蹤引擎。英特爾為ISPC增加了Xe支持,以無縫加速英特爾oneAPI渲染工具包組件(如Osray)。

  下一步計劃:11月12日至13日,在線上舉行的oneAPI開發者峰會上,創新者、研究人員和開發人員將展示40個使用oneAPI的合作和項目。主題涉及從COVID-19的藥物再利用測試,到作物產量預測等等。在本周開始的SuperComputing 2020上,英特爾與業界領袖和研究機構將通過主題演講、技術會議、爐邊對話、演示和其他活動,重點介紹oneAPI應用和英特爾oneAPI工具。有關英特爾在SuperComputing 2020上活動的完整信息,請訪問intel.com。

  英特爾oneAPI和圖形軟體棧的更新,以及英特爾伺服器GPU的推出,標誌著英特爾向XPU架構時代邁出裡程碑式的一步。基於英特爾六大技術支柱創新以及異構架構,並通過oneAPI中基於開放標準的統一可擴展軟體抽象層來實現,這些進展為更佳的體驗奠定了堅實基礎。

  ①總體擁有成本(TCO)分析基於英特爾內部研究。截至2020年10月1日的價格。分析假設標準伺服器定價,GPU列表定價和軟體定價基於預估的Nvidia軟體許可成本,即5年內每年1美元。

  ②性能可能因特定遊戲名稱和伺服器配置而異。欲參考英特爾伺服器GPU平臺評測的完整列表,請參閱Intel.com上的該頁面。

  性能因使用、配置和其他因素而異。更多信息請訪問 www.intel.com/PerformanceIndex 。

  所有產品計劃和路線圖可能隨時更改,不另行通知。

  英特爾技術可能需要支持的硬體、特定軟體或服務激活。

  任何產品或組件都無法提供絕對的安全性。

  成本和結果可能有所差異。

  英特爾不控制或審核第三方數據。請諮詢其他資源以評估準確性。

  所有產品計劃和路線圖可能隨時更改,不另行通知。

  本文稿中涉及業務前景、未來計劃和期望的陳述是前瞻性陳述,涉及許多風險和不確定性。諸如「預期」、「期望」、「意圖」、「目標」、「計劃」、「相信」、「尋求」、「估計」、「持續」、「可能」、「將」、「應」之類的語句或與之類似的表述均代表前瞻性陳述。參考或基於預測、不確定事件或假設的陳述,包括與未來產品和技術有關的陳述,以及此類產品和技術的預期可獲得性與收益,也被認定為前瞻性陳述。除非指出了較早的日期,本文中包含的所有前瞻性陳述均基於管理層截至本文發布之日的預期,前瞻性陳述涉及若干風險和不確定性,可能會導致實際結果與這些陳述出現根本性不同。英特爾2020年10月22日發布的收益報告中闡明了可能導致實際結果與公司預期產生根本性不同的重要因素,此類因素均在英特爾提交給美國證券交易委員會(SEC)的8-K 報告中有詳述,包括公司最近的 10-K與10-Q 表格。欲獲取 10-K、10-Q 表格和 8-K 報告,請訪問英特爾投資者關係網站 www.intc.com或美國證券交易委員會的網站獲取。

  除非指出了較早的日期,本次活動所涉及的所有信息均基於管理層截至本文發布之日的預期。除相關適用法律要求之外,英特爾不承擔更新任何陳述以反映未來事件或情況的義務。

相關焦點

  • 英特爾加速實現XPU願景:發布oneAPI Gold版本和英特爾伺服器GPU
    隨著oneAPI Gold版本的發布,開發者編程體驗將更加豐富,oneAPI不僅擁有開發者熟悉的CPU編程庫和工具,也包含矢量-矩陣-空間這種混合架構的編程庫和工具。同時,我們還推出了基於Xe-LP微架構的首款數據中心GPU,以滿足快速增長的雲遊戲和流媒體市場需求。」
  • 英特爾正式發布其全新伺服器GPU 率先定義XPU時代
    同時,英特爾還宣布將於12月正式交付相應的軟體堆棧oneAPI Gold工具。英特爾此次同時推出了全新伺服器GPU和oneAPI軟體,意味著英特爾開始釋放XPU的強大實力。另外,如果將英特爾伺服器GPU同英特爾至強可擴展處理器組合,服務提供商可以在不改變伺服器數量的情況下,單獨擴展顯卡容量,得以在每個系統上支持更多流和訂閱用戶,並且同時實現較低的總體擁有成本(TCO)。通過在新華三3/4長、全高的x16 PCIe 3.0擴展卡內封裝四個英特爾伺服器GPU,即可在一個典型雙卡系統中支持超過100個安卓雲遊戲並發用戶。
  • 「芯視野」從CPU到XPU 英特爾如何藉助oneAPI破框?
    在完成對FPGA廠商Altera收購之後,英特爾馬不停蹄提出了奧德賽計劃,在時隔二十多年後將真正意義上的獨立顯卡產品,重新提上議程,並催生了Xe系列架構。如果說英特爾只是希望進入鬥爭早已進入白熱化的NVIDIA、AMD獨立GPU市場,未免有些膚淺。
  • 英特爾正式打入雲遊戲市場,首款伺服器GPU重磅亮相
    隨著oneAPI Gold版本的發布,開發者編程體驗將更加豐富,oneAPI不僅擁有開發者熟悉的CPU編程庫和工具,也包含矢量-矩陣-空間這種混合架構的編程庫和工具。同時,我們還推出了基於Xe-LP微架構的首款數據中心GPU,以滿足快速增長的雲遊戲和流媒體市場需求。」
  • 英特爾為 XPU 軟體開發推出 oneAPI 工具包正式版本
    IT之家12月11日消息 英特爾於 12 月 9 日發布了 oneAPI 工具包正式版,即 11 月宣布將推出的英特爾 oneAPI Gold 版本,將用於為英特爾 CPU、GPU 和 FPGA 等(統稱為 XPU)開發跨架構應用程式。
  • 英特爾Xe架構迎來重要進展:首款伺服器獨顯發布
    重要性:隨著世界進入到數十億智能設備的時代,數據呈指數級增長,需要將重心從單獨的CPU轉移到跨CPU、GPU、FPGA和其他加速器的混合架構,英特爾將其稱為「XPU」願景。英特爾伺服器GPU的推出是英特爾在XPU時代擴展產品組合的最新一步。這個計算時代也需要全面的軟體棧。通過英特爾oneAPI工具包,開發者能夠使用一種通用、開放且基於行業標準的編程模型訪問英特爾XPU。
  • 英特爾最強工具包oneAPI Gold交付,為下一個十年鋪路
    從 1971 年製造出第一顆處理器開始,英特爾開始引領摩爾定律發展,在 PC 時代奠定霸主地位,迅速成為全球最大的半導體晶片製造商,對待變局,這家巨頭企業可能要比其他任何公司都敏銳和最先感知。下一個十年,在穩固 CPU 市場競爭力的基礎上,英特爾更大的一盤棋在於 「XPU」,其目標是重新衡量電晶體縮小和 CPU 的發展以外的技術路線,重點在於滿足智能設備時代,數據計算指數級增長的需求,而硬體布局也早已從單獨的 CPU 拓展到跨 CPU、GPU、FPGA 和其他加速器的混合架構。
  • 英特爾矽光子迎來重要技術突破:將光互連引入伺服器和封裝
    今天,在英特爾研究院開放日上,英特爾著重闡述了其業界領先的技術進步,向實現將光子與低成本、大容量的矽晶片進行集成的長期願景又邁進了一步。英特爾展示了包括微型化在內的關鍵技術構建模塊的多項進展,為光學和矽技術的更緊密集成奠定了堅實基礎。英特爾資深首席工程師,英特爾研究院PHY 研究實驗室主任James Jaussi 表示:「我們正在靠近I/O功耗牆(Power Wall)和I/O帶寬鴻溝,這將嚴重阻礙性能擴展。
  • 「重壓」之下,英特爾在蘋果自研筆電晶片亮相同日發布一款顯卡
    像是一種回應,英特爾於北京時間 11 月 11 日晚些時候發布了一款用於數據中心的 GPU 產品(代號 SG1)和 oneAPI Gold 版本。而就在同一天的十幾個小時以前,蘋果全新的自研 SoC M1 亮相,正式替換掉了英特爾 X86 CPU,媒體對其一片唱衰之聲。
  • 英特爾7納米晶片發布時間推遲到2022年
    在今年 4 月舉辦的 2020 英特爾中國年度戰略分享會上,英特爾宣布其晶片工藝提升速度已經全面恢復,「2020 年 10 納米製程全面鋪開,2021 年進入 7 納米時代」。然而,就在剛剛,英特爾宣布由於 7 納米製程遇到問題,7 納米晶片發布時間推遲,最早將於 2022 年問世,也可能推遲到 2023 年。
  • 騰訊發布首款自研GPU伺服器:16卡GPU 業界最高密度
    12月20日,騰訊雲發布了星星海首款自研GPU伺服器,在性能、能效、安全特性、可靠性等層面進行了大膽的自主創新和突破。本文引用地址:http://www.eepw.com.cn/article/202012/421439.htm在設計上,星星海首款自研GPU伺服器全球首創在同一框架內,靈活更換主板,支持多平臺兼容,使得業務在面對GPU選擇時更廣泛。
  • 構建平臺,英特爾Xeon GOLD 6226R開啟保險雲時代
    藉助英特爾Xeon GOLD 6226R工作負載優化性能和先進的可靠性,可以實現最高內存速度、容量和互聯性,全面優化整體解決方案的關鍵能力與性價比,幫用戶重塑系統架構,提升系統在處理能力、可靠性、可擴展性以及部署敏捷性等方面的全維度能力。
  • 英特爾首提「集成光電」願景:重構數據中心網絡和架構,打破I/O功耗牆
    ,英特爾著重闡述了其業界領先的技術進步,向實現將光子與低成本、大容量的矽晶片進行集成的長期願景又邁進了一步。英特爾展示了包括微型化在內的關鍵技術構建模塊的多項進展,為光學和矽技術的更緊密集成奠定了堅實基礎。英特爾資深首席工程師,英特爾研究院PHY 研究實驗室主任James Jaussi 表示:「我們正在靠近I/O功耗牆(Power Wall)和I/O帶寬鴻溝,這將嚴重阻礙性能擴展。英特爾在集成光電技術方面所取得的快速進展,將讓業界能夠重新構想通過光來連接的數據中心網絡和架構。
  • 鵝廠發布首款自研GPU伺服器,為何能讓科技圈炸鍋?
    科技圈一直盛行討論哪家技術強,有人說華為、有人說百度,但對於阿里和騰訊,不少人持保留態度,認為一個只懂「運營」,另一個只有「產品」,實際上阿里和騰訊的技術時常能夠帶給人們驚喜。近日,鵝廠傳來的一個消息,就讓半個「科技圈」沸騰了。
  • 英特爾CES重申三大組合拳:領先產品、平臺創新和高增長領域
    計算機不再只是PC或伺服器。現在它還存在於網絡、醫院、城市,甚至汽車之中。」這是英特爾對於這一智能變革時代的最佳註解,在CES 2021上,這家高科技公司"亮劍「數十款新產品,意圖通過三大矩陣組合拳,贏得在PC市場上的創新和高速增長。
  • 英特爾在數據中心的集成光子學方面取得了進展,已沉浸在矽光子學...
    日前,在 "Intel Labs Day "上,英特爾介紹了在推動數據中心集成光子學方面的進度,強調了自身在業界領先的技術進展,以及實現公司長期以來將光子學與低成本、大批量的矽集成生產相整合的願景。英特爾展示了包括小型化在內的關鍵技術構件方面的進展,為更緊密地整合光學和矽技術鋪平了道路。英特爾實驗室高級首席工程師兼PHY實驗室主任James Jaussi表示:"我們正在接近I/O電源牆和I/O帶寬缺口,這將極大地阻礙性能擴展。英特爾在集成光子學方面取得的快速進展將使業界能夠全面重塑由光連接的數據中心網絡和架構。
  • 深度分析英特爾Xe GPU戰略
    比如,高並行的GPU能為人工智慧、深度學習(DL)/機器學習( ML)應用程式提供支持,但往往需要在傳統的遊戲和ProViz數據格式之外,獲取額外的數據格式支持。雲端遊戲顯卡和伺服器端圖形渲染應用專為遊戲打造,但是這類顯卡並非數據中心的最佳選擇。若想成為顯卡領跑者,英特爾必須開發全系列的顯卡,涵蓋傳統用途、HPC和新興應用場景。而這項任務的艱巨性無需多言。
  • 出售快閃記憶體的英特爾,存儲業務依然「風騷」
    不過,出售NAND快閃記憶體業務的英特爾依然在內存存儲日上展示了自己的NAND實力水平,推出了3款業界領先的全新NAND SSD,包括英特爾固態盤670p、英特爾固態盤D7-P5510以及英特爾固態盤D5-P5316,這三款NAND SSD都是採用了144層存儲單元,但面向不同的使用場景。
  • tensorflow2.1對應 GPU版本的安裝與卸載
    __version__如下圖:二、CUDA的安裝安裝cuda的版本 是根據tensorflow的版本來確定的https://developer.nvidia.com/cuda-downloads一般 2.0 tf對應10.0的cuda,2.1 tf對應10.1的cuda版本,請選擇合適的版本,本例中選擇version 10.1cuda的安裝過程
  • 亞馬遜和蘋果正在推動英特爾晶片的轉變
    這一變化是由蘋果和亞馬遜這兩個技術巨頭推動的,這兩個龐然大物削減了它們對英特爾晶片技術的依賴,該晶片技術長期以來一直控制著大多數個人計算機和大型伺服器系統。取而代之的是,這些公司越來越依賴採用英國公司Arm許可用於智慧型手機和其他消費產品的技術設計的自有晶片。蘋果在上個月推出了首次使用自己的基於Arm的晶片的Mac計算機時就大肆抨擊。