軟體優化可將CPU性能提升28倍 Intel詳解OneAPI戰略-Intel,優化...

2020-11-24 驅動之家

在日前的SC 19大會上,Intel發布了全新的Xe架構GPU及多款10nm產品,這是Intel應對未來HPC高性能計算的關鍵。與此同時,Intel還正式宣布了OneAPI統一編程模型,它可能不被DIY玩家熟悉,但這很有可能會改變未來十年各種XPU晶片的發展。

有很多人不知道,Intel不僅是全球最大的CPU晶片公司,其軟體開發能力也非常強大,軟體工程師就有超過1.5萬人,還是Linux Kernel的最大貢獻者,每年修改的代碼超過50萬行,為100多個作業系統做優化。

在CPU及其他晶片開發上,Intel會越來越重視軟體優化的能力,提出六大技術支柱的高級副總Raja Koduri之前表態稱「全新的硬體架構每一個數量級的性能提升,軟體就能帶來兩個數量級的性能提升。」

根據Raja Koudri所說,Intel通過軟體優化,可以給Java帶來6倍的性能提升,給持久性內存帶來8倍的性能升級,在AI領域帶來28倍的性能提升,並且,這是在相同的硬體上通過軟體實現的提升。

在未來的晶片發展中,軟體優化的作用已經無需多言,所以OneAPI戰略對Intel來說也非常重要,因為它統一了各個平臺的編程規範,簡化了開發難度,有利於營造更好的開發生態

基於此,Intel知IN官微發布了一篇名為《英特爾oneAPI:定義未來十年應用程式開發的統一、簡化的編程模型》的長文,詳細介紹了OneAPI的作用及內容,想要了解的玩家可以看看。

以下是全文詳細內容:

oneAPI是什麼?

oneAPI是一個統一的、簡化的編程模型,旨在簡化跨多架構的開發過程(如CPU、GPU、FPGA、加速器)。oneAPI包含兩個組成部分:一項產業計劃和一款英特爾®beta產品,都是全新探索的第一步。

oneAPI計劃的跨架構開發模型基於行業標準和開放規範,支持廣泛的行業生態系統採納該技術來推動應用開發領域的新演進。

英特爾®oneAPI beta產品是英特爾基於oneAPI的實現,它包括了oneAPI標準組件如直接編程工具(Data Parallel C++)、含有一系列性能庫的基於API的編程工具,以及先進的分析、調試工具等組件。開發人員從現在開始就可以在英特爾DevCloud for oneAPI上對基於多種英特爾架構(包括英特爾至強®可擴展處理器、帶集成顯卡的英特爾酷睿™處理器、英特爾FPGA如英特爾Arria®、Stratix®等)的代碼和應用進行測試。這一進展源自於英特爾數百萬小時軟體工程開發的努力,旨在為全球開發人員提供一座從現有代碼和技能過渡到即將來臨的xPU時代的橋梁。

oneAPI為何重要?

oneAPI是英特爾「軟體先行」戰略的重要體現,英特爾相信這一戰略將定義和引領一個人工智慧日益融合、異構及多架構的編程時代。

跨架構(CPU、GPU、FPGA及其他加速器)開發能力對於處理數據密集型工作負載極為重要,因為這種工作負載需要多種架構,這也將成為未來的常態。在今天,每一個硬體平臺往往需要開發者維護獨立的代碼庫,這些代碼庫需要使用不同的語言、庫和軟體工具進行編程。這是一項極其複雜和耗費時間的工作,會大大降低開發速度、抑制創新。

為了解決這一難題,oneAPI提供一個通用、開放的編程體驗,讓開發者可以自由選擇架構,無需在性能上作出妥協,也大大降低了使用不同的代碼庫、程式語言、編程工具和工作流程所帶來的複雜性。相對於今天的基於單個廠商的封閉式編程環境,oneAPI為開發者提供了極富競爭力、也更先進的可替代選擇,幫助他們在保留現有軟體投資的基礎上,搭建一座無縫連接的橋梁,從而為未來的多架構世界創造更多豐富的應用程式。

為什麼英特爾能夠應對這項挑戰?

英特爾已經深入開發者生態領域超過20年。英特爾擁有15000多名軟體工程師和10000項與客戶緊密合作的軟體部署,是Linux kernel最大的貢獻者,每年修改的代碼超過50萬行,為100多個作業系統進行過優化,並且擁有超過兩千萬活躍開發者的生態,而這些只是英特爾龐大的軟體實力的一部分。

英特爾跨基礎架構、網絡、作業系統的開發經驗,開發工具和SDK以及其所參與並影響的標準制定組織的數量在業界是無與倫比的。憑藉深耕行業多年的積累和英特爾軟體工程團隊數百萬個小時的努力,英特爾正通過創建一個統一的編程模型,推動開發普及化,簡化困難,為開發者創造一個更具移植性、更高效且性能更高的編程環境,來幫助開發者應對未來的挑戰。

為什麼需要一個開放式規範?

數十年以來,英特爾與包括ISO C++/Fortran Groups、OpenMP* ARB、MPI Forum、The Khronos Group在內的多個標準制定組織以及行業/學術組織攜手,希望通過開放協作的方式尋求一種可實現互操作性與互換性的產品規範,而oneAPI項目就是這一行動的延續。oneAPI將實現與現有行業標準的互操作性。

最新oneAPI規範可在oneAPI計劃官網oneapi.com查閱

oneAPI開放式規範包括哪些內容?

這一開放式規範包括一種跨架構的程式語言Data Parallel C++(DPC++)、一套用於API編程的函數庫以及底層硬體接口(oneAPI Level Zero)。有了這些組件,英特爾和其它企業就能創建他們自己的oneAPI實現來支持他們自己的產品,或基於oneAPI進行新產品開發。

Data Parallel C++是什麼?

DPC++是基於大眾熟悉的C和C++語言,專門為oneAPI設計的主要程式語言。它融合了來自Kronos Group的SYCL*,從而可以支持跨CPU和加速器上的數據並行和異構編程,目的是為了簡化編程以及提高代碼在不同硬體上的可重用性,同時能根據特定的加速器進行調優。

DPC++語言增強將會通過一個開發者社區項目來進行擴展,以簡化數據並行編程。該項目向公眾開放,並將通過開發者們的共同努力不斷發展。

oneAPI規範內容將會開源嗎?

很多庫和組件已經開源或即將開源。

請訪問oneapi.com查看詳細開源項

哪些公司將支持或參與oneAPI計劃?

截至11月17日,支持oneAPI概念的業內領先企業和研究機構已經超過30家,包括高性能計算領域的領導者、人工智慧領域的創新者、硬體廠商/OEM、獨立軟體開發商、雲服務商、高校等等。其中很多也積極參與了oneAPI beta版工具包的測試並提供反饋意見。

這項計劃剛剛啟動,英特爾預期未來幾年將會有更多參與方加入該計劃。企業在創建自己的oneAPI實現並完成自我認證後即可以使用全新oneAPI計劃品牌和標識。

不同的oneAPI Beta版工具包都包含了什麼?

英特爾 oneAPI 基礎工具包(Beta版)包含了一系列核心工具和庫,為構建和部署跨架構的高性能以數據為中心的應用而開發。它具體包含了oneAPI開放式規範技術(DPC++語言、特定領域的庫)和英特爾® Python*分發包來提供跨相關架構的即時加速,以及能增強分析、協助設計和調試等組件。

除英特爾oneAPI基礎工具包外,英特爾還提供其他針對高性能計算、人工智慧等專門工作負載的工具包,包括:

英特爾oneAPI高性能計算工具包(Beta版):幫助快速交付可擴展的C++、Fortran和OpenMP應用程式

英特爾oneAPI深度學習框架開發者工具包(Beta版):用於建立深度學習框架或對現有深度學習框架實現定製化

英特爾oneAPI渲染工具包(Beta版):用於開發高性能、高精度的可視化應用程式(包括科學可視化)

英特爾AI分析工具包(Beta版):由oneAPI提供技術支持,適用於人工智慧開發者和數據科學家,以更好地利用機器學習和深度學習模型來構建應用。

此外還有兩種oneAPI補充工具包:為系統工程師設計的英特爾系統Bring-Up 工具包以及面向深度學習推理和計算機視覺的生產場景的英特爾發行版 OpenVINO™ 工具開發包。

更多詳情請訪問:software.intel.com/oneapi

oneAPI支持哪些處理器和加速器?

oneAPI規範是為支持來自多個廠商的各種CPU和加速器而設計的。oneAPI Beta版目前支持英特爾CPU(英特爾至強®、酷睿™、凌動)、英特爾Arria FPGA以及作為未來獨立數據中心GPU代理開發平臺的第九代/英特爾核芯顯卡。oneAPI日後將支持更多英特爾加速器架構。

其它廠商的硬體與oneAPI兼容嗎?

oneAPI規範的DPC++語言和庫等都向公眾開放使用,我們也鼓勵其它硬體廠商使用。其它硬體廠商可以創建自己的oneAPI實現並基於此對特定硬體進行優化。

開發者可以通過哪些途徑獲取更多信息?

關於oneAPI計劃的更多信息可通過訪問oneAPI.com獲取。開發者可在英特爾開發人員專區(網址:software.intel.com/oneapi)下載英特爾 oneAPI 測試版工具包供本地使用,也可以通過英特爾 DevCloud for oneAPI平臺快速入門獲得對於oneAPI工具包的訪問,並使用它對多個以數據為中心的架構下的代碼和工作負載進行測試。該方式無需安裝和設置並節省時間,且在無需負擔開發平臺成本的情況下靈活嘗試不同的硬體。​​​​

相關焦點

  • cpu天梯圖2019年2月最新版 2019年2月cpu性能天梯圖排行
    cpu天梯圖2019年2月最新版 2019年2月cpu性能天梯圖排行 2019年2月18日 HuangJiang來源:pc6
  • Intel付得起xPU的巨額尾款嗎?
    eASIC與ASIC最大的不同之處就在於在客戶購買定製晶片後,還能夠通過重新編程將晶片不同部分重新連接從而完成新的任務。客戶可以使用FPGA創建設計將固定布局烘焙到單個設計掩模中,最終eASIC也將不再可編程,從而獲得近似ASIC的功耗性能。市場中還存在eFPGA這種產品,當然在使用上則會更靠近FPGA,主要是將ASIC進行片上連接,此處不進行詳細講解。
  • Intel的「霸道」:深究編譯器對CPU性能的影響-Intel,AMD,編譯器...
    Intel的「霸道」:深究編譯器對CPU性能的影響 2012-09-28 21:00:46     編輯:上方文Q[爆料]不同的Intel編譯器調度器版本在Intel i7處理器上有明顯性能提升,同樣在AMD FX處理器上也有明顯提升。458.sjeng測試語言:C負載類型:整數多線程:不支持sjeng是西洋棋軟體中使用的算法,來源於同名軟體。
  • 支持雙路CPU intel S2600CO4鄭州2050
    (中關村在線鄭州行情)intel S2600CO4是一款新推出的伺服器主板,該主板可支持雙路CPU,最大可支持512GB內存,性能強悍,目前intel S2600CO4伺服器主板在商家「鄭州明宇(伺服器專營) 」給出售價為2050元。感興趣的朋友不妨聯繫商家做進一步的了解。
  • 在處理器製程上,intel逐漸被臺積電趕超,背後的原因是什麼?
    而當TSMC服務的移動端市場的體量,與Intel服務的PC\伺服器端市場體量相比,前者要要高后者10倍的時候。你說高級人才的流動和現金流資本的流動會留向哪裡?是TSMC,還是Intel?而研發速度的此消彼長又會是怎樣?
  • 英特爾intel i3-10300追平i7-7700還是i7-7700再就業
    英特爾intel十代10th架構i5和i9被曝光,分別是6核心12線程6c12t和10核20線程10c20t。今天i3-10300也出現在UserBenchmark資料庫,4核心8線程4c8t,主頻3.7Ghz,最大睿頻4.2Ghz。
  • intel CPU後綴英文字母含義,簡單科普一下,想知道的趕緊看過來
    033、K後綴代表支持超頻且性能更好。K後綴代表可以超頻,凡是CPU帶K的後綴的CPU都可以解鎖倍頻,可以通過超頻來提升電腦的性能。intel從i7-2600K開始到現在的i9-10900K,帶K後綴的CPU都可以解鎖倍頻,可以自由調節。
  • 摩爾定律不死intel稱5nm已在規劃中
    記得去年的時候,業界普遍認為摩爾定律已死,因為intel原計劃於2016年在Cannonlake處理器中採用10nm工藝,小於Skylake晶片採用的14nm工藝,但之後intel卻調整了計劃,推出了現在正售的KabyLake,並沿用此前的14nm工藝,Cannonlake和10nm工藝雖然仍在計劃之中
  • 10分鐘看懂CPU構造原理
    終於,在投入了大研發後,工廠的廠房布局設計(架構)有了大改進,各部門之間的交通更便利了;並且,工廠也重新招聘短小精悍的工人(提升製程工藝),將以前那種牛高馬大,光吃不幹的大塊頭全部淘汰了。至此,同樣大的車間,能融入更多的工人幹活了,而且短小精悍的工人,吃的飯還少(功耗低)。
  • 早在2014年intel就將arm視為自己的強勁勁敵
    中國是全球最大的智能終端市場,2017年新增智能終端數量約280萬臺,預計到2020年將達4000萬臺。智能終端雲(arm)必然要佔據半壁江山。經過大幅升級後的智能終端普遍採用arm深度學習專用處理器,arm可以針對所有終端部署適合這一要求的深度學習處理器,並應用在所有終端上。隨著arm在雲端、終端以及個人終端用戶領域的持續發力,智能終端雲(arm)市場或將繼續迅猛增長。
  • 顯卡天梯圖4.30版本(含intel第十代酷睿核顯)
    新增intel第十代酷睿核顯和4.21版本相比,主要變化是新增了intel核顯的專屬位置。intel的高端核顯Iris plus G7已經能和Vega10一較高低了,跑分看起來也和低端獨顯接近了,但在一些遊戲中的表現會打折,具體參考解讀第三點。
  • 一起教育科技基於英特爾 技術優化 AI 口語測評平臺 賦能英語教學
    為提升基礎設施平臺對於海量業務的支撐能力,為師生提供更高效的智能口語測評服務,一起教育科技使用第二代英特爾 至強 可擴展處理器搭建了 AI 伺服器,顯著提升了性能表現,不僅能夠支撐億級日均調用量的需求,而且在總體擁有成本 (TCO) 方面具備出色優勢。
  • 突破intel十代酷睿官方限制,ASRock主板支持非K CPU超頻!
    ASRock主板在前幾篇文章中依依醬介紹過某些品牌的高端Z490主板在硬體層面上是支持PCIe 4.0的,但是由於intel十代酷睿本身的限制並不能Z490主板並能很好的原生支持,對此技嘉主板的廠商代表則表示下一代的intel
  • 運用Intel OpenVINO 自製自動駕駛車視覺系統
    OpenVINO除了可提供硬體加速外,更提供模型優化器(Model Optimizer)功能,可協助去除已訓練好的模型中的冗餘參數,並可將 32bits 浮點數的參數降階,以犧牲數個百分點正確率來換取推論速度提升數十倍到百倍。
  • 絕地求生大逃殺配置優化攻略 絕地求生優化軟體推薦
    本文這裡推薦的軟體叫做CPUCores,是steam官方發布的一款優化軟體,破解版下載地址:http://dl.3dmgame.com/201706/107326.html    這款原售價99塊的軟體的確是非常好使的,(想支持官方的去steam搜索CPUCores就能找到購買連結了)
  • 彩虹六號圍攻幀數最大化方法 優化電腦性能技巧圖文攻略
    系統,在任何Windows系統中 win10在遊戲方面對幀數提升巨大,特別是微軟也對win10增加了一個遊戲模式來提高性能 雖然並不多,開啟遊戲模式很簡單 快捷鍵win+G鍵在遊戲內打開即可,但在這之前建議調整自身電腦為高性能模式    2.軟體優化,眾多軟體也會幫助你調度電腦的自身性能,列如steam付費軟體cpu cores,對筆記本優化程度勝過主機,對多核cpu並沒有明顯提升,還要澄清一個誤區
  • _Intel伺服器CPU_伺服器評測...
    讓我們來看一下我們能否提取出一些要點:  ARM 將繼續在行動裝置領域中表現出色,而行動裝置中出現新作業系統和應用環境則是再正常不過的了。用戶無法運行臺式機應用,而且電池使用時間也非常重要。  但是,ARM 短期內在筆記本電腦或上網本領域難以取得重要斬獲。如果我需要一臺可移動的臺式機,我希望能使用所有現有軟體。
  • Intel:CPU核心數沒有那麼重要
    在這點上Intel採用原生架構的處理器沒法比了,主流桌面還是8核最多,至強處理器最多28核,不過Intel認為CPU核心數並不是唯一指標,而是從工作負載等角度來服務客戶Spelman表示,2020年Intel除了繼續推動二代至強可擴展處理器之外,還會推出第三代至強可擴展處理器,也就是代號Cooper Lake的14nm至強,將帶來全新的
  • 極速空間CPU天梯圖2019-4.1版(新增銳龍三代)
    銳龍三代(ZEN2將在今年上市),相比銳龍二代的提升很大,R5-3600X超點頻要打i7-9900K了,但是,即將發布的新的文章會給AMD灑點冷水。新文章預告: 《英雄遇」英雄「就變狗熊,銳龍全軍覆沒,抽絲剝繭找原因》,文章較長,敬請期待。
  • Intel i7-4790K超頻測試
    作為Intel近年來首款基礎頻率突破4.0GHz的CPU,它通過改善原有封裝及內部散熱介質來激發22納米真正的超頻潛力,現在Core i7-4790K已經抵達評測室,下面我們將為大家做一個詳細的性能測試。