英特爾最強工具包oneAPI Gold交付,為下一個十年鋪路

2020-12-20 DeepTech深科技

不少分析認為,2020 年,半導體行業局勢已發生微妙變化,英特爾正面臨著巨大外在挑戰。

今年,英偉達斥資 400 億美元收購 ARM,志在拓寬 GPU 之外的計算硬體體系;AMD 藉助臺積電 7 納米工藝推出了多款第三代處理器,與英特爾同期產品展開競爭激烈;而蘋果公司在筆記本電腦新品中,首次使用基於 ARM 架構的 5 納米自研晶片 「M1」,激發的連鎖市場反應變數增多。

從 1971 年製造出第一顆處理器開始,英特爾開始引領摩爾定律發展,在 PC 時代奠定霸主地位,迅速成為全球最大的半導體晶片製造商,對待變局,這家巨頭企業可能要比其他任何公司都敏銳和最先感知。

時代轉型之下變量正在激增,比如摩爾定律正在逼近極限,人工智慧、AIoT 發展邁向深水區,5G 通訊浪潮已經掀起,新的 「抓手」 會是什麼?

在日前的一次媒體溝通會上,英特爾架構、圖形和軟體集團副總裁兼中國區總經理謝曉清,以及英特爾大數據技術全球 CTO、大數據分析和人工智慧創新院院長戴金權,分享了英特爾正在打造的 「新利器」,最為關鍵的舉措便是 「XPU」 願景和 oneAPI 工具包,據悉,oneAPI Gold 工具包已於 12 月 9 日正式交付。

面對變量,英特爾的答案可能更傾向於重新定義一個半導體行業 「遊戲規則」,展開新維度的競爭,而最大的優勢是,它有這個定義能力。

底層硬體邏輯穩中求變

其實早在 2020 年 8 月份舉辦的架構日活動上,英特爾首席架構師拉賈科杜裡(Raja Koduri)就點明英特爾的新策略,重新梳理了競爭脈絡。

英特爾之所以能長期穩居寶座,很大程度上得益於其核心技術貫穿了晶片製程與封裝、XPU 架構、內存與存儲、互聯、安全、軟體等 6 大技術領域,形成協同效應,通過軟硬結合將每個電晶體的性能發揮到極限。

今年以來,英特爾在 7 納米及以下的先進位程推出上雖有延期,但其 「壓榨」 乾淨現有 10 納米晶片性能的方式仍不容小覷,其提出 10 納米 SuperFin 工藝,實現了該公司歷史上最大的單節點內部增強,提供了與全節點過渡相當的性能改進。

此外,英特爾還將下一代 Willow Cove CPU 架構與 10nm SuperFin 技術集成起來 ,形成全新的 Tiger Lake 平臺架構,這將取代上一代的 Ice Lake 微架構系列移動處理,讓 CPU 性能、圖形處理、AI 計算、內存帶寬、安全性能等方面實現系統性提升。

提到英特爾只能想到 CPU 處理器?這個認知是時候刷新一下了。

下一個十年,在穩固 CPU 市場競爭力的基礎上,英特爾更大的一盤棋在於 「XPU」,其目標是重新衡量電晶體縮小和 CPU 的發展以外的技術路線,重點在於滿足智能設備時代,數據計算指數級增長的需求,而硬體布局也早已從單獨的 CPU 拓展到跨 CPU、GPU、FPGA 和其他加速器的混合架構。

目前,英特爾的 GPU 和 FPGA 市場布局已初露鋒芒。2020 年 11 月,英特爾推出了銳炬 Xe MAX 獨立顯卡,用於輕薄筆記本電腦,相比配有第三方顯卡的同類筆記本電腦,可將基於人工智慧的創作速度提升 7 倍,而相比高端臺式機顯卡可將視頻編碼速度提升高達 1.78 倍。

英特爾 GPU 的競爭優勢在於能和英特爾 CPU 更好地協同,搭載其他獨立顯卡的輕薄筆記本電腦,很少對 CPU 進行性能優化,而英特爾銳炬 Xe MAX 獨立顯卡處於空閒狀態時,可將所有電源和散熱資源專門用於 CPU,在創作者持續實施任務(如執行高級渲染)時可將 CPU 性能提高多達 20%。

筆記本電腦 GPU 之外,英偉達還發布了其首款數據中心獨立圖形顯卡。該伺服器 GPU 基於 Xe-LP 微架構,搭配英特爾 至強 可擴展處理器,豐富的開源和授權的英特爾軟體組件,企業通過較低的總體擁有成本(TCO)即可實現高密度、低時延的雲遊戲或流媒體服務解決方案。

FPGA 方面,8 月份,英特爾推出的 AgilexFPGA 系列晶片,採用了異構 3D 系統級封裝(SiP)技術,搭配最新 10 納米工藝,可為數據中心、網絡和邊緣計算等應用提供高達 40% 的性能或功耗降低;11 月又陸續發布了可定製解決方案英特爾 eASIC N5X,以及最新的英特爾 開放式 FPGA 堆棧 (Intel OFS),這一切,都意在擴張在 5G、人工智慧、雲端與邊緣計算中的滲透率。

隨著市場競爭的日趨激烈,不少半導體科技巨頭的拓展可能會對英特爾的固有市場造成侵蝕,但從英特爾的布局押注來看,也早已謀劃好了如何對外擴張。

軟體先行,oneAPI 一統開發者生態

硬體體系擴張帶來最大的挑戰是,需要更全面的軟體棧,oneAPI 便是英特爾俘獲開發者喜愛的新大招。

智能計算場景下有很多痛點,例如每一類硬體平臺通常需要開發者維護獨立的代碼庫,以及需要使用不同的語言、庫和軟體工具進行編程,這是一項極其複雜和耗時的工作,大大阻礙了開發效率。開發者們已經對一種通用、開放且是行業標準的編程工具包期待已久,而制定一個新標準,這恰恰是英特爾過去幾十年所擅長的。

謝曉清表示,「oneAPI Gold 工具包會給開發者提供一個非常友好的編程環境,讓他們可以自由選擇硬體平臺,不必要用某一種語言就必須綁定在某一個硬體平臺上;其次,我們提供的編譯器、系統都是高度優化,所以可以實現最大的硬體性能,並且最優支持不同異構計算的硬體加速;第三,它的開發模式非常快速、高效,並且源碼的維護成本可以達到最低。」

具體而言,oneAPI 相當於是擴展了現有的開發人員編程模型,以通過數據並行語言,一組庫 API 和一個低級硬體接口來支持跨體系結構編程,從而支持多種硬體體系結構,在英特爾本身行業標準之上,提供了一個開放的,跨平臺的開發人員堆棧。

基於過去數十年的開發工具積累,英特爾開發出一種跨架構的程式語言 Data Parallel C++(DPC++)、以及用於 API 編程的函數庫以及底層硬體接口(oneAPI Level Zero),其它硬體廠商也能使用 oneAPI 實現對特定硬體進行優化。

正如我們所看到的,oneAPI 編程模式兼容性堪稱達到了歷史最強。目前在各個領域應用比較廣泛的高性能計算開發工具如 Fortran,在 AI 領域的 Python,以及像 OpenMP 這樣不同領域使用的語言都可以做到無縫對接,同時,oneAPI 也支持一些主流的 AI 工具包,包括 Hadoop、Spark、TensorFlow、PyTorch、PaddlePaddle、OpenVINO 等等,形成更適合人工智慧時代的軟體棧。

oneAPI 是英特爾 「軟體先行」 戰略一種體現,畢竟,展開硬體新布局之前,讓開發者愛上自己的工具乃至離不開這些工具的便捷性,是晶片製程、性能之外最重要的市場抓手。就目前官方提供的下載內容來看,除了跨平臺基礎開發套件之外,重點的工具也包括了高性能計算、物聯網和高級渲染層面的工具整合。

而英特爾的信心在於,從最早的計算機時代開始,開發者生態持續維護了 20 多年,並有 10000 項與客戶合作的軟體部署經驗,現在也是 Linux Kernel 最大的貢獻者,每年修改的代碼超過 50 萬行,為 100 多個作業系統進行過優化。

擁有 15000 多名軟體工程師英特爾,軟實力同樣強悍,在跨基礎架構、網絡、作業系統、開發工具和 SDK 以及其標準制定方面,廣泛應用和經驗積累造就了絕對的話語權。

上層應用小試牛刀

全新軟、硬體生態布局可讓英特爾的技術方案更有延展性,比如推動雲遊戲系統框架的優化。

據謝曉清介紹,英特爾最新發布的 GPU—SG1 能在整個安卓雲遊戲的框架上起到非常大的作用。它的圖形渲染能力以及多媒體編解碼能力,使得技術人員有可能利用獨立 GPU 把雲遊戲的圖形界面在雲端直接渲染,並且利用流媒體的方式,把它編碼之後直接發布到終端。

而在 CPU 端,英特爾把安卓用比較輕量級雲原生的技術,用容器化的技術把它跑到輕量級的容器當中,提供雲端協同的創新應用。值得一提的是,英特爾在安卓的框架層和運行層都做了非常多的優化,能使安卓容器化方案做到很高的密度,這些方案目前正在進行測試,可能會比較快的看到產品化的實現。

具體案例方面,騰訊基於 Intel 伺服器 GPU,在每臺雙卡伺服器上可生成 100 多個遊戲實例,已測試過比較熱門的遊戲包括《王者榮耀》、《傳說對決》等。

英特爾大數據技術全球 CTO、大數據分析和人工智慧創新院院長戴金權,則重點介紹了 oneAPI Gold 對 AI 軟體棧和軟體生態的推進。

在 XPU 和 oneAPI 軟硬體之上,新的技術體系可支持開發人員使用深度學習、機器學習、大數據等各種各樣的框架,包括 TensorFlow、PyTorch、MXNet、OpenVINO、Spark 等等,幫助開發者方便地將他們端到端的數據分析加上 AI 的解決方案給快速構建出來。

戴金權表示,AI 技術已經進入到了我們現實生活的各方各面,可用來提升商業效率、提高利潤、準確率等等,但對於在現實場景中需要把這些 AI 落地的開發人員來說,最大挑戰之一,是如何將 AI 算法應用到複雜的數據當中。

首先這個數據量非常大;其次,數據非常複雜,可能來自各個不同的地方,數據又在非常快速變化。

針對這些行業問題,英特爾去年 6 月在中國設立的大數據分析和人工智慧創新院,近期開源了一個端到端的大數據 + AI 軟體平臺:Analytics Zoo,開源地址可參考:https://github.com/intel-analytics/analytics-zoo

Analytics Zoo 在底層可提供端到端的數據流水線的能力,能夠幫助開發者直接無縫地將 AI 模型運行在其分布式大數據上;中間層可提供機器學習的工作流,目的是能夠將很多人工的作業、人工的任務變成自動化;在最上層,則能構建不同應用場景,快速開發例如推薦系統、時間序列分析、計算機視覺、以及自然語言處理等方面的應用。

結語

對於晶片巨頭來說,除了晶片納米製程的 PK,最關乎生存發展的可能便是強大的軟體開發者生態。

總體來看,經過幾十年的發展積澱,英特爾跨基礎架構、網絡、作業系統的開發經驗,在半導體行業中屈指可數,也是為數不多有能力重新定義未來應用程式開發方式的巨頭。在 XPU 產品版圖之上,oneAPI 作為英特爾 「軟體優先」 策略的一種體現,有望讓英特爾在日益融合、異構化及跨架構編程的人工智慧時代,更有市場把控力。

在很多開發者眼中,英偉達從十餘年前的瀕臨破產到人工智慧時代快速崛起,其開發的通用並行計算架構平臺 CUDA 絕對是核心殺器。而 oneAPI 對於現在的英特爾來說,有點異曲同工,XPU 和 oneAPI 軟硬結合的這盤棋變得更大,近年來,英特爾也面對著不少質疑聲,而讓自身不焦慮的方式是,或許就是把目光放遠到下一個十年的競爭維度上。

相關焦點

  • 英特爾繼續鞏固XPU+oneAPI戰略,發布首個伺服器GPU和oneAPI Gold...
    英特爾公司今日宣布多項重要的技術進展,這也是英特爾多年來一直致力於通過統一的軟體體驗打造跨架構解決方案的又一裡程碑。其中,英特爾® oneAPI Gold工具包將於今年12月正式交付;英特爾軟體棧推出新功能,作為公司軟硬體聯合設計方法的一部分。同時,英特爾正式發布其首款數據中心獨立圖形顯卡。
  • 英特爾為XPU軟體開發推出oneAPI工具包正式版本
    通信世界網消息(CWW)英特爾於12月09號發布了英特爾® oneAPI工具包的正式版本(即11月宣布將推出的英特爾oneAPI Gold版本),將用於為英特爾® CPU、GPU和FPGA等(統稱為XPU)開發高性能跨架構應用程式。
  • 英特爾為 XPU 軟體開發推出 oneAPI 工具包正式版本
    IT之家12月11日消息 英特爾於 12 月 9 日發布了 oneAPI 工具包正式版,即 11 月宣布將推出的英特爾 oneAPI Gold 版本,將用於為英特爾 CPU、GPU 和 FPGA 等(統稱為 XPU)開發跨架構應用程式。
  • 英特爾加速實現 XPU 願景:發布 oneAPI Gold 版本和英特爾伺服器 GPU
    英特爾公司今日宣布多項重要的技術進展,這也是英特爾多年來一直致力於通過統一的軟體體驗打造跨架構解決方案的又一裡程碑。其中,英特爾 ® oneAPI Gold 工具包將於今年 12 月正式交付;英特爾軟體棧推出新功能,作為公司軟硬體聯合設計方法的一部分。同時,英特爾正式發布其首款數據中心獨立圖形顯卡。
  • 英特爾oneAPI工具包正式版本發布,符合MPI和OpenMP等標準
    > 英特爾於12月09號發布了英特爾® oneAPI工具包的正式版本(即11月宣布將推出的英特爾oneAPI Gold版本),將用於為英特爾® CPU、GPU和FPGA等(統稱為XPU)開發高性能跨架構應用程式。
  • 英特爾發布 oneAPI 工具包正式版 包括編譯器、性能庫、分析等
    英特爾於 12 月 9 日發布了 oneAPI 工具包正式版,即 11 月宣布將推出的英特爾 oneAPI Gold 版本,將用於為英特爾 CPU、GPU 和 FPGA 等(統稱為 XPU)開發跨架構應用程式。
  • 英特爾推出 oneAPI 渲染工具包:擁有光線追蹤和渲染功能
    IT之家 8 月 27 日消息 根據英特爾官方的消息,在 SIGGRAPH 2020 會議上,英特爾發布了 oneAPI 渲染工具包的最新產品,英特爾表示該渲染工具包可為圖形與渲染行業帶來頂級的性能和保真度。
  • 英特爾優化OpenVINO工具包;Streamlit發布開源機器學習開發框架
    部分圖片與本文無關,只為方便讀者理解,關注我們每天閱讀更多精彩內容】1.【今日資訊頭條 | 英特爾發布 OpenVINO 工具包中的二進位卷積以提高深度學習性能】來源:intel英特爾發布 OpenVINO 工具包二進位OpenVINO 是英特爾提供的基於卷積神經網絡的計算機視覺開發包,目的是能夠快速的在 Intel 的硬體方案上部署和開發計算機視覺工程和方案
  • 英特爾Trish Damkroger:異構性將是加速高性能計算和AI融合關鍵
    這項研究是「轉化醫學國家重大科技基礎設施(上海)」 這一重大計劃的一部分,將為上海打造一個綜合轉化醫學中心,囊括疾病預防、早期診斷和個性化治療的模型與方法,解決重大疾病的發生、發展和復發等重大科學問題,促進高端醫療產業技術的研發。英特爾正與瑞金開展合作,利用英特爾 至強 處理器和英特爾 傲騰 內存為其構建高性能計算和人工智慧基礎設施。
  • 英特爾:今年交付Xe -LP伺服器GPU 專為輕薄型筆記本電腦設計
    11 月 3 日消息 英特爾現已發布了銳炬 Xe MAX 獨立顯卡,基於 Xe-LP 圖形架構,和 Xe 核顯採用了相同圖形架構,專為輕薄型筆記本電腦設計。除此之外,英特爾還公布了其獨顯的下一步發布計劃。  除移動產品外,英特爾還將與合作夥伴協作,在 2021 年上半年為經濟型臺式機推出基於 Xe-LP 架構的獨立顯卡。
  • 放眼250億美元市場,英特爾推出5G網絡基礎設施新產品
    ——Dan Rodriguez 英特爾公司副總裁兼網絡平臺事業部總經理 在過去的十年裡,英特爾一直與通信行業一起,將網絡轉型為軟體定義的、靈活和可擴展的基礎設施。
  • 英特爾Parallel Inspector錯誤檢查工具
    【IT168開發工具】在問題發生前輕鬆找到線程和內存錯誤英特爾® Parallel Inspector 是為 Microsoft Visual Studio* C/C++ 開發人員提供的最簡便的多線程錯誤檢查工具。英特爾 Parallel Inspector 能檢測非常棘手的線程和內存錯誤,並提供指導,幫助確保應用程式的可靠性。
  • 黃金商業運營商Puregold正在開啟一個以黃金為後盾的加密貨幣支付網
    作為一個成功的黃金商業運營商,在開啟一個以黃金為後盾的加密貨幣,Puregold.sg具備了關鍵的戰略優勢。因此,它吸引了志同道合的業務夥伴和專業人士組成Puregold 團隊推出 PG 代幣的 ICO。
  • 英特爾® 軟體工具的浮點再現性
    因此,在不同情況下重複計算可能會生成不同的結果,儘管結果一直在預期的不確定性範圍內。這通常不是大問題,但是某些上下文需要再現性克服這種不確定性的(如質量保證、法律問題或功能安全要求)。但是,提高或精確的再現性通常以犧牲性能為代價。什麼是再現性? 再現性對於不同人而言有著不同的意義。
  • 英特爾Rob Crooke:2019,拓展內存和存儲新疆界
    當前,我們正致力於打造一個智能互聯、以數據為中心的未來,而現在,這樣的未來已經到來。內存和存儲產品對計算體驗至關重要。沒有內存和存儲產品的發展,計算技術的進步便是無源之水,無本之木。而在當今這個以數據為驅動的世界,對數據的傳輸、存儲和處理則更加需要前瞻性的存儲能力以及內存和存儲領域的前沿創新。
  • 英特爾交付首個49量子比特計算測試晶片
    在與IBM、谷歌的量子計算機「馬拉松」中,全球最大晶片企業英特爾在當地時間1月9日達成了一個裡程牌:接近「量子霸權」(quantum supremacy)。當天,在美國拉斯維加斯舉行的CES大會上,英特爾CEO布萊恩·科再奇(Brian Krzanich)向合作夥伴交付首個49量子比特量子計算測試晶片。英特爾49量子比特晶片計算機領域的研究人員將擁有50量子比特稱為「量子霸權」。
  • 誰知道英特爾僅用一天時間就為浪潮申請CPU出口許可證的苦楚?
    但英特爾一直沿用半導體加工業的IDM模式:設計,製造,封裝,測試,銷售。 由於英特爾有著深厚的市場積累,自身產能無法得到充分保障,經常出現供貨延遲的情況。川普政府非常希望英特爾能夠走出自給自足的模式,發揮技術和規模優勢,為美國科技企業做晶片代工。
  • 蘋果自研晶片Mac登場,「諷刺」英特爾,定義PC下個十年?
    另外,包括Omni出品的辦公效率軟體、Adobe的Lightroom等第三方軟體也會針對M1晶片推出兼容英特爾和ARM架構的全局應用。不過有意思的是,發布會展示的案例當中,並沒有微軟Office的身影,而另外一個非常重要的生產力軟體Photoshop,也要等到明年才會適配上新架構的Mac。至於沒有完成優化和適配的應用,蘋果增加了Rosetta 2來兜底。
  • 英特爾陳玉榮:全面解析英特爾人工智慧計算平臺 | CCF-GAIR 2018
    在終端,Movidius VPU在超低能耗下可以提供優異的推斷吞吐量,可以用於物聯網傳感器、個人計算機和其他終端產品中進行視覺處理和推斷。英特爾Mobileye EyeQ技術是自動駕駛的推斷平臺,同時也可以作為一個完整的自動駕駛解決方案提供給客戶。
  • 英特爾機器編程工具可檢測代碼中的Bug
    雖然仍處於早期階段,這個新穎的自我監督系統有望成為一個強大的生產力工具,幫助軟體開發者進行耗時費力的Debug。在初步測試中,ControlFlag利用超過10億行未標記的產品級別的代碼進行了訓練並學習了新的缺陷。