英特爾Trish Damkroger:異構性將是加速高性能計算和AI融合關鍵

2020-12-13 親愛的數據

各位好,我是Trish Damkroger,英特爾數據平臺集團副總裁、高性能計算總經理。今天,我要跟大家談一談擴展高性能計算邊界:多架構時代。在開始演講之前,我想感謝大家邀請我再度出席全國高性能計算學術年會,並發表演講。

今年的情況和去年不太一樣,我沒能親自來到現場,而是在英特爾工作室與大家進行交流。全球疫情的爆發讓大多數人進入了新常態,我希望每個人都平安健康。對我而言,高性能計算一直是一個令人興奮的業務。而現在,隨著新冠的影響蔓延到世界每一個角落,所有的目光都集中在高性能計算上,大家也很關注該技術將如何助力抗擊此次疫情和未來可能爆發的疫情。這是激動人心的時刻,讓我們直接進入演講,談談擴展高性能計算邊界:多架構時代這一話題。

在此次新冠疫情爆發期間,高性能計算在社會中發揮的作用和重要性比以往更為明顯。事實證明,科技是讓社會各界延續正常生活的重要工具。無論是上網課、遠程工作,或是以前所未有的規模提供線上醫療服務。4月,英特爾發布了科技抗疫計劃,提供5000萬美元幫助世界各地的人們渡過難關。英特爾正與客戶、合作夥伴以及政府機構合作,發掘我們無可匹敵的生態系統之潛力,用於改善患者在醫療點的治療效果,為衛生系統提供支持以應對疫情衝擊,並加速治療方法和疫苗研發的進度,為當務之急提供解決方案。我很高興,能與大家分享英特爾生態系統開展合作的一些領域。在疫苗和治療方面,世界各地的超級計算機均在高速運轉,以對抗新冠病毒,英特爾 技術為德州大學高級計算中心(TACC)提供支持,助力新冠病毒、其他病毒以及DNA複製等任務。高性能計算機研究中心也啟用了英特爾技術,運行分子動力學和仿真技術,以了解病毒結構,加速新冠藥物和治療方案的探索。在尋找新的抗病毒藥物和疫苗的過程中,英特爾資本投資的VeriSIM Life開發了一個軟體平臺,該平臺有助於加快新藥的發現。該系統可在數小時內對數千種藥物化合物的實驗測試結果進行建模,加速開啟人體試驗和新藥上市時間。我們正與頂級醫學影像廠商開展合作,利用人工智慧加速工具進行基於人工智慧的診斷決策,並在安全的聯邦學習框架中,開發跨多個數據集的新冠模型。在人群分析方面,我們通過大數據分析、人工智慧和英特爾 Apache Pass技術,實現高危患者分層,提前預測新冠患者的呼吸機需求。紐約苦於應對新冠患者的時候,我們與紐約布朗克斯區最大的綜合醫療服務網絡Montefiore醫療系統開展合作,幫助他們開發出專門針對新冠的實時態勢感知系統,提前數小時識別、分流並優先處理需要機械通氣與重症監護的新冠患者,或已經出現急性呼吸窘迫綜合症的患者。這得益於Montefiore的「患者導向分析學習機」(Patient-centered Analytic Learning Machine),

又稱PALM技術。

該技術基於第二代英特爾 至強 可擴展處理器和英特爾 傲騰 技術,整合了多種數據、計算和通信密集型技術,以企業級規模及時實現人工智慧。接下來談談在高性能計算領域看到的兩大趨勢:越發常見的異構架構的使用和高性能計算與人工智慧的融合。

通用處理和工作負載優化加速至關重要。傳統的建模和仿真工作負載主要涉及標量和矢量數學計算優化。

另一方面,人工智慧並非一個單一的單體工作負載,它仍在不斷發展——需要更強大的架構能力,需囊括矩陣和空間數學優化。此外,高性能計算從邊緣,到客戶端,再到數據中心和雲基礎設施,需啟用一個多層面的方法。「一刀切」的解決方案將無法提供用以構建客戶所需優化解決方案必備的正確功率、計算或延遲選項。

日益豐富的人工智慧使用場景,將我們推向計算智能進一步強化的新時代,模式的變革推動著人工智慧和高性能計算工作負載的融合。現如今,我們看到,這一融合以多種方式發生在各行各業,其主要目標便是實現人工智慧——加速傳統上完全由高性能計算完成的洞察。人工智慧正被整合到高性能計算工作流當中,以加速模式檢測,在某些情況下,比如CERN,人工智慧模型正完全取代基於物理學的模型。人工智慧也在為個性化醫療等領域的高性能計算仿真提供加速。在瑞金醫院,研究人員正利用機器學習算法來預測患者的個體風險,並能夠更準確、更精確地識別哪些患者將從特定療法中獲得最大受益。這項研究是「轉化醫學國家重大科技基礎設施(上海)」 這一重大計劃的一部分,將為上海打造一個綜合轉化醫學中心,囊括疾病預防、早期診斷和個性化治療的模型與方法,解決重大疾病的發生、發展和復發等重大科學問題,促進高端醫療產業技術的研發。英特爾正與瑞金開展合作,利用英特爾 至強 處理器和英特爾 傲騰 內存為其構建高性能計算和人工智慧基礎設施。

英特爾多架構策略正是著眼於實現這一目標。英特爾的多架構策略帶來了部署在矽平臺上的標量、矢量、空間和矩陣架構的多樣化組合,例如CPU、GPU、FPGA和專用加速器等等,並由開放、符合行業標準的統一編程模型提供支持,以簡化應用開發和可移植性。從多用途CPU到人工智慧優化離散式專用集成電路,英特爾提供了最靈活且性能得到優化的產品組合。如今,客戶可以通過英特爾 至強 可擴展處理器、英特爾 酷睿 CPU和英特爾FPGA乃至低功耗英特爾 Movidius VPUs來應對高性能計算和人工智慧的工作負載。

收購Habana Labs後,英特爾從邊緣到雲端、從硬體到軟體的產品組合更加豐富,為客戶提供了一套完整的解決方案。對於希望加速各種工作負載的客戶而言,基於Xe架構的GPU將為他們提供更多選擇。作為高性能計算的成熟基礎,英特爾 至強 處理器將繼續作為一個得力助手,為要求最高、以人工智慧為主的工作負載提供支持。但隨著計算需求的不斷增長,以及工作負載日趨多樣化,需要通過多架構加速為CPU平臺提供補充,以滿足每個客戶的計算需求。有些用戶使用的應用,對高度並行高性能計算應用和深度學習訓練都有優化需求,英特爾基於Xe 架構的GPU便是為這些用戶量身打造的。FPGA用於要求靈活性的應用,而專用集成電路,例如我們最近收購的Habana Labs,則將為人工智慧訓練和推理提供專用加速。最後,以低延遲的方式在計算區域存儲和移動複雜大型數據集所導致的系統複雜性則需要使用新一代內存和互聯技術的支持——英特爾也一直在該領域進行創新和投資。

高性能計算和人工智慧的融合是高性能計算行業的一個關鍵拐點,目前尚沒有哪家公司能夠更好地幫助我們的客戶利用這一模式。

英特爾 至強 可擴展處理器是唯一一款針對高性能計算和人工智慧融合進行優化的數據中心CPU——通過AVX512向量SIMD擴展來加速高性能計算應用,通過英特爾 深度學習加速(英特爾 DL Boost)技術來加速人工智慧應用——尤其是VNNI指令集,能讓現有Cascade Lake處理器中的推理應用更快一步。Cascade Lake處理器支持英特爾 傲騰 持久內存,可加速數據分析和AI應用,同時推動高性能計算系統的加速檢查點和啟動等關鍵功能。我們即將在今年推出首款10nm Ice Lake伺服器CPU,而計劃於2021年推出的Sapphire Rapids,會新增名為高級矩陣擴展(AMX)的加速器。

英特爾在集成顯卡領域的投資經驗已超十年,目前已有超十億用戶使用該架構為各種客戶端應用提供支持。Xe架構代表著英特爾的架構設計,從單純考慮功耗和面積受限的集成顯卡需求,向完全可擴展的圖形架構過渡,這種架構將得到大幅拓展,以服務於多個市場,從集成顯卡和入門級獨立顯卡到高端遊戲和數據中心顯卡。Xe 是11代之後新型可擴展圖形架構的代表。英特爾的Xe架構代表了一個完整的GPU產品組合,涵蓋領域廣泛,從集成圖形到高性能計算和人工智慧等高要求的數據中心應用。基於Xe架構的GPU包括三類,從低功耗(Xe-LP),到高性能的(Xe-HP),再到針對高性能計算和人工智慧加速優化的GPU(Xe-HPC)。

在8月的架構日上,我們披露了Ponte Vecchio將由基於10nm SuperFin技術的基模、基於英特爾和外部工藝的計算區塊、基於增強型SuperFin技術的Rambo緩存以及基於外部工藝的Xe鏈路與Foveros和Co-EMIB先進封裝技術強強聯合組成。Ponte Vecchio將加入靈活的數據並行向量矩陣引擎,以應對一系列高度並行的工作負載。它旨在提供高雙精度浮點吞吐量,並提供超高緩存和內存帶寬,以處理對內存帶寬要求較高的應用。Xe架構將利用英特爾新一代Foveros 3D封裝技術,在封裝內集成多個IP,包括HBM內存和其他專利技術。

正如我提到的,異構性將是加速高性能計算和人工智慧融合的關鍵。支持計算引擎多樣性,意味著開發人員需對單獨代碼庫和工具鏈對成本和性能可能產生的影響進行管理,這就是我們與生態系統合作推出oneAPI的原因。oneAPI的建立是為了簡化跨多種類型處理器和加速器的開發——不僅限於英特爾的硬體。基於行業標準和開放規範的oneAPI包含直接編程組件和基於API的編程組件,支持廣泛的行業生態系統採納該技術來推動創新、簡化應用開發、實現應用在大量節點上的可擴展性——同時為您目前使用的、喜愛的程式語言提供支持。

英特爾 oneAPI工具包(beta版)可公開免費下載,為不同硬體類型的代碼移植、測試工具、測試工作負載提供測試環境。自從在2019年超級計算大會上發布oneAPI以來,我們發布了8個oneAPI工具包(beta版),功能和性能穩步提升,可以對CPU、GPU和FPGA進行編程,同時也為分布式數據分析、渲染性能、剖析以及視頻和線程庫提供了新功能以及強化。oneAPI Gold將為開發者提供一個跨越標量、矢量、矩陣和空間,且具有生產質量和性能的解決方案,oneAPI Gold即將於今年為開發者推出。行業合作夥伴Codeplay已經為英偉達GPU開發了Data Parallel C++開源編譯器,為使用現有GPU加速器的開發者提供統一的、基於行業標準的編程工具。雖然英特爾優化版的TensorFlow和Pytorch深度學習框架目前已經可以用於CPU,但我們正在繼續對GPU進行優化,應該會在不久的將來推出。最後,您可以訪問oneapi.com,查找規範、開源實現,並提供關於oneAPI的反饋。

對於不想下載工具包的人,您也可通過雲端使用工具包。開發者可以通過英特爾 DevCloud快捷使用,從註冊到登錄只需要一分鐘。使用起來也很簡單,只需修改一行代碼就可以應對所有多架構,而且無需安裝、無需下載、無需購買新硬體,也沒有冗長的設置和配置步驟。最重要的是,該工具免費、快速,即刻就可以在您已有的至強 、FPGA和集成系統上開始編碼。部分客戶在籤署保密協議的情況下已經開始使用英特爾 DG1 GPU。

概括說來,我們通過以下措施專注打造融合的未來:投資領先工藝技術和先進封裝能力;打造計算架構,為您的所有工作負載提供最高性能;重新架構內存和存儲層次,滿足帶寬和內存容量需求;通過革命性互聯技術,在每個層次上實現安全技術;為現在和未來的異構系統提供統一的編程模型。而我想說的最後一點是,沒錯,英特爾不僅在對我們的領先技術進行投資,也在投資未來的技術領導者。

英特爾自2013年開始贊助並行應用挑戰賽,吸引了來自中國40多個城市的學生參賽,300多所大學和160多個組織參加了比賽。組建了1200多支隊伍,有超過7000人參加了這項賽事。賽事的規模每年都在持續擴大,其概念和挑戰也越來越有趣,成為了表彰傑出成就和高性能計算應用的盛會,也是並行計算領域優秀人才的搖籃。請繼續保持在高性能計算領域的出色工作和投入,加油!

接下來,謝謝各位。謝謝你們邀請我再度出席全國高性能計算學術年會,希望大家能夠盡情享受接下來的活動。

《親愛的數據》出品

《親愛的數據》出品

相關焦點

  • 英特爾塑造高性能計算的未來
    從工作站、雲到全球Top500超級計算機,英特爾一直是高性能計算的堅實基礎。在近日舉行的2020年超級計算大會(SC20)上,英特爾副總裁兼高性能計算部總經理Trish Damkroger展示了英特爾及合作夥伴通過軟、硬體技術來加速先進高性能計算系統廣泛部署,共同塑造高性能計算的未來。
  • 高性能計算與AI融合加速 Supermicro推動綠色計算發展
    從2018年到2025年,預計將以7.2%的複合年增長率增長。隨著高性能計算應用程式的複雜性不斷增加,企業亟需在軟硬體方面進行不斷優化和革新。本文引用地址:http://www.eepw.com.cn/article/202012/421313.htm高性能計算與AI融合加速AI浪潮加速著各個行業的革新,從精準醫療到自動駕駛,越來越多的新興應用不斷湧現。藉助HPC基礎設施,人工智慧能得到更好的發揮,兩者融合將是未來幾年的主流趨勢。
  • 32核打贏AMD64核 英特爾Ice Lake為HPC提供強勁性能
    在近日舉行的2020年超級計算大會(SC20)上,英特爾副總裁兼高性能計算部總經理Trish Damkroger展示了英特爾及合作夥伴通過軟、硬體技術來加速先進高性能計算系統廣泛部署,共同塑造高性能計算的未來。
  • 為增強AI晶片實力,英特爾又收購了一個7個人的初創公司Vertex.ai
    雷鋒網消息,為了進一步增強在人工智慧領域的競爭力,英特爾又收購了一家AI初創公司Vertex.ai,不過交易的金額並未透露,但英特爾確認了此項交易,整個團隊包括創始人都將加入英特爾的人工智慧產品事業部。
  • 聯想助力德國超算中心實現26.7千萬億次計算能力!
    LRZ是歐洲最著名的超級計算中心之一,主要面向科研和學術領域的專業人士。LRZ不僅需要管理海量的大數據,而且需要高性能計算來快速處理和分析這些數據,以加速全球各種研究計劃的進展。例如,萊布尼茨超級計算中心最近完成了全球規模最大的、對地震及由此引發的海嘯的模擬,包括蘇門答臘-安達曼地震等,這項研究支持實時情景規劃,有助於預測餘震及其他地震災害。
  • 浪潮高性能計算加速CAD與CAE集成融合,讓創新再快點
    為了進一步優化開發流程,縮短產品研發周期,研發工作中如何更好地融合CAD和CAE成為企業研發管理的重點。近期,浪潮為某家電製造企業先後建設了兩期高性能計算(HPC)集群,利用HPC平臺軟體ClusterEngine、遠程可視化等技術,打通了CAD和CAE應用,在製造業升級的大潮中,不斷為企業創新加速。
  • 英特爾引領百億億級高性能計算創新為石油勘探創造加速度
    探尋百億億級高性能計算對石油勘探的意義為什麼石油勘探和高性能計算這兩個分屬於能源領域和信息技術領域的事物會彼此拉上關係?對現階段石油勘探方法的探究就能解開這個疑惑——目前全球石油勘探機構普遍使用的是地震波勘探法,它就是要對人工製造的、並由地下不同構造反射回來地震波進行採集分析,並將之轉化成可視化的油藏模擬圖像,幫助準確定位油氣田的儲藏。
  • 新思與SiMa.ai合作將高性能機器學習推理引入嵌入式設備
    ., 納斯達克股票代碼:SNPS)近日宣布與SiMa.ai開展合作,將其機器學習推理技術大規模引入嵌入式邊緣設備。通過此次協作,SiMa.ai採用新思科技的DesignWare IP、Verification Continuum平臺和Fusion Design Platform進行MLSoC開發。MLSoC是針對自動駕駛、監控和機器人等特殊計算機視覺應用而專門設計的平臺。
  • AI計算時代,英特爾中國研究院如何助力產學研發展
    五大研究團隊在人工智慧計算帶來的挑戰下,英特爾研究院已經英特爾全球科研布局的關鍵一環,以數據為中心,將人工智慧算法、自主系統平臺、智能基礎設施作為主攻方向,為產業提供源源不斷的創造力,創造突破性的產業價值。
  • 英特爾加速實現 XPU 願景:發布 oneAPI Gold 版本和英特爾伺服器 GPU
    重要性:隨著世界進入到數十億智能設備的時代,數據呈指數級增長,需要將重心從單獨的 CPU 轉移到跨 CPU、GPU、FPGA 和其他加速器的混合架構,英特爾將其稱為 「XPU」願景。英特爾 ® 伺服器 GPU 的推出是英特爾在 XPU 時代擴展產品組合的最新一步。這個計算時代也需要全面的軟體棧。
  • 全新英特爾(R)產品加速網絡轉型,為5G鋪平道路
    這項轉型中的關鍵一步是建造正確的基礎設施,這就是為什麼英特爾要推出新的專為5G網絡準備的產品套件,其中包括新版英特爾®凌動™處理器C3000產品系列和英特爾®至強®處理器D-1500產品系列,一個25 GbE英特爾®乙太網適配器,以及新版英特爾
  • 英特爾與京東優化分布式特徵向量檢索系統Vearch,加速AI應用創新
    隨著 AI 的開發和應用不斷普及和深入,企業需要計算、存儲海量特徵向量數據,IT 基礎設施因此面臨沉重的性能壓力。英特爾和京東一起,在基於英特爾至強可擴展處理器的伺服器上,開發了服務於 AI 時代的分布式向量搜索系統Vearch,讓京東的業務綜合性能獲得顯著提升,從而顯著加速重複圖片去重、相似性商品圖片搜索、人臉識別等 AI 應用的響應速度。
  • 英特爾傲騰加持下的vSAN*,加速破局超融合
    廣泛的應用領域vSAN*為虛擬化和雲計算而生,支持最廣泛應用的超融合軟體定義存儲解決方案,其應用範圍涉及資料庫、虛擬桌面、管理集群等。隨著數據中心雲化演進,底層的傳統存儲架構正在逐漸被軟體定義的存儲取代,應用層的軟體定義的超融合架構也逐漸向關鍵的重負載應用領域滲透,市場實踐結果表明,關鍵業務的Critical運用和VID應用要用到全閃節點來做部署。
  • 英特爾發布Alloy頭盔 能讓VR和AR實現「融合現實」
    在會上,英特爾CEO科再奇發表了「智能互聯世界驅動未來」的主題演講,談及了從虛擬實境到無人駕駛,到工業網際網路、創客和創新者等多個話題。   不過縱觀整場演講,最大的亮點無疑是英特爾首次向外界發布的「融合現實」(Merged Reality,MR)技術。科再奇表示,這項技術將重新定義虛擬實境(VR)和增強現實(AR)的計算體驗,成為領域的變革力量,「讓VR更真實」。
  • 英特爾AI醫療實戰曝光:10倍加速輔助診斷、準確度高達90%
    國內新藥研發仍以仿製藥和改良藥為主,國內 AI 新藥研發主要是人工智慧公司與藥企合作開發新藥。要解鎖 AI 在醫療健康領域的落地困境,需要軟硬體配套設備的支撐,AI 算法提高診斷精度,AI 晶片作為底層關鍵技術,配合先進工藝的硬體設備,三方力量集成,以促進生物技術與信息技術的融合,從而撬動 AI 與醫療大生態。英特爾自身優勢與 AI 落地醫療領域的節點正好契合。
  • 轉型轉了許多年,英特爾的下一步將圍繞「數據洪流」展開
    存儲方面,英特爾剛剛推出了傲騰(Optane)產品系列,採用 3D XPoint 技術,打破了內存和快閃記憶體界限,騰訊以及阿里剛剛宣布將在自家產品上使用 Optane SSD。FPGA 也會起到「加速器」的作用,有媒體指出,在加速下一代深度學習方面,FPGA 將遠超 GPU、更具優勢。
  • 超融合為什麼是「綠色的」?
    基於華為鯤鵬CPU的Taishan伺服器與SmartX超融合軟體SMTX OS共同撐起了中信建投證券的OA系統、證券一般業務與關鍵業務。整套系統不僅適配ARM架構體系,全棧符合信息技術創新標準,同時實現了分布式架構轉型與軟體定義升級,具備可靠、高性能、運維簡單、彈性敏捷等雲特性。
  • 轉折性技術閃耀上海MWC,零距離看英特爾5G技術和應用
    面向未來的智能互聯世界,英特爾正聚焦於引領5G等轉折性技術的發展,通過融合通信和計算引領未來5G變革。 8、面向智慧安防FPGA加速的邊緣計算基礎設施 中國電信和英特爾聯合展示FPGA雲化加速的邊緣計算基礎設施,面向未來製造、安防、交通等行業的智慧生活。
  • 周會群:高性能計算的挑戰—硬體 or 軟體?
    主持人:下面是江蘇省計算機學會高性能計算專委會主任委員、南京大學地球科學與工程學院周會群教授,周教授在中國網絡雜誌介紹中國高性能經驗,今天他給大家帶來演講題目是高性能計算的挑戰:硬體與軟體。有請!   周會群:各位同學、各位老師上午好!久違陳博士大名,今天是第一次見。
  • 行業數位化邊緣計算專題論壇:深耕邊緣計算應用創新 加速行業數字...
    邊緣計算連接了物理世界和數字智能世界,敏捷、實時、智能、安全等特性使其成為行業數位化轉型不可或缺的關鍵要素。近幾年,產學研用各方都在積極推動邊緣計算技術落地應用與標準化發展,包括制定標準、打造從產品研發到落地全生命周期的成熟產業鏈、與其他技術融合發展應用等工作。未來,工業網際網路產業聯盟與邊緣計算產業聯盟將繼續深化合作,布局邊緣計算技術創新發展,推動行業數位化轉型。