彎道超車?看IPU如何重塑AI晶片格局

2021-01-08 IT168

  文章轉自:戴爾易安信解決方案公眾號

  在過去的一年裡,許多行業受疫情衝擊發展陷入停滯,人工智慧應用卻實現了逆勢突破。在世界人工智慧大會WAIC2020上,李蘭娟院士表示,AI在疫情防控中,發揮了重要作用。

  此外,AI在無人駕駛汽車等前沿領域也持續發力;在AI頂層設計方面,國家也不遺餘力積極制定相關標準,出臺了《國家新一代人工智慧標準體系建設指南》,為人工智慧的規範發展掃平障礙。

  

  AI高速發展的背後,離不開「燃料」算力的助推。算力作為AI 2.0的四大要素之一,為人工智慧提供計算能力的支撐。

  需求倒逼創新

  AI晶片行業將迎變革

  在過去的幾十年裡,基於摩爾定律,晶片行業的發展一直推動著晶片製程和性能的穩步提升,算力需求的增長也促進了人工智慧工作負載中大量採用專用的AI加速器(GPU、FPGA、ASIC、xPU等)。

  與傳統的CPU架構相比,這些加速器能夠執行更快的AI作業和並行計算。它們為有效執行控制ML/DL工作負載提供了專門的支持。

  

  現在市場上已經有各類 AI加速器:GPU、FPGA、ASIC等等,各種各樣的計算平臺被運用到AI計算中。之所以會出現這麼多各種形式的 AI 晶片,正是因為算法的多元化,例如機器學習算法有 LR、GBDT,深度學習中的 CNN、DNN 等,這些算法都非常複雜,如果機器要很快地讓這些算法「跑」起來,一定需要算法的邏輯跟晶片計算的邏輯相互匹配。

  據OpenAI組織發布的一份分析報告顯示,自2012年以來,在人工智慧訓練中所使用的計算量呈指數級增長,3.5個月的時間計算量就翻了一倍(相比之下,摩爾定律有18個月的倍增周期)。自2012年以來,該指標增長了30多萬倍。按照這個趨勢,想要滿足未來AI發展的需求,晶片行業勢必要有所變革。

  Graphcore IPU:專為人工智慧而生

  一種全新的完全可編程處理器

  Graphcore是一家創辦於2016年的人工智慧晶片設計初創公司,總部位於英國,以「專注於新型 AI 處理器架構,專門適用於算力密集型的機器學習任務」,入選2020年度《麻省理工科技評論》「50家聰明公司」榜單。該公司開發了一款被稱為IPU智能處理單元(intelligence processing unit)的新型AI加速器。

  Graphcore IPU是專門為AI/Machine Learning設計的處理器,擁有完全不同於前面幾類處理器類型的全新架構,能夠提供強大的並行處理能力。Graphcore IPU區別於其他處理器的一個重要因素還在於,它實現了快速訓練模型和實時操控,這使得它能夠在自然語言處理以及理解自動駕駛方面取得重大進展。

  

  Graphcore 的IPU特點可概括為:

  1. 同時支持 Training 和 Inference;

  2. 採用同構多核(many-core)架構,超過1000個獨立的處理器;

  3. 支持 all-to-all的核間通信,採用Bulk Synchronous Parallel的同步計算模型;

  4. 採用大量片上SRAM,不需要外部DRAM。

  

  據介紹,IPU處理器是迄今為止最複雜的處理器晶片,它在一個16納米晶片上有幾乎240億個電晶體,每個晶片提供125 teraFLOPS運算能力。一個標準4U機箱中可以插入8張卡,卡間通過IPU-Link互連。8張卡上的IPU可以看做一個處理器工作,提供 1.6PetaFLOPS的運算能力。

  與GPU爭鋒?

  IPU:沒在怕的

  英偉達公司率先於1999年提出GPU的概念,GPU使顯卡減少了對CPU的依賴,然而隨著模型越來越大,參數越來越多,面對高精度高吞吐量的需求,算力優勢顯著的IPU也許更能代表AI晶片的發展方向。

  Graphcore IPU在現有以及下一代模型上的性能均優於GPU,在自然語言處理方面的速度能比GPU快25%到50%;在圖像分類方面,吞吐量7倍於GPU,而且時延更低。

  Natural Language Processing-BERT

  BERT (Bidirectional Encoder Representations from Transformers)是目前使用的最著名的NLP模型之一。IPU加速了BERT的訓練和推理,在極低延遲的情況下, IPU能夠進行實現2倍於目前解決方案的吞吐量,同時延遲性能比當前的解決方案提升1.3倍。

  

  計算機視覺:EfficientNet & ResNeXt模型

  由於IPU架構的特定特性,它非常擅長於分組卷積的模型。在計算機視覺模型如efficient entnet和ResNeXt中顯著提升了訓練和推理的性能。

  在EfficientNet推理(左圖)和訓練(右圖)模型測試中,IPU在比GPU延遲低14倍的情況下實現了15倍的高吞吐量的優勢,推理模型種子能夠實現7倍於目前GPU解決方案的吞吐量。

  

  如下圖所示,ResNeXt-101: Inference(左圖) 和 ResNeXt-50 Training(右圖)與GPU相比,Graphcore C2 IPU處理器在延遲低24倍的情況下實現了7倍的高吞吐量。

  

  好馬配好鞍——IPU全軟體棧和框架支持

  Graphcore提供了Poplar SDK IPU軟體開發平臺,幫助用戶高效地構建人工智慧應用,可為當今的領先模型提供開箱即用的先進性能。

  Poplar SDK可與TensorFlow、Pytorch和ONNX等流行框架一起使用。它支持高階的機器智能圖描述,可編譯加載到IPU上優化的Poplar圖和相關的控制程序。大規模的處理器內存意味著可以充分利用龐大的處理器內帶寬,可將整個模型加載到IPU上。

  Poplar SDK支持一系列標準框架。通過TensorFlow,Poplar SDK可直接接受XLA圖,並將XLA編譯輸出為Poplar圖和控制程序。

  

  Graphcore還為ONNX提供了訓練運行時(runtime),並且正與ONNX各組織緊密合作,以將其納入ONNX標準環境中。

  DSS 8440伺服器:業界首款採用Graphcore技術的機器學習伺服器

  作為Graphcore的合作夥伴,戴爾科技希望能為用戶提供更強大的算力支持,將業內領先的創新研發成果融入機器學習硬體產品,推出了業界首款搭載Graphcore IPU的戴爾易安信DSS 8440伺服器。它屬於兩處理器插槽的4U伺服器,旨在為人工智慧應用提供卓越的性能。

  支持8個Graphcore C2卡(雙IPU),可提供高達1.6Peta FLOP的混合精度機器智能計算能力。

  採用了多功能平衡加速器,可以搭載4個、8個或10個NVIDIA Tesla V100 GPUs以及更高達16塊T4 GPUs,用戶可以根據需要和最佳配置,有效地分配機器學習資源。

  擁有高速輸入/輸出性能,利用IPU-Link的「階梯式」拓撲,在兩個IPU C2卡之間的總體雙向帶寬為256GB/s。此配置保障了多塊IPU卡之間高速共享模型參數或數據,為科學和工程環境中的建模、模擬和預測分析等計算密集型工作負載提供更優性能。

  對於分布式訓練應用,戴爾易安信DSS 8440伺服器還提供多個100Gbps網絡連結,以實現伺服器到伺服器的可擴展性。

  搭載了Graphcore IPU的戴爾易安信DSS 8440伺服器,是人工智慧訓練和推理應用的理想之選。用戶利用DSS 8440中大量的低延遲本地存儲和強大的吞吐能力,可從海量的數據源中獲得更快的結果。

  

  戴爾易安信豐富的機器學習專業知識,經典機器學習、深度學習的硬體和解決方案,能夠幫助AI 技術開發、研髮型的初創小企業,快速部署穩定可靠且高算力的基礎架構產品,支持創新研發提高其核心競爭力。

  尊敬的讀者

  隨著2021新年的到來

  戴爾科技開年第一「惠」盛情來襲

  助企業新的一年牛氣沖天!

  多款伺服器、工作站、商用筆記本

  等產品限時優惠

  更有0元試用、現金紅包

  等活動等你來參與

  快來掃描下方二維碼


  

相關焦點

  • 中科院傳來好消息,晶片或實現彎道超車
    在科技界一向是技術之間的較量,誰優先掌握了技術,就相當於手握王牌,近年來我國科技企業在晶片領域犯了難,其原因非常的簡單,製造晶片領域是我國的技術短板。雖然在晶片設計以及晶片封裝領域,我國已經完全自主,但是晶片製造或許才是晶片三個過程中的重中之重。全球能夠生產先進晶片工藝的並不多,一個是臺積電,還有一個是三星。
  • 量子晶片能否實現彎道超車,解決光刻機的難題?答案並不樂觀!
    量子晶片能否實現彎道超車,解決光刻機的難題?答案並不樂觀!國家手機當中使用的晶片,一直是我們心中的痛。只是在以前事情還沒有到緊急關頭,所以大家都還是順應時代的發展需求在大部分選擇臺積電以及高通的晶片。會有這樣的提議,是因為我們如今在量子晶片的研究當中確實處於領先的地位,將機會寄托在上面也屬實是正常的思維。但成功性很小,量子晶片跟半導體晶片完全是兩個概念,量子晶片是將量子線路集成在基片上,進而承載量子信息處理的功能。可半導體的晶片是將大量的晶管體以及其他的電子器件集成到一塊矽片上所集成的電路。
  • 田忌賽馬與彎道超車,一個是策略,一個是豪賭
    我們津津樂道的彎道超車就是田忌賽馬的一個變種。然而,很多彎道超車成了彎道翻車,那是因為浮躁得只看到表面的策略,而不懂得田忌賽馬隱含了一些先決條件。沒有這些先決條件,田忌贏不了齊威王。想當年孫臏給多次和齊威王賽馬失敗的田忌出了個主意,讓田忌用自己的下等馬和齊威王的上等馬比賽,用田忌的上等馬和齊威王的中等馬比賽,用田忌的中等馬和齊威王的下等馬比賽。
  • 彎道超車?晶片架構RISC-V新勢力迅速崛起 睿思芯科產品今年底量產
    原標題:彎道超車?晶片架構RISC-V新勢力迅速崛起 睿思芯科產品今年底量產   晶片設計的新格局將如何變化?
  • 獨臂少年「鬥牛」籃球 大童英語「如何彎道超車」
    那麼大童英語啟蒙「如何彎道超車」?大童英語啟蒙受眾群體7-10歲左右。這個年齡段的孩子認知能力強,但是中文的母語優勢已經非常明顯。因為幼兒期缺少英語語言的整體輸入,學英語已明顯帶著中式思維。如果我告訴孩子這個詞是「幫助」的意思,她就能準確的說出「help」,但是看詞就是讀不對。她的思維理解方式為「幫助是help」。但是她不懂為什麼h-e-l-p 在一起發音是help。英語裡26個字母,每個字母都有自己的名稱音和發音。自然拼讀的過程中,通過字母或字母組合的音形對應規則,對書面的單詞進行解碼。
  • 中科院院士突破矽基半導體技術,未來將會彎道超車
    中科院院士突破矽基半導體技術,未來將會彎道超車蘋果12已經成功上線,好多人都覺得綠色的版本十分好看,但是在到貨當天,也有好多顧客發出了差評。這就說明,蘋果手機依舊是存在缺陷的。今年最為激烈的競爭應該就是蘋果12與華為Mate40系列手機。
  • 漫畫小品《愚哥相聲》2:「彎道超車」
    我們俱樂部要「彎道超車」,即將成為中國足球的「銀河艦隊」了,我真是好興奮好激動好幸福啊!愚哥:什麼彎道超車?什麼「銀河艦隊」?你說明白一點。楊哥:「彎道超車」,就是幾輛賽車在賽道上比賽,後面的車被前面的車拉開了一段距離
  • 21世紀彎道「超車」兩大領域,5G技術和難度不亞於晶片的「它」
    5G領域如果關注華為事件的朋友相信都知道,華為5G技術在世界上有著舉足輕重的作用,5G專利數目高達3147個,位列世界第一,成為世界5G領域的領頭羊,這打破了我國多年來技術落後的局面,成為21世紀彎道「超車」的一個重要領域。
  • 量子晶片彎道超車
    2019年的實體清單和2020年的史上最強禁令,直接斷絕了我們依靠任何美國技術發展晶片產業的可能,和今天常見的量子晶片不同,那時的晶片製造還十分依賴一種叫光刻機的設備,而人類的技術已經被鎖死在納米級別,每向前走一步都極其艱難,幾乎世界上所有的尖端企業都不可避免的採用了美國的技術,甚至連我們本國的臺機電和中心國際都無法繼續為我國的企業代工,或者出售晶片了,在這一套組合拳的重擊下,我國高新技術產業的生命開始進入了倒計時
  • 奮力迎頭趕上 實現彎道超車
    黨委政府、市場主體、科技工作者擰成一股繩,助推海南科技創新再上新臺階奮力迎頭趕上 實現彎道超車■ 海南日報記者 王玉潔 況昌勳12月11日,海南省科學技術獎勵大會在海口召開,這是一場屬於全省科技工作者的盛會
  • 「曝光臺」網友微博舉報,湘GP10**彎道超車被處罰!
    不過 關於超車我國交通法規中有一條規定可能很多駕駛人都不曾重視過——在鐵路道口、路口、窄橋、彎道、陡坡、隧道、人行橫道、交通流量大等沒有超車條件的路段,不得超車。瀏覽器版本過低,暫不支持視頻播放從視頻中可以看出湘GP10**小型轎車在車輛密集的彎道處超車
  • 智庫|探究企業彎道超車與翻車的奧秘:技術向心力
    2奧林巴斯看不見的技術在一個行業衰落的時候,必然意味另外一個行業的崛起。就像400米跑道,在前行無阻的直線跑道之後,就會出現彎道,那就是行業切換的轉折點。在直線賽道的傳統技術優勢,有可能無法適應彎道處的離心力。一個企業,就會伴隨著無法收斂的技術切線,被甩出賽道。
  • 成飛,彎道超車,成就中國最強戰機!
    但事實卻並非如此,成飛之所以擁有了如今這樣的規模,完全是因為其彎道超車,製造出了另一家主流戰機製造公司所還沒有研製出來的戰機才得到的。當前,中國有兩個專門製造戰機的公司,分別是瀋陽飛機工業有限責任公司和成都飛機工業有限責任公司。儘管同為戰機製造企業,沈飛與成飛還是有高低之分,而成飛就是低的那個。
  • 中國晶片將靠它彎道超車!RISC-V架構全解構
    隨後在1983年發布了RISC-II原型晶片,1984年和1988年發布了RISC-III和RISC-IV。 RISC的設計理念也催生了一系列新架構,如MIPS、伺服器的王者IBM PowerPC以及現在統治嵌入式市場的ARM。2010年,加州大學伯克利分校的研究團隊設計並推出了一套基於BSD協議許可的免費開放的指令集架構RISC-V,其原型晶片也於2013年1月成功流片。
  • ...聯席CEO米磊:半導體晶片只能換道超車「卡脖子」問題正迎刃而解
    資本與創業者空前的熱情一方面拉動了國產晶片產業的快速增長。中國半導體行業協會統計數據顯示,今年上半年,我國集成電路產業銷售額達到3539億元,同比增長16.1%。與此同時,部分「卡脖子」的問題也正在迎刃而解。
  • ...星米磊:半導體晶片只能換道超車,但一些「卡脖子」問題正迎刃而解
    在米磊看來,未來國與國之間的競爭在於硬科技,今年以半導體晶片為代表賽道的火熱意味著中國硬科技發展迎來了春天,但資本的迅猛湧入,也造成了項目估值虛高等現象。此時,無論投資人還是創業者都應保持警惕與理智,避免過熱帶來的風險。
  • 時事說法:小轎車彎道超車,撞飛一輛摩的,造成2死1傷
    彎道超車,危險什麼的不存在的?然鵝,你以為的以為,真的就是你以為嗎?真相往往是這樣的……2018年3月6日上午11時許,六盤水馬落箐埡口發生一起交通事故。周某駕駛的小轎車在馬落箐埡口處彎道越線超車,由於來不及剎車,與對向行駛來的灰色小轎車撞個正著,導致對方車輛上一人受傷,周某駕駛的車輛當場自燃。
  • 蔡晨波:以技術創新實現企業「彎道超車」
    面對疫情,企業如何逆境發展,實現「彎道超車」?作為管理公司八年的九零後老闆,蔡晨波並不滿足於現狀,在他的經營理念中,「技術創新」「轉型升級」這兩個關鍵詞始終佔據著重要位置。前階段,一場以「機器換人」為主題的技術「相親」在三鼎生產車間內開展。站在工人校正曲軸的工作檯前,蔡晨波與台州巴斯圖視覺機器人有限公司負責人楊劍展開了一場「頭腦風暴」。
  • 讀書是一種「彎道超車」
    讀書是一種「彎道超車」 2020-05-08 11:34:50 參與互動   讀書是世上第一等好事,更是一種「彎道超車」
  • 中微5nm刻蝕機獲突破,中國芯「彎道超車」?尹志堯博士一語中的
    華為的麒麟晶片圖像信號處理器(ISP),支持其獨特的RYYB傳感器技術,是華為可以與其他品牌手機抗衡優勢之一。如今華為麒麟晶片無法再生產,那華為也隨之喪失優勢嗎?在未來市場上的佔比可能會被其他品牌替代嗎?