Level 5自動駕駛需要500+TOPS算力,IMG Series4多核集群AI加速器...

2020-12-11 電子工程專輯

據ABI Research預計,到2027年全球汽車市場對先進駕駛輔助系統(ADAS)的需求將增長兩倍,這對新型汽車創新者、傳統整車廠商(OEM)、Tier1供應商,以及汽車系統級晶片(SoC)廠商無疑都是好消息。但汽車行業領導者早已將目光投向了更遠的全自動駕駛和自動駕駛計程車(RoboTaxi)。在從L2/L3級ADAS向L4/L5級全自動駕駛演進的過程中,神經網絡加速器將是至關重要的組成部分。這些ADAS/自動駕駛系統需要處理各種各樣的複雜場景,比如從多個攝像頭和雷射雷達的傳感器融合中提取數據,以實現自動泊車、十字路口管理,以及複雜城市環境安全導航等高級功能。能夠結合高性能、低延遲和高能效的AI加速器將是實現高級別自動駕駛的關鍵所在。4ztEETC-電子工程專輯

想了解ADAS/自動駕駛的最新設計和市場趨勢?請即刻報名參加:汽車電子高峰論壇4ztEETC-電子工程專輯

4ztEETC-電子工程專輯

近日Imagination推出專門面向ADAS和自動駕駛應用的新一代神經網絡加速器(NNA)IMG Series4。據稱這種AI加速器採用全新的多核架構,可提供高達600 TOPS(每秒萬億次操作)的超高計算性能,並且可為神經網絡工作負載提供低帶寬和低延遲特性。4ztEETC-電子工程專輯

4ztEETC-電子工程專輯

Imagination視覺和人工智慧部門高級總監Andrew Grant列舉出IMG Series4的五大特性:4ztEETC-電子工程專輯

  1. 多核擴展和靈活性:全新的多核架構支持在多個內核之間對工作負載進行靈活分配和同步。Imagination軟體可提供精細的控制能力,可通過對多個工作負載進行批處理、拆分和調度而提高靈活性。Series4可為每個集群配置 2個、4個、6個或者8個內核。
  2. 超高性能:Series4單核能夠以不到1W的功耗提供12.5 TOPS的性能,比如一個8核集群可以提供100 TOPS的算力,那麼若配置6個這種8核集群就可以提供高達600 TOPS的算力,足以滿足Level 5完全自動駕駛所需要的500 TOPS。在AI推理方面,Series4 NNA的性能比嵌入式GPU快20倍以上,而比嵌入式CPU快1000倍。
  3. 超低延遲:將多個內核組成2核、4核、6核或8核的多核集群,所有內核可以相互協作,並行處理一個任務,從而降低處理延遲,縮短響應時間。例如,對於一個8核集群,理想情況下延遲會減少至單核獨立執行時的1/8。
  4. 節省帶寬:Imagination在Series4中新增了Tensor Tiling(ITT)技術,可以對計算任務進行瓦面平鋪(tiling),充分利用片上存儲來提升數據處理效率,並節省訪問外部存儲的帶寬。ITT利用本地數據的依賴性將中間數據保存在片上存儲器中,這樣可以最大限度地減少將數據傳輸至外部存儲器,從而大大降低帶寬,多達90%。ITT是一種可擴展的算法,在擁有大量輸入數據的網絡上具有顯著優勢。
  5. 車規級安全性:Series4包含IP級別的安全功能,而且其設計流程符合汽車電子行業安全標準ISO 26262。在不影響性能的前提下,Series4可以安全地進行神經網絡推理。其硬體安全機制可以保護編譯後的網絡、網絡執行和數據處理管道。

Andrew Grant認為,Series4 NNA將會成為開發ADAS和自動駕駛汽車的行業標準平臺。一些行業創新者已經在著手打造支持下一代ADAS功能和自動駕駛的系統級晶片,這一AI加速平臺將為他們提供算力、功耗、帶寬和延遲等方面的最佳組合性能。4ztEETC-電子工程專輯

多核集群實現性能線性提升

隨著汽車電子從數字駕駛艙/人機界面(HMI)向ADAS和自動駕駛的演講,在保證安全性和可靠性的同時,對處理性能要求越來越高。比如,Level 2級別的駕駛員監測功能只需要10 TOPS的算力即可處理,而Level 3-4級別的自動泊車功能就需要100 TOPS性能。要實現Level 5級別的完全自動駕駛,必須有500 TOPS以上的算力支持才行。4ztEETC-電子工程專輯

4ztEETC-電子工程專輯

Series4 NNA採用全新的內核架構,每個內核具有12.5 TOPS性能。若基於5nm工藝節點,8個內核的集群可提供: 100 TOPS的算力性能;30 TOPS/Watt 的性能功耗比;12 TOPS/mm^2 的性能密度;低延遲處理大量輸入數據。4ztEETC-電子工程專輯

4ztEETC-電子工程專輯

由4 個內核組成的 50 TOPS 集群能夠跨整個集群拆分各層,比如支持並行處理大型網絡的各層;減少整體延遲,特別是在擁有大尺寸輸入層的網絡上。而各內核能夠獨立運行,可以共同執行一個批處理任務,也可以分別運行各自不同的網絡。此外,這種4內核集群可以作為基礎模塊進行算力擴展。比如,4個50 TOPS集群就可以構成一個200 TOPS的多集群引擎。3個這種多集群引擎組合起來,就可以達到600 TOPS的算力性能,滿足Level 5自動駕駛算力要求。4ztEETC-電子工程專輯

4ztEETC-電子工程專輯

張量平鋪(Tensor Tiling)技術

 Imagination產品管理部門總監Gilberto Rodriguez對Series4新增的張量平鋪(Tensor Tiling, ITT)技術做了詳細介紹。網絡的多層是以融合內核的形式在加速器硬體流水線裡運行的,而融合內核之間的特徵圖需要通過外部存儲進行交換。在不採用ITT技術的情況下,內核需要頻繁的DDR存取,因此會佔用很大的帶寬。4ztEETC-電子工程專輯

4ztEETC-電子工程專輯

若採用了ITT技術,就可以充分利用緊耦合的 SRAM 來融合更多的層,減少需要通過外部存儲交換的特徵圖,從而降低帶寬需求。4ztEETC-電子工程專輯

4ztEETC-電子工程專輯

結語

ADAS和自動駕駛雖然呼聲很高,但仍然難以商用落地。究其原因,嚴苛的安全性和極高的算力和即時處理決策要求對汽車廠商及其供應商提出了很大的挑戰。素以GPU內核著稱的Imagination技術公司開始發力AI加速器市場,最新發布的Series 4 NNA專為ADAS/自動駕駛應用而設計。雖然其多核集群架構可以提供高達600 TOPS的算力性能,但能否真正滿足完全自動駕駛的性能需求,還要看基於這種AI加速器內核的晶片和系統開發,真正應用到自動駕駛實際場景中能否勝任還需要市場的檢驗。4ztEETC-電子工程專輯

責編:Amy Guan4ztEETC-電子工程專輯

相關焦點

  • Imagination發布其最新一代IMG Series4神經網絡加速器產品
    Imagination作為全球半導體IP大廠,已推出多代AI加速產品,獲得了良好的市場反響,可以為汽車晶片廠商打造高性能車用AI晶片提供強有力的支持。日前,Imagination發布其最新一代IMG Series4神經網絡加速器(NNA)產品,該公司視覺和人工智慧部門高級總監Andrew Grant在接受媒體採訪時指出:「雖然目前市場上已經有能滿足自動駕駛需求的AI晶片,但功耗不夠理想。
  • Imagination劉國軍:用「GPU+AI加速器」破局AI算力需求|GTIC2020
    在GTIC AI晶片創新峰會上,劉國軍亦分享了這兩款重磅新品的性能特點,其中B系列GPU IP包含四款產品,功耗較前代產品降低30%,面積縮減25%,算力可達6TFLOPS,能滿足從移動終端到自動駕駛應用的不同需求;而最新第四代NNA IP產品擁有全新多核架構,可提供600TOPS甚至更高的性能,能為大型神經網絡工作負載提供極低的帶寬和延遲。
  • 定位「算力加速」的英偉達,AI算力版圖正越來越大
    藉助結構稀疏,Ampere在神經網絡結構中允許4個權重中的兩個為0,而在矩陣乘法中,一旦權重達成2/4模式,就能額外獲得雙倍性能提升,賴俊傑也表示,在實測中,神經網絡計算效果也能獲得1.5倍性能提升。英偉達GPU算力持續大幅提升/英偉達藉助架構優勢,英偉達集群高性能算力也表現突出。在11月超算TOP 500中,前十名中有8位採用了英偉達技術,英偉達Selene在TOP 500和Green 500中都名列第五,而中美歐的頂級超算中都採用了英偉達的技術。
  • Imagination展示了多項基於其先進圖形處理器和神經網絡加速器IP的...
    Imagination展示了多項基於其先進圖形處理器(GPU)和神經網絡加速器(NNA)IP的應用演示。例如,基於瑞薩R-Car H3晶片的GPU硬體虛擬化演示,該晶片採用了Imagination的PowerVR GX6650 GPU。通過硬體虛擬化功能,同一個GPU可以同時處理多個任務,並且通過物理隔離確保這些任務互不影響,實現了最高的安全性。
  • Nature:世界最快光子AI加速器
    人工神經網絡廣泛應用於人臉識別、語音翻譯、醫療診斷、自動駕駛等重要領域,其性能主要由硬體算力決定,目前所廣泛應用的神經網絡硬體都基於數字電子架構。然而,該架構的兩個本質局限—馮諾曼依瓶頸與電子速率瓶頸,極大限制了神經網絡硬體的潛在算力。
  • Anthony Levandowski又回來了:攜Kache.ai重返自動駕駛舞臺
    他先是攜自己的自動駕駛摩託車在 DARPA 挑戰賽上一戰成名,後又憑藉能力在谷歌自動駕駛部門扶搖直上,接著出走創業打造出自動駕駛卡車公司 Otto,而後被 Uber 收購引來了一場巨頭之間的「泰坦之戰」。這次重回自動駕駛行業,Levandowski 的方向還是自動駕駛卡車,現在的 Kache.ai 還不為人所知,Levandowski 可能正在「蓄」大招。
  • Drive.ai 王弢:自動駕駛的賽道上,如何與時間賽跑 | 2018 全球智能...
    今年 7 月,Drive.ai 首批 3-4 輛(高峰期 4 輛)自動駕駛廂式車開始在德州弗裡斯科市的 Hall Park 園區和 The Star 商業區之間進行試點服務,開啟為期6個月的運營,為園區內上萬名僱員提供最後一英裡的免費出行服務。10月19日起,去美國德克薩斯州阿靈頓,就能坐上自動駕駛計程車。
  • 2020WNEVC創新技術解讀|基於昇騰AI的自動駕駛雲服務技術
    「昇騰910」基於達文西架構的 AI 核,還集成了多個 CPU、DVPP 和任務調度器 ,因而具有自我管理能力,可以充分發揮其高算力的優勢。Octopus技術先進性體現在:1)雲上自動標註,海量存儲,加速數據處理閉環,感知及自動標註算法具備多模態、多任務、全場景標註能力,在KITTI等多個國際知名數據集上準確率達到第一,端對端標註成本降低70%;2)軟硬體加速, AI加速訓練效率,提供更豐富場景,AI訓練平臺連續兩年在斯坦福DawnBench排行榜排名第一,在典型的ResNet50 網絡的訓練中,Octopus訓練速度比友商提升近2倍,
  • 吳恩達旗下Drive.ai自動駕駛車輛德州路測,全程無駕駛員幹預
    今日消息,吳恩達旗下的初創公司Drive.ai繼上周宣布在今年7月份在美國德克薩斯州對公眾開放無人駕駛叫車接送服務後,最近又對外公布了一段無人駕駛路測的視頻,在這段時長4分多鐘的視頻中,Drive.ai的無人駕駛車全程駕駛座上並沒有人,處於真正意義上的無人駕駛狀態。
  • 主攻量產 Roadstar.ai發布新一代自動駕駛解決方案Leo·靈
    【網易智能訊 11月8日消息】在第五屆世界網際網路大會召開期間,自動駕駛初創公司Roadstar.ai對外公布新一代自動駕駛解決方案Leo·靈,這是主打量產的Level 4解決方案。據了解,今年上半年,Roadstar.ai就發布了自動駕駛Level 4解決方案Aries·銳,新一代Leo·靈相比上一代產品解決了很多缺點,比如銳要更換一個零件需要拆開整體,靈則只需要替換局部零件,十幾分鐘就能完成操作。Roadstar.ai聯合創始人周光表示,靈平臺具備穩定性和可維護性的特點,生產、調試時間可以縮短到半天,兩天時間就能讓無人車跑起來。
  • Drive.ai雨夜自動駕駛全程無人工幹預
    例如雨雪天氣,它令自動駕駛技術研發企業頭疼,但卻無法規避。不過,這個通往更完善自動駕駛技術目標的「絆腳石」,剛剛受到了那個神秘的自動駕駛創業公司Drive.ai的挑戰。雷鋒網(公眾號:雷鋒網)消息,經過一段密不透風的研發過程,矽谷創業團隊Drive.ai剛剛對外公布了一段長約4分鐘的測試視頻。
  • 法國維數(VSORA)推出支持自動駕駛L4、L5千兆浮點運算(PetaFlops...
    Vsora的創新架構在於DSP設計的程序化,其靈活的可擴展性,實現了純軟體的多核設計。在同一架構下,實現DSP與AI人工智慧加速器的雙重功能。特別適合自動駕駛產業的晶片設計與開發。AD1028是一個IP核,內嵌一個PetaFLOPS計算平臺,藉助於該IP核的高效運算能力設計的低功耗晶片L4 / L5控制單元,極大地幫助自動駕駛行業縮短晶片設計周期。
  • 讓自動駕駛汽車開口「說話」!看 Drive.ai 如何完成人機溝通這個大...
    雖然無法透析自動駕駛汽車的內心,但在面對滿是人類的環境時,想必它們也是崩潰的。因此對於那些要在嘈雜的街頭部署自動駕駛汽車的公司來說,如何教會自動駕駛汽車與人類溝通成了一大難題。「問題在於如何取代眼觀六路,耳聽八方的司機。」Drive.ai 產品和設計主管 Bijit Halder 說。
  • 自動駕駛如何找準定位的位置
    自動駕駛定位有兩種主流方法:一種是絕對定位法,直接測出空間位置坐標;另一種是相對定位法,已知現在所處位置,和下一步移動的方向和距離,計算出下一步位置。 2000年,軟銀投資阿里巴巴,電商時代自此開始;20年後,軟銀9.4億美元押注無人駕駛運貨車創業公司nuro,這是否預示,20年自動駕駛時代即將開啟?
  • Level 3自動駕駛集體難產,小鵬汽車們想激進破局
    Level2自動駕駛技術已經逐漸普及,但在車企向Level3自動駕駛進階之時,卻被安全要求踩下了剎車。上周三的博世技術交流日上,博世底盤控制系統中國區總裁陳黎明表示,博世的L2級自動駕駛產品今年已經在40多款車型上搭載,但Level3的進展明顯偏離了預期。
  • 自動駕駛計程車怎麼收費?哪個城市可以自動駕駛計程車?
    11月1日上午,廣州公交集團白雲公司舉行自動駕駛計程車發布儀式,宣布創新推出全國第一輛自動駕駛計程車,並於當天開始在大學城投入試運營。  這臺獨特的自動駕駛計程車由廣州公交集團白雲公司運營,文遠知行WeRide.ai提供技術支持,選用的車型是廣汽新能源GE3純電智聯SUV,車側貼有明亮的流線型自動駕駛標識。
  • Drive.ai自動駕駛汽車德州上路 亮橙色車身+4塊LED屏傳遞安全感
    Drive.ai自動駕駛汽車德州上路 亮橙色車身+4塊LED屏傳遞安全感  Emma Chou • 2018-07-31
  • 回顧:Drive.ai 、文遠知行WeRide、51VR,三大視角解讀自動駕駛仿真
    目前行業內逐漸達成共識,仿真成為每一位自動駕駛玩家的技術儲備。擁有10年自動駕駛經驗的Waymo依舊非常依賴模擬測試;百度阿波羅也早早將仿真平臺作為其主要的核心技術;Roadstar.ai、Pony.ai、AutoX等諸多自動駕駛初創公司都在自主研發模擬器。不同於雷射雷達、晶片、算法,自動駕駛模擬器因對標公共環境路測,其發展相對較晚,擁有成熟產品形態的公司較少。
  • 專家:特斯拉今年實現Level 5自動駕駛不現實
    他表示:「我依然有信心,我們將在今年內實現L5級自動駕駛的基本功能。我認為L5級自動駕駛已經不存在根本性的挑戰。」國際汽車工程學會(SAE International)對L5級自動駕駛的定義是「能夠在所有條件下、在所有道路上執行所有駕駛功能的車輛,且不需要人類安全員」,這一定義也被美國交通部所採用。
  • 百度前員工的自動駕駛項目Pony.ai獲1.12億美元融資 | 鈦快訊
    鈦媒體快訊 | 1月16日消息:華人在矽谷的自動駕駛創業項目Pony.ai完成1.12億美元融資,由晨興資本和君聯投資聯合領投,種子輪的投資者紅杉中國、IDG資本、洪泰資本等機構也參與了跟投與前一陣子處於風口浪尖中上的景馳科技類似,Pony.ai也是由百度前員工創立的自動駕駛創業項目,在矽谷和中國兩地設立有辦事處。