據ABI Research預計,到2027年全球汽車市場對先進駕駛輔助系統(ADAS)的需求將增長兩倍,這對新型汽車創新者、傳統整車廠商(OEM)、Tier1供應商,以及汽車系統級晶片(SoC)廠商無疑都是好消息。但汽車行業領導者早已將目光投向了更遠的全自動駕駛和自動駕駛計程車(RoboTaxi)。在從L2/L3級ADAS向L4/L5級全自動駕駛演進的過程中,神經網絡加速器將是至關重要的組成部分。這些ADAS/自動駕駛系統需要處理各種各樣的複雜場景,比如從多個攝像頭和雷射雷達的傳感器融合中提取數據,以實現自動泊車、十字路口管理,以及複雜城市環境安全導航等高級功能。能夠結合高性能、低延遲和高能效的AI加速器將是實現高級別自動駕駛的關鍵所在。4ztEETC-電子工程專輯
想了解ADAS/自動駕駛的最新設計和市場趨勢?請即刻報名參加:汽車電子高峰論壇4ztEETC-電子工程專輯
4ztEETC-電子工程專輯
近日Imagination推出專門面向ADAS和自動駕駛應用的新一代神經網絡加速器(NNA)IMG Series4。據稱這種AI加速器採用全新的多核架構,可提供高達600 TOPS(每秒萬億次操作)的超高計算性能,並且可為神經網絡工作負載提供低帶寬和低延遲特性。4ztEETC-電子工程專輯
4ztEETC-電子工程專輯
Imagination視覺和人工智慧部門高級總監Andrew Grant列舉出IMG Series4的五大特性:4ztEETC-電子工程專輯
Andrew Grant認為,Series4 NNA將會成為開發ADAS和自動駕駛汽車的行業標準平臺。一些行業創新者已經在著手打造支持下一代ADAS功能和自動駕駛的系統級晶片,這一AI加速平臺將為他們提供算力、功耗、帶寬和延遲等方面的最佳組合性能。4ztEETC-電子工程專輯
隨著汽車電子從數字駕駛艙/人機界面(HMI)向ADAS和自動駕駛的演講,在保證安全性和可靠性的同時,對處理性能要求越來越高。比如,Level 2級別的駕駛員監測功能只需要10 TOPS的算力即可處理,而Level 3-4級別的自動泊車功能就需要100 TOPS性能。要實現Level 5級別的完全自動駕駛,必須有500 TOPS以上的算力支持才行。4ztEETC-電子工程專輯
4ztEETC-電子工程專輯
Series4 NNA採用全新的內核架構,每個內核具有12.5 TOPS性能。若基於5nm工藝節點,8個內核的集群可提供: 100 TOPS的算力性能;30 TOPS/Watt 的性能功耗比;12 TOPS/mm^2 的性能密度;低延遲處理大量輸入數據。4ztEETC-電子工程專輯
4ztEETC-電子工程專輯
由4 個內核組成的 50 TOPS 集群能夠跨整個集群拆分各層,比如支持並行處理大型網絡的各層;減少整體延遲,特別是在擁有大尺寸輸入層的網絡上。而各內核能夠獨立運行,可以共同執行一個批處理任務,也可以分別運行各自不同的網絡。此外,這種4內核集群可以作為基礎模塊進行算力擴展。比如,4個50 TOPS集群就可以構成一個200 TOPS的多集群引擎。3個這種多集群引擎組合起來,就可以達到600 TOPS的算力性能,滿足Level 5自動駕駛算力要求。4ztEETC-電子工程專輯
4ztEETC-電子工程專輯
Imagination產品管理部門總監Gilberto Rodriguez對Series4新增的張量平鋪(Tensor Tiling, ITT)技術做了詳細介紹。網絡的多層是以融合內核的形式在加速器硬體流水線裡運行的,而融合內核之間的特徵圖需要通過外部存儲進行交換。在不採用ITT技術的情況下,內核需要頻繁的DDR存取,因此會佔用很大的帶寬。4ztEETC-電子工程專輯
4ztEETC-電子工程專輯
若採用了ITT技術,就可以充分利用緊耦合的 SRAM 來融合更多的層,減少需要通過外部存儲交換的特徵圖,從而降低帶寬需求。4ztEETC-電子工程專輯
4ztEETC-電子工程專輯
ADAS和自動駕駛雖然呼聲很高,但仍然難以商用落地。究其原因,嚴苛的安全性和極高的算力和即時處理決策要求對汽車廠商及其供應商提出了很大的挑戰。素以GPU內核著稱的Imagination技術公司開始發力AI加速器市場,最新發布的Series 4 NNA專為ADAS/自動駕駛應用而設計。雖然其多核集群架構可以提供高達600 TOPS的算力性能,但能否真正滿足完全自動駕駛的性能需求,還要看基於這種AI加速器內核的晶片和系統開發,真正應用到自動駕駛實際場景中能否勝任還需要市場的檢驗。4ztEETC-電子工程專輯
責編:Amy Guan4ztEETC-電子工程專輯