如何打造自動駕駛計算中樞?地平線車規級AI處理器背後的「秘密」 |...

2020-12-20 雷鋒網

*地平線(上海)晶片研發總經理吳徵

雷鋒網新智駕按:10 月 26 日至 27 日,2018 全球智能駕駛峰會在蘇州召開,本次峰會由蘇州市相城區人民政府主辦,蘇州高鐵新城管理委員會、雷鋒網(公眾號:雷鋒網)新智駕和數域承辦,邀請到來自主機廠、科技公司、資本機構和產業研究機構等領域的多位專家,共同打造了一場智能汽車和自動駕駛領域的頂級峰會。

本次峰會上,地平線(上海)晶片研發總經理吳徵發表了題為《車規級AI處理器—打造自動駕駛計算中樞》的主題演講。吳徵博士曾在三星半導體、矽瑪特、飛思卡爾和摩託羅拉等多家跨國公司擔任中國區高管職位。吳徵博士從事晶片/半導體行業超過二十年,近期加入地平線,負責研發自動駕駛的AI車規級處理器。這也是吳徵博士加入地平線以來的第一次公開演講。以下為吳徵演講全文,雷鋒網(公眾號:雷鋒網)新智駕進行了不改變原意的編輯(略有刪減):

地平線是一家什麼樣的公司?

如今我們已進入一個大數據時代,無論是人們在淘寶、京東網上購物,或使用手機上網、拍照,或在市區裡開車「一不小心」被拍......生活中無時無刻不在產生大量的數據。日積月累的數據量非常龐大,但多數情況下,眾多貌似是重複性的、無用的數據被擱置在旁,真正使用時又非常困難。

如何將大量的無用數據轉化成有用數據,挖掘其背後的價值?這是一個很大的挑戰。這涉及到如何有效地進行數據處理,本質上看,這是一大計算問題。

AI作為一種的關鍵技術,它基於大數據進行訓練和推理,可將無用數據進行「識別」, 把非結構化數據轉化成結構化數據,提取有用的信息。首先,我們來回顧一下近幾年AI計算晶片的發展:

  • 英特爾的CPU傳統架構,在處理大量數據方面顯得效率不高,算力不足;

  • 後來,英偉達的GPU被應用,其計算能力強,性能強大,但也有局限性,比如功耗高,成本貴;

  • 最近幾年,FPGA盛行,其架構適合CNN計算,能耗比高,現場可編程適合各種場景,但對一般開發者來說,其開發較難;當大規模量產時,成本、功耗也比較高。

最近幾年,一些平臺公司,例如Google,本質上是一家軟體網際網路公司,亦開始擁抱硬體,甚至進軍晶片。很重要的一點是,龐大的數據量需要有效處理。目前越來越多的公司開始考慮軟硬體融合,打造生態圈。

作為一家技術驅動型的公司,有著強大人工智慧算法的地平線,自成立即定位於一家軟硬體結合的公司, 其核心是要打造自己的BPU (Brain Processing Unit)晶片,類似於 Google 的TPU。地平線瞄準的是嵌入式AI 晶片,應用在物聯網方面的終端產品,節點和控制設備, 專注於邊緣計算。這與研發伺服器,雲端AI晶片不同, 前者計算性能更強大,同時功耗和成本也是需要考慮的問題。

AI計算技術與應用場景高度相關。以人臉識別和自動駕駛環境識別為例,其訓練、推理及算法不同。 在一定程度上可以理解為:場景決定算法,算法決定晶片。反之,晶片又要求有算法,只有軟硬體接合,提供解決方案應用到場景才能最終解決問題,這是一個閉環系統。

2015年成立之初,地平線確定專攻AI嵌入式晶片,當年9月開始研發BPU;這期間地平線也在發力FPGA,同英特爾合作開發ADAS系統;去年6月,地平第一代AI晶片(BPU)流片,並在去年年底發布了第一代AI晶片「徵程」和「旭日」。地平線BPU架構正在不斷完善,性能更強,於今年初發布基於BPU第二代架構的Matrix視覺感知方案,並在CES上進行公開實車Road Show。今年地平線兩款晶片已經開始量產。

今年底,地平線將完成新一輪融資,金額為5-10億美元,投資方包括一家和英特爾規模相當的晶片公司,以及一家知名汽車廠商。

以BPU為核心,地平線提供的是一整套軟硬體綜合解決方案,包括晶片,算法,編譯器和運行時庫,以及訓練仿真的綜合平臺。業務覆蓋三大領域:智能駕駛、智慧城市、智慧零售。

車規級AI處理器

算力是智能駕駛晶片的核心問題,地平線專注於視覺感知領域。

車規級AI處理器的研發目前面臨幾大挑戰:強大的計算能力,可靠性,功能安全,和質量管理與長周期的支持體系。

目前一輛汽車大多裝載多個攝像頭,每個攝像頭或720P,或1080P,每秒30幀。未來車身上會有越來越多的攝像頭,6個、8個甚至12個,逐漸升級的解析度,為自動駕駛帶來的是巨大的數據處理量。另外一方面,基於神經元網路的AI計算量也是巨大的。

就目前看來,面向L2、L3級自動駕駛處理器的算力要求達到數十個TOPS,L4到L5級將達到數百,甚至千TOPS級的要求。

不同於用在一般消費產品方面的晶片,用於汽車方面的半導體面臨的環境更嚴苛,對可靠性要求高。感知決策關係著汽車與人身安全,所以對功能安全要求更高。

一款晶片從晶片定義,設計,流片,測試和驗證,到獲得車規級認證需要花費很長的時間。另一方面,汽車晶片進入供應商或主機廠,從導入設計到設計採納,一輪輪測試與驗證,一款晶片與OEM磨合成功,並實現真正量產至少需要3-5年。這是一筆很大的投入。而且,汽車上的MCU、信息娛樂等晶片目前並沒有中國品牌的身影,可見應用到汽車方面的半導體晶片的門檻非常高。

應用於汽車方面的晶片或車規級晶片與消費級晶片不同,可從以下幾個維度進行對比:

  • 溫度方面:消費級晶片使用溫度一般在0°—70°;工業級半導體使用溫度更寬一點;在汽車上,溫度需要低至-40°,高溫要到105度到125°;

  • 從使用周期來看:消費型半導體為1—3年,而一輛汽車的壽命至少為10—15年;

  • 從現場失效率來說,消費等級的是小於10%, 而汽車晶片的目標要求為零失效率。

值得一提的是,汽車半導體需要通過AEC-Q100認證。在質量認證方面,除零失效率,汽車半導體產商還需經過TS16949質量管理認證和10年以上的支撐體系。

另外,和安全相關的晶片應用到汽車上,需經過功能安全認證,來保證安全護航。這是值得重視的一點。

為什麼功能安全認證如此關鍵?

和手機相同,電子信息化比重越來越大的汽車可以看作為是一個複雜的嵌入系統,無法做到盡善盡美,失效是不可避免的,一般分為兩種情況:

功能安全對應汽車方面即ISO26262標準。這是一整套流程,即從需求,開發,驗證到認證,從IP,EDA工具到晶片設計,從硬體到軟體,系統均有規範,形成一套完整的功能安全體系。面向量產的晶片需經過認證達到一定ASIL等級,例如和ABS,EPS相關的晶片必須達到ASIL-D等級。

接下來,再看面向自動駕駛的AI處理器如何滿足強大算力的需求。

傳統的馮諾依曼架構已無法滿足深度學習的計算要求,地平線自主創新的BPU,是一種多指令多數據MIMD架構,其能夠滿足數據流的計算要求,實現靈活的數據分發和計算的並發異步處理,並對CNN計算中關鍵的乘加運算(MAC)單元達到很高的利用率,所以地平線BUP的每瓦TOPS性能相當突出。

地平線車規級AI處理器晶片的最新進程

地平線BPU於去年發布的第一代高斯架構,到目前的第二代基於伯努利架構,均採用新型稀疏二值化神經網絡結構,可支持更多路視頻輸入,支持多傳感器融合,目前主要集中在感知領域,後期將進行定位,建模,預測,路徑規劃到最終決策。

地平線面向智能駕駛的BPU和Matrix視覺感知系統,已經向歐美汽車廠商交付。BPU 2.0可以實現多路攝像頭、多場景融合,能效更佳,  可在30W的功耗下實現基於像素級的圖像識別分割,可識別人、牌照、車型、交通紅綠燈、路標、障礙物等等。

地平線目前的第二代車規級AI晶片,已進入最後的開發階段。與第一代不同,前者從方框級的識別精確到像素級的語義識別。

總體來看,基於自動駕駛,地平線打造的是車規級AI處理器或SoC,提供相關的軟體算法,核心編譯器、運行時庫,訓練,工具鏈一整套的平臺和整體解決方案。

最後,以地平線量產的兩款晶片名字來結尾,用於智能IPC的旭日(Sunrise)和用於智能駕駛的徵程(Journey)。在地平線看來,自動駕駛目前正在蓬勃發展階段,但未來的發展依舊面臨挑戰,無論是商業大規模落地還是技術實現方面。但這是一段美好的徵程,我們將像AI的深度學習一樣,不斷的學習,不斷的進步,攀登一座又一座的高峰,最終達到幸福的彼岸。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 專訪地平線創始人:國內首款車規級AI晶片是如何煉成的?
    作為國內估值最高的AI晶片技術企業,地平線此次發布的是一款面向自動駕駛場景的車規級AI晶片——徵程二代,據地平線介紹,這也是國內首款車規級AI晶片。車規級AI晶片是自動駕駛實現大規模落地的必要條件,但車規級晶片需要滿足「高安全性、高可靠性、高穩定性」的技術標準要求,並且需要經過嚴苛的研發、製造、封裝、測試和認證流程,因此相較於其他類型的晶片,車規級晶片的研發難度更高、研發周期也更長。而難得的是,地平線在技術突破的同時,在商業化上也有所斬獲。
  • 中國首款車規級AI晶片「地平線徵程2」出貨量超10萬
    12月1日,國內人工智慧晶片公司地平線對外公布,中國首款車規級人工智慧晶片地平線徵程2出貨量已超10萬,搭載此款晶片的汽車實現了L2+級自動駕駛。在第七屆世界網際網路大會上,這款晶片還入選「世界網際網路領先科技成果」。
  • 地平線副總裁張玉峰:車規級AI晶片門檻高
    中國證券報:如何評價目前國內車規級AI晶片發展現狀?有哪些瓶頸需要突破? 張玉峰:主機廠對晶片的採購和使用非常關注國產化。地平線在國內屬於第一家實現車規級AI晶片前裝量產的企業。從全球看,目前只有三家企業實現了車規級AI晶片的前裝量產,分別是英特爾Mobileye、英偉達和地平線。
  • 北京地平線信息技術有限公司創始人兼CEO餘凱:自動駕駛是邊緣計算...
    餘凱認為,自動駕駛帶來的便利更值得關注。自動駕駛數據的爆炸更需要更強大的邊緣計算產品接力。餘凱更看好邊緣處理器在智能駕駛發展過程中發揮的重要作用。據了解,自動駕駛L1-L5需要的強大算力促使軟硬結合創新驅動「新摩爾定律」。AI處理器的真實性能即將被重新定義。「AI晶片的『新摩爾定律』,即晶片的計算效率、編譯器和Runtime的優化、算法的優化三者相加,才能完成真是性能的全面優化。」
  • 北京地平線公司創始人兼CEO餘凱:自動駕駛是邊緣計算的一大重要應用
    自動駕駛數據的爆炸更需要更強大的邊緣計算產品接力。餘凱認為,自動駕駛帶來的便利更值得關注。自動駕駛數據的爆炸更需要更強大的邊緣計算產品接力。餘凱更看好邊緣處理器在智能駕駛發展過程中發揮的重要作用。據了解,自動駕駛L1-L5需要的強大算力促使軟硬結合創新驅動「新摩爾定律」。AI處理器的真實性能即將被重新定義。
  • 地平線聯合中興子公司 開發智能駕駛方案
    【太平洋汽車網 行業頻道】近日,專注於人工智慧晶片和邊緣人工智慧計算的初創企業地平線與中興通訊旗下英博超算籤署戰略合作協議,將合作開發L1-L4級別的智能駕駛解決方案(ADAS),並計劃於2020年在量產車型上適配。
  • 地平線四度亮相CES,車規級AI晶片徵程二代引爆多項量產合作
    拉斯維加斯2020年1月8日 /美通社/ -- 在拉斯維加斯舉行的2020年國際消費電子展(CES)上,邊緣 AI 晶片全球領導者地平線攜中國首款車規級AI晶片徵程二代、ADAS 解決方案、新一代Matrix自動駕駛計算平臺及一系列智能駕駛落地成果參展,向參展觀眾展示了一個多層次
  • 中國自動駕駛補完計劃:這款 AI 晶片為何如此重要?
    這一點在車載的計算需求量上有所呈現。目前汽車多是採用分布式 ECU 架構的小型處理器來處理簡單任務,隨著車聯網、自動駕駛對計算性能要求的提升,餘凱認為,車載計算將會演進到域控制器,吞吐更多的數據,執行更多的智能決策,汽車最終變成一臺有四個輪子的計算機。他預計到 2025 年,這一趨勢就會帶來汽車成本結構翻天覆地的變化,計算平臺以及軟體的成本佔比將大幅提升。
  • 地平線發布車規級AI晶片「徵程3」,「徵程5」性能超越特斯拉FSD
    「徵程3」湧動著車規級的基因,功耗為英偉達Xavier十分之一作為國內車載AI晶片領域的先行者,地平線在2019年8月率先發布中國首款車規級AI晶片「徵程2」且已實現大規模前裝量產一年後,為業界帶來了新一代高效能車載AI晶片「徵程3」。
  • 地平線發布AI on Horizon戰略,與首汽約車、禾賽科技分別達成戰略...
    這意味著,新時代下通過軟硬體結合驅動新摩爾定律,行業仍可以看到算力以18個月為一周期進行翻倍實現指數級增長。邊緣計算也伴隨高算力應運而生,可幫助自動駕駛算法在任意場景、極低功耗、甚至網絡通訊信號較差的環境下實現及時相應。地平線創始人兼CEO餘凱提到,伴隨著5G的誕生,邊緣計算正在加速布局至車端、甚至是基礎設施端。
  • AI晶片公司地平線融資6億美元
    昨日,人工智慧晶片技術創業企業地平線宣布獲得由SK中國、SK Hynix以及數家中國一線汽車集團與旗下基金聯合領投的6億美元左右B輪融資,估值達30億美元。本輪融資後,地平線將繼續投入更多資源用於產品研發,其車規級計算平臺和第三代晶片架構有望在年內取得突破性進展。
  • 地平線黃暢:將邊緣AI晶片做到極致,給自主機器人造計算平臺
    如下是實際在晶片上的性能結果,典型場景裡面的720P解析度的檢測分割,地平線的高效模型如果不優化處理,每幀處理的帶寬高達142兆,計算延遲43毫秒,器件利用率57%,對很多處理器來說是很高效率,但地平線覺得還不夠。 通過編譯器的自動優化,連接了算法和處理器架構,能夠逼近性能極限。
  • 地平線餘凱:大計算時代,邊緣AI晶片將如何改變未來城市
    而從移動網際網路開始到現在物聯網,我們看到另外一個趨勢,更多的計算從中央往邊緣遷移,毫無疑問帶來的好處就是剛剛大家都提到的,就是實時性、可靠性,設備在離線的情況下還可以正常運作,比如說我們自動駕駛汽車在路上跑的時候,過隧道的時候沒有信號,車如何自動駕駛?一定要靠不依賴網絡和雲端的邊緣計算。比如我們有很多安防類的企業,他們有一些現在是靠WIFI聯網處理,但是受信號和帶寬影響很大,也需要邊緣計算。
  • 國產車規級AI晶片零突破!地平線徵程2代出貨量達10萬
    日前,人工智慧晶片公司地平線對外宣布,中國首款車規級人工智慧晶片地平線徵程2出貨量已超10萬,搭載此款晶片的汽車實現了L2+級自動駕駛。作為一款經過量產驗證的國產車規級AI晶片,地平線徵程2滿足 AEC-Q100標準,可提供超過4TOPS(1TOPS=1萬億次計算每秒)的等效算力。典型功耗僅2瓦,配合高效的算法,每TOPS的算力可以處理的幀數可達同等算力GPU的10倍以上。
  • 成軍時便要做機器人時代的Intel,地平線帶來了L4級別的奧迪無人車
    4月26日,2018北京國際車展中,嵌入式人工智慧公司地平線在媒體溝通會上發布了公司新一代自動駕駛處理器徵程2.0架構,以及基於徵程2.0處理器架構的高級別自動駕駛計算平臺Matrix1.0。億歐汽車現場了解到,地平線同時搭建了模擬交通環境進行實時演示,讓參觀者能夠體驗該平臺在自動駕駛方面的功能。
  • 地平線劉福成:車載計算平臺打造軟體定義汽車基石
    隨著自動駕駛等級的上升,對自動駕駛晶片算力的要求也在成指數級上升。實際上,在L3、L4、L5級自動駕駛,大家到底用多少算力呢?現在也說不清楚,行業也沒有定論,但是在這種情況下,大家做的事情就是不斷地堆算力。這個好處是什麼呢?提供未來的可擴展性。算力中可疊加的功能是有空間的,特斯拉144TOPS的算力也沒有全用,這樣特斯拉就有很大的空間不斷地去豐富它的最新功能,這就是預留算力的好處。
  • 汽車AI晶片創業公司地平線,是如何實踐軟體定義汽車的?
    晶片作為未來智能汽車的大腦,直接影響智能座艙和自動駕駛,自然也成為智能汽車時代的必爭之地。智能汽車面對非常複雜的環境,感知、融合、決策需要巨大的計算能力,而傳統的通用計算平臺的算力功耗比TOPS/W居高不下,而且算力的利用率極低,已經成為智能汽車性能提升的瓶頸。因此AI晶片成了車用晶片的最佳解決方案,特斯拉於2016年開始了汽車AI晶片的自研之路。
  • 四戰CES,國產晶片公司地平線的崛起與加速
    一年後,地平線擁有了獨立的展位,並帶來了主打自動駕駛市場的「徵程」系列處理器與瞄準AIoT邊緣計算市場的「旭日」系列處理器,正式向全球宣告地平線的晶片的從無到有。以晶片為基礎,地平線找到了從技術過渡到產品的切入點。
  • 地平線徵程 3 助力嬴徹科技自動駕駛卡車量產,用科技實現物流美好
    地平線是邊緣人工智慧晶片的全球領導者,具有領先的人工智慧算法和晶片設計能力。今年 6 月,搭載地平線徵程 2 的長安旗艦車型 UNI-T 正式上市,徵程 2 成為首個上車量產的國產 AI 晶片,地平線也正式開啟車規級 AI 晶片的前裝量產元年。
  • 四戰CES,國產晶片公司地平線的崛起與加速 | CES 2020
    對於邊緣人工智慧晶片企業地平線來說,四年來每一次的CES登臺都是實打實的印記。2017年初亮CES時,地平線甚至沒有自己的展臺,而是以英特爾FPGA硬體平臺的嵌入式ADAS系統提供商的身份出現。一年後,地平線擁有了獨立的展位,並帶來了主打自動駕駛市場的「徵程」系列處理器與瞄準AIoT邊緣計算市場的「旭日」系列處理器,正式向全球宣告地平線的晶片的從無到有。