【極道智能數據系統】直擊AI訓練痛點,助力自動駕駛

2020-12-17 硬派科技

【極道智能數據系統】直擊AI訓練痛點,助力自動駕駛

來源:財訊網 2020-12-15 16:13:59

智能汽車終極遠景是自動駕駛和互聯生態的打造,受益於近年來各國政策推進、相關技術實現突破及車企產品逐步落地,全球無人駕駛汽車正在迎來較大增長。Frost & Sullivan預測,到2030年自動駕駛(私家車)市場規模將達到600億美元,其中2020年被認為行業快速增長的元年,L4級自動駕駛車將在相當長時間內扮演重要角色。

在自動駕駛中,車與車、車與路等對外互聯的智能化車體是車輛根據路況信息做出剎車、避讓、減速、轉彎、超車等動作的關鍵。要形成如此嫻熟的駕駛技術,這些車輛是如何練就的呢?

自動駕駛系統的核心要素是算法、算力和數據,其中算法是靈魂,數據和算力是基礎。構建高度可擴展的數據平臺和計算平臺,是自動駕駛系統的首要問題。

高效的數據管理系統,MetaView

人工智慧作為自動駕駛汽車的"大腦",所擁有的準確指揮能力並非與生俱來,而是靠前期的數據積累和後期的AI訓練。

· 第一步:海量數據收集、存儲

車上裝有多種多樣的傳感器,如果以每天行駛6小時-8小時計算,每周會收集到高達PB級的數據。海量的圖像和雷達數據在進行清洗、標記、存儲後,被用於訓練算法、學習道路規則、並發現車輛運行的深層神經網絡中的潛在故障,然後不斷地迭代循環執行上述訓練步驟,直到滿足自動駕駛對精度的訓練需求。

面對多樣化的數據來源,數據存儲數據管理也是自動駕駛訓練所面臨的主要挑戰。高效的訓練系統不僅需要高性能的分布式存儲系統,還需要統一對海量數據進行特徵管理、快速發現數據、構建數據集合;甚至能夠對數據集的合併、拆分、過濾等進行數值填充,並行處理。數據的存儲和管理效率,將直接決定一個優秀自動駕駛訓練系統的成敗。

極道存儲系統支持海量數據的收集,傳感器或雷達採集的數據可通過對象或文件的形式進入極道存儲系統;同時,極道的對象存儲和並行文件系統對海量小文件的讀寫進行了優化,提高了對象與文件的讀寫能力,系統性能、吞吐量明顯高於同類產品。

· 第二步:數據管理支持

存儲只是數據治理的第一步,傳統存儲解決方案或開源HDFS提供的功能大多僅限制於此。但極道MetaView在存儲基礎上,還提供數據管理支持,包括實時數據追蹤、秒級數據檢索、動態數據重組以及自動數據溯源等功能。

數據進入存儲系統後,用戶可通過MetaView發現新數據;同時,用戶還可通過MetaView的標籤功能給數據進行自定義追加,作為後續的訓練數據集。

· 極道MetaView支持任意數量的鍵值對作為標籤。

強大的策略引擎支持用戶自定義編寫程序,數據在進行分析或主動學習時,系統自動生成標籤。訓練階段用戶還可通過複雜的標籤表達式、數據特徵進行檢索,檢索結果存為數據集。不同的表達式則生成不同的訓練集和驗證集。在百億規模下極道所有操作可秒級完成,MetaView提高了自動駕駛企業的數據治理能力。

異構融合架構,助力昂貴的AI訓練

自動駕駛系統訓練過程中,模型訓練和仿真需要使用大量的異構計算資源(GPU、CPU、NPU)。極道從中不僅看到了AI算力需求的迅勐增長,也看到了用戶的諸多痛點——算力昂貴。

這主要是因為用戶的稀有計算資源利用率低,計算訓練的並行程度不充分;相關行業和企業所面臨的多樣化計算框架集成和運維難度大;以及面對分布式機器學習和深度學習的參數配置難和開發效率低。

自動駕駛訓練涉及到數據的多樣化處理,需要根據實際情況搭建或調整不同計算處理模式的算法和模型,資源利用率制約著模型訓練效率。例如,在大規模數據上訓練模型,很有可能會利用Map Reduce並行的方法對數據進行預處理,剔除無效特徵、常數列、標準化、歸一化數據採樣,再根據需求啟動不同的分布式機器學習或深度學習框架。

這種包含大數據Map Reduce和各種人工智慧異構框架的動態構建和融合需要對用戶完全透明,相關計算過程結束後計算框架會自動銷毀,資源再次被釋放出來並共享給其它的計算和數據處理應用,才能夠真正的打破異構計算框架帶來的資源壁壘,提升資源利用率。

· 極道計算數據流系統Achelous

極道採用了先進的多計算框架融合技術,在統一計算資源管理和分配的基礎上,靈活地按需動態生成計算框架。在一個集群內共享硬體的前提下,動態實現了Map Reduce、高性能計算、批量計算和多種分布式機器學習、深度學習計算框架的融合共存。

同時,極道Achelous能夠對稀有計算資源GPU進行高級策略調度,例如顯存調度、拓撲調度等,提高異構計算集群的資源利用率。極道Achelous的智能執行引擎,利用數據流技術描述AI的訓練工作流程,協助研發人員儘可能數據並行和多種模型並行,減少人為幹預,提升自動化程度和訓練效率。

隨著應用對算力要求的變化,計算資源會根據需要及時添加到計算集群中。極道Achelous採用多級調度和分布式調度器,在形成統一調度空間的前提下能夠動態擴展、均衡負載,突破大規模計算集群規模的瓶頸。截至目前。極道計算數據流系統Achelous可以預裝到包含英偉達DGX和多家第三方GPU加速伺服器上,為自動駕駛模型訓練保駕護航。

自動駕駛領域解決方案,極道智能數據系統

極道智能數據系統的"三駕馬車":計算數據流系統Achelous、分布式存儲系統ANNA/ALAMO和數據管理系統MetaView相互配合,協同設計。在高自動化的自動駕駛應用領域從數據採集、數據預處理、數據處理、模型訓練、模型部署到推斷過程,全程一體化完整的高效運行,幫助用戶有效利用資源,快速構建業務模型,將數據轉化成數據資產。

· 智能動態集群

Achelous按需智能構建業務集群,動態分配環境、CPU、GPU、內存、存儲等資源,降低運維成本,壓縮資源配置時間,讓用戶更專注於自動駕駛模型訓練。

· 合適的數據存儲

極道分布式存儲系統ALAMO/ANNA和計算數據流系統Achelous的協同設計,能夠更快、更準確的感知數據特徵與業務需要,幫助存儲系統選擇更好的緩存策略和數據一致性策略,讓數據發揮更好的性能。

· 統一系統管理

所有數據相關業務系統部署在極道智能數據系統上,可集中調度AI模型訓練所需的各種計算和存儲資源,統一進行數據預處理、數據處理、數據集管理、模型管理、模型評估、模型部署甚至模型推薦。

· 可視化建模

Achelous基於極道智能數據系統對業務系統的集中管理,可以通過可視化界面快速構建自動駕駛AI訓練模型。

· 智能業務計算

Achelous按照自動駕駛AI訓練模型的需要,可以快速輕鬆構建分布式的深度學習和機器學習環境,利用AI數據流進行數據並行和模型並行,有效壓縮研發時間,簡化多框架分布式計算環境。

· 跨系統數據管理

極道數據管理系統Metaview可按照AI訓練模型的需求,抽取調用多系統來源數據,充分理解數據特徵,輕鬆動態構建數據集合,進行複雜特徵管理。例如根據特徵構建訓練、測試集合、發現噪聲樣本、處理缺失值以及特徵將維等,讓數據集管理不再成為瓶頸。

在AI訓練全量業務模式下,所有數據業務系統都可以部署在極道智能數據系統上,通過集中管理並調度資源,完成跨系統計算和數據調用,提升業務關聯度以方便數據交互,為更高級自動駕駛模型AI訓練提供更統一、更高效、更智能的服務。在不涉及管理業務系統的輕量業務模式下,極道為高級自動駕駛模型AI訓練提供統一的資源管理,以提升AI算力的利用率,充分發揮稀有計算資源的能力。

作為智能網絡的重要延伸支點,自動駕駛領域正在成為極道的又一發力點。極道智能數據系統的高度智能化計算框架動態構建和系統資源的統一調度,正不斷突破計算集群規模瓶頸,為自動駕駛領域帶來巨大的計算力,同樣也將加速其他領域科學研究和商業創新的智能化進程。

關於極道

極道,專注於數據"存"、"管"、"算"的創新數據系統公司,由國內頂尖的存儲和數據分析專家團隊建立,是一家以分布式系統為核心幫助客戶提升IT資源效率,提供高效智能的數據處理基礎平臺的數據系統公司。

極道的核心產品涵蓋了分布式並行文件存儲、強關聯大規模實時數據管理系統,以及集群的調度系統和執行引擎,以滿足企業對數據處理、分析和建模的多樣化需求。極道注重自主智慧財產權和產品的可控性,核心軟體系統均為自主研發,已擁有多項專利和軟體著作權。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

相關焦點

  • 超越空間直擊NVIDIA GTC 中國線上大會,助力點亮AI
    超越空間直擊NVIDIA GTC 中國線上大會,助力點亮AI 來源:財訊網 • 2020-12-21 17:29:08
  • Drive.ai 王弢:自動駕駛的賽道上,如何與時間賽跑 | 2018 全球智能...
    Drive.ai正式在德州阿靈頓向公眾開放無人駕駛接送服務。Drive.ai的思路,自動駕駛落地初期,先推出城市自動駕駛車輛,然後不斷迭代,直至推出任何時間能去任何地點的私家無人車。此外,創立於2015年的Drive.ai現在有170人的團隊,其中75%為工程技術團隊。
  • 回顧:Drive.ai 、文遠知行WeRide、51VR,三大視角解讀自動駕駛仿真
    目前行業內逐漸達成共識,仿真成為每一位自動駕駛玩家的技術儲備。擁有10年自動駕駛經驗的Waymo依舊非常依賴模擬測試;百度阿波羅也早早將仿真平臺作為其主要的核心技術;Roadstar.ai、Pony.ai、AutoX等諸多自動駕駛初創公司都在自主研發模擬器。不同於雷射雷達、晶片、算法,自動駕駛模擬器因對標公共環境路測,其發展相對較晚,擁有成熟產品形態的公司較少。
  • 直擊行業痛點 國內頂級專家鷺島「探路」智能工程
    盧超穎)國內頂級專家齊聚鷺島,直擊智能工程行業諸多痛點。來自學術界和產業界的智能工程頂尖專家、行業大咖等匯聚一堂,從供應鏈金融、區塊鏈、行業大數據、人工智慧+信用系統、共享倉儲與可視化物流等多方面,分享技術研發、創新應用、生態圖景等,把脈行業發展趨勢,洞察行業發展先機,共商行業創新變革之道。
  • 自動駕駛開發者利器:華為雲自動駕駛雲服務Octopus亮相上海車展
    華為雲自動駕駛雲服務Octopus包含自動駕駛數據、訓練和仿真三大子服務,覆蓋自動駕駛數據、模型、訓練、仿真、標註等全生命周期業務,將有力提升企業的自動駕駛產品開發效率。  數據服務:處理車載硬體平臺上輸出的傳感器數據,回放雷達、攝像頭等不同格式的數據;支持PB級海量存儲、交互式大數據查詢和海量數據治理。
  • Drive.ai雨夜自動駕駛全程無人工幹預
    例如雨雪天氣,它令自動駕駛技術研發企業頭疼,但卻無法規避。不過,這個通往更完善自動駕駛技術目標的「絆腳石」,剛剛受到了那個神秘的自動駕駛創業公司Drive.ai的挑戰。雷鋒網(公眾號:雷鋒網)消息,經過一段密不透風的研發過程,矽谷創業團隊Drive.ai剛剛對外公布了一段長約4分鐘的測試視頻。
  • 主攻量產 Roadstar.ai發布新一代自動駕駛解決方案Leo·靈
    【網易智能訊 11月8日消息】在第五屆世界網際網路大會召開期間,自動駕駛初創公司Roadstar.ai對外公布新一代自動駕駛解決方案Leo·靈,這是主打量產的Level 4解決方案。據了解,今年上半年,Roadstar.ai就發布了自動駕駛Level 4解決方案Aries·銳,新一代Leo·靈相比上一代產品解決了很多缺點,比如銳要更換一個零件需要拆開整體,靈則只需要替換局部零件,十幾分鐘就能完成操作。Roadstar.ai聯合創始人周光表示,靈平臺具備穩定性和可維護性的特點,生產、調試時間可以縮短到半天,兩天時間就能讓無人車跑起來。
  • 騰訊自動駕駛總經理蘇奎峰:軟體與服務是騰訊自動駕駛業務的核心...
    峰會主要聚焦「自動駕駛的量產時代、單車智能和車路協同的共演之路、新型的車內交互探索」三大主題,數十位來自高校、主機廠、Tier 1、科技公司的嘉賓與與會者共同探討了智能駕駛的未來發展方向。我們在考慮當下技術條件的時候,要去看應用場景,哪些更適合落地,就更關注哪些點。騰訊做自動駕駛,是想更多助力這個產業,給產業提供更大的幫助。總結起來,自動駕駛大概分幾個落地場景,一個是乘用車自動駕駛,一個是礦山、港口、物流等特定應用場景,未來最大的也許是無人駕駛計程車,Waymo 以及國內很多公司都在做這樣的場景測試和驗證。
  • 2020WNEVC創新技術解讀|基於昇騰AI的自動駕駛雲服務技術
    晶片和AI訓練平臺,通過軟硬體加速,實現車雲協同的自動駕駛數據快速閉環。Octopus提供數據、訓練和仿真服務三大服務,旨在降低自動駕駛開發門檻,讓自動駕駛開發變得更智能、更高效、更便捷。從而助力車企及開發者快速上市自動駕駛,將更多的精力,投入到核心能力的構建中去。
  • 從場景落地,到改變交通網絡,自動駕駛到底如何定義未來,這10位大牛...
    中科院自動化所複雜系統管理與控制國家重點實驗室主任、中國自動化學會副理事長兼秘書長、青島智能產業技術研究院院長王飛躍、採埃孚中國投資有限公司工程技術中心總監綦平、Mobileye中國區總監Boaz Sacks、偉世通自動駕駛首席架構師王凱 、深圳市城市交通規劃設計研究中心車聯網項目主管 劉琪、Roadstar.ai 創始人兼CEO 佟顯喬、安波福電氣分配系統亞太中心產品工程總監 、應用工程總監餘寧、
  • ...科技:全景感知,智能大腦……智能自動駕駛環衛清掃車隊亮相北龍湖
    攝像頭能智能識別行人,5G系統實時上傳畫面,清潔主刷寬度0.7米,低耗能電池可連續工作12小時……近日,智能自動駕駛環衛清掃車亮相鄭東新區,它到底有多少黑科技,又有多牛……今天我們為您一一揭秘。無人駕駛如何實現?
  • 自動駕駛計程車怎麼收費?哪個城市可以自動駕駛計程車?
    自動駕駛計程車 長眼睛  據悉,這臺應用了文遠知行WeRide.ai自動駕駛技術的白雲純電SUV計程車,配備了2個雷射雷達,3個專業攝像頭,1個毫米波雷達,通過多傳感器融合的方法,實現360度全方位感知,讓計程車真正地智能起來。
  • 蘇州相城區發布智能駕駛「上路計劃」,福特開放自動駕駛汽車數據集
    2020年2月,發改委、工信部、交通運輸部等11個國家部委聯合印發了《智能汽車創新發展戰略》,代表我國智能汽車頂層設計出爐,戰略提出要實現有條件自動駕駛的智能汽車達到規模化生產,實現高度自動駕駛的智能汽車在特定環境下市場化應用。
  • Drive.ai、Waymo率先商業化,智能駕駛加速進入衝擊階段
    繼Drive.ai和德克薩斯州阿靈頓市政府籤署了商業合約後,在日前舉行的2018全球智能駕駛峰會上,Drive.ai的聯合創始人王弢就《自動駕駛技術的快速迭代與落地》進行演講並強調,「Drive.ai到2020年計劃拓展至15個城市,我們正與全球多個城市的當地政府和合作夥伴進行協商」。
  • 乾貨分享:遊戲技術如何助力自動駕駛仿真測試
    自動駕駛虛擬仿真技術,作為推動自動駕駛落地的必要工具,已經被行業廣泛運用。與在遊戲中復現虛擬的現實世界類似,自動駕駛虛擬仿真系統,是通過虛構一個幾何形象、物理規律乃至運行邏輯都與真實世界無限接近的虛擬環境,讓自動駕駛汽車在其中運行,積累算法訓練和驗證需要的海量數據,以此解決現實中測試成本高、耗時長、風險高、場景局限性大等問題。
  • 深度揭密:華為自動駕駛雲服務Octopus,一隻八爪魚的前世今生
    2020年1月9日,華為自動駕駛雲服務首次在湘江新區落地:「湖南智能網聯汽車產業雲是華為自動駕駛雲服務在全球的首次落地。它被外界形象地稱為『八爪魚』,能牢牢抓住行業痛點,通過強大的數據服務、訓練服務、仿真服務能力,為從事自動駕駛、智能駕駛研發企業提供一站式全流程的服務。」
  • Argo AI和Waymo公開發布自動駕駛數據集
    自動駕駛汽車每天可以收集4TB或更多的傳感器原始數據。今年3月,Aptiv成為自動駕駛系統開發大公司中第一個公開發布傳感器數據的公司。6月16日,2019年計算機視覺和模式識別大會(CVPR)在美國長灘開啟。Waymo和Argo AI也在此次會議中發布了數據集。自動駕駛產生的實時數據能讓車輛有效地了解周圍的環境,並在真實世界中行駛。
  • 英偉達搶跑自動駕駛落地應用,並將成立中國研發中心
    其中,在自動駕駛領域,英偉達也帶來了滿滿誠意。 分場景的自動駕駛解決方案 繼黃教主5月在自家廚房搬出了針對L2級,功耗5W,算力10 TOPS的自動駕駛晶片後,此次英偉達也帶來了適合L5級自動駕駛使用的更快的AI晶片。
  • 華為Octopus「八爪魚」助力「長沙智能駕駛第一城」加速跑
    Octopus八爪魚有一個豐富聰明的大腦,並且它的學習程度高、進化能力強,這與自動駕駛落地所需要的功能十分相似。首先是需要海量的傳感器來提供巨量的數據,它還需要一個聰明的大腦來處理這些數據,並且它對仿真訓練、人工智慧算法以及海量的算力有著強烈的訴求,這恰恰是「八爪魚」(產業雲)能帶給客戶的價值呈現。
  • 中汽數據周博林:ASAM 標準助力自動駕駛仿真測試落地
    回到今天的主題上,今天主題為《ASAM OpenX 標準助力自動駕駛仿真測試落地應用》。一、自動駕駛行業發展背景隨著自動駕駛等級的提高,面向傳統汽車的測試工具與測試方法已不能滿足自動駕駛汽車測試的需要。比如,自動駕駛汽車無法在一些危險的場景下進行實際的測試。