【極道智能數據系統】直擊AI訓練痛點,助力自動駕駛

2020-12-17 硬派科技

【極道智能數據系統】直擊AI訓練痛點,助力自動駕駛

來源:財訊網 2020-12-15 16:13:59

智能汽車終極遠景是自動駕駛和互聯生態的打造,受益於近年來各國政策推進、相關技術實現突破及車企產品逐步落地,全球無人駕駛汽車正在迎來較大增長。Frost & Sullivan預測,到2030年自動駕駛(私家車)市場規模將達到600億美元,其中2020年被認為行業快速增長的元年,L4級自動駕駛車將在相當長時間內扮演重要角色。

在自動駕駛中,車與車、車與路等對外互聯的智能化車體是車輛根據路況信息做出剎車、避讓、減速、轉彎、超車等動作的關鍵。要形成如此嫻熟的駕駛技術,這些車輛是如何練就的呢?

自動駕駛系統的核心要素是算法、算力和數據,其中算法是靈魂,數據和算力是基礎。構建高度可擴展的數據平臺和計算平臺,是自動駕駛系統的首要問題。

高效的數據管理系統,MetaView

人工智慧作為自動駕駛汽車的"大腦",所擁有的準確指揮能力並非與生俱來,而是靠前期的數據積累和後期的AI訓練。

· 第一步:海量數據收集、存儲

車上裝有多種多樣的傳感器,如果以每天行駛6小時-8小時計算,每周會收集到高達PB級的數據。海量的圖像和雷達數據在進行清洗、標記、存儲後,被用於訓練算法、學習道路規則、並發現車輛運行的深層神經網絡中的潛在故障,然後不斷地迭代循環執行上述訓練步驟,直到滿足自動駕駛對精度的訓練需求。

面對多樣化的數據來源,數據存儲數據管理也是自動駕駛訓練所面臨的主要挑戰。高效的訓練系統不僅需要高性能的分布式存儲系統,還需要統一對海量數據進行特徵管理、快速發現數據、構建數據集合;甚至能夠對數據集的合併、拆分、過濾等進行數值填充,並行處理。數據的存儲和管理效率,將直接決定一個優秀自動駕駛訓練系統的成敗。

極道存儲系統支持海量數據的收集,傳感器或雷達採集的數據可通過對象或文件的形式進入極道存儲系統;同時,極道的對象存儲和並行文件系統對海量小文件的讀寫進行了優化,提高了對象與文件的讀寫能力,系統性能、吞吐量明顯高於同類產品。

· 第二步:數據管理支持

存儲只是數據治理的第一步,傳統存儲解決方案或開源HDFS提供的功能大多僅限制於此。但極道MetaView在存儲基礎上,還提供數據管理支持,包括實時數據追蹤、秒級數據檢索、動態數據重組以及自動數據溯源等功能。

數據進入存儲系統後,用戶可通過MetaView發現新數據;同時,用戶還可通過MetaView的標籤功能給數據進行自定義追加,作為後續的訓練數據集。

· 極道MetaView支持任意數量的鍵值對作為標籤。

強大的策略引擎支持用戶自定義編寫程序,數據在進行分析或主動學習時,系統自動生成標籤。訓練階段用戶還可通過複雜的標籤表達式、數據特徵進行檢索,檢索結果存為數據集。不同的表達式則生成不同的訓練集和驗證集。在百億規模下極道所有操作可秒級完成,MetaView提高了自動駕駛企業的數據治理能力。

異構融合架構,助力昂貴的AI訓練

自動駕駛系統訓練過程中,模型訓練和仿真需要使用大量的異構計算資源(GPU、CPU、NPU)。極道從中不僅看到了AI算力需求的迅勐增長,也看到了用戶的諸多痛點——算力昂貴。

這主要是因為用戶的稀有計算資源利用率低,計算訓練的並行程度不充分;相關行業和企業所面臨的多樣化計算框架集成和運維難度大;以及面對分布式機器學習和深度學習的參數配置難和開發效率低。

自動駕駛訓練涉及到數據的多樣化處理,需要根據實際情況搭建或調整不同計算處理模式的算法和模型,資源利用率制約著模型訓練效率。例如,在大規模數據上訓練模型,很有可能會利用Map Reduce並行的方法對數據進行預處理,剔除無效特徵、常數列、標準化、歸一化數據採樣,再根據需求啟動不同的分布式機器學習或深度學習框架。

這種包含大數據Map Reduce和各種人工智慧異構框架的動態構建和融合需要對用戶完全透明,相關計算過程結束後計算框架會自動銷毀,資源再次被釋放出來並共享給其它的計算和數據處理應用,才能夠真正的打破異構計算框架帶來的資源壁壘,提升資源利用率。

· 極道計算數據流系統Achelous

極道採用了先進的多計算框架融合技術,在統一計算資源管理和分配的基礎上,靈活地按需動態生成計算框架。在一個集群內共享硬體的前提下,動態實現了Map Reduce、高性能計算、批量計算和多種分布式機器學習、深度學習計算框架的融合共存。

同時,極道Achelous能夠對稀有計算資源GPU進行高級策略調度,例如顯存調度、拓撲調度等,提高異構計算集群的資源利用率。極道Achelous的智能執行引擎,利用數據流技術描述AI的訓練工作流程,協助研發人員儘可能數據並行和多種模型並行,減少人為幹預,提升自動化程度和訓練效率。

隨著應用對算力要求的變化,計算資源會根據需要及時添加到計算集群中。極道Achelous採用多級調度和分布式調度器,在形成統一調度空間的前提下能夠動態擴展、均衡負載,突破大規模計算集群規模的瓶頸。截至目前。極道計算數據流系統Achelous可以預裝到包含英偉達DGX和多家第三方GPU加速伺服器上,為自動駕駛模型訓練保駕護航。

自動駕駛領域解決方案,極道智能數據系統

極道智能數據系統的"三駕馬車":計算數據流系統Achelous、分布式存儲系統ANNA/ALAMO和數據管理系統MetaView相互配合,協同設計。在高自動化的自動駕駛應用領域從數據採集、數據預處理、數據處理、模型訓練、模型部署到推斷過程,全程一體化完整的高效運行,幫助用戶有效利用資源,快速構建業務模型,將數據轉化成數據資產。

· 智能動態集群

Achelous按需智能構建業務集群,動態分配環境、CPU、GPU、內存、存儲等資源,降低運維成本,壓縮資源配置時間,讓用戶更專注於自動駕駛模型訓練。

· 合適的數據存儲

極道分布式存儲系統ALAMO/ANNA和計算數據流系統Achelous的協同設計,能夠更快、更準確的感知數據特徵與業務需要,幫助存儲系統選擇更好的緩存策略和數據一致性策略,讓數據發揮更好的性能。

· 統一系統管理

所有數據相關業務系統部署在極道智能數據系統上,可集中調度AI模型訓練所需的各種計算和存儲資源,統一進行數據預處理、數據處理、數據集管理、模型管理、模型評估、模型部署甚至模型推薦。

· 可視化建模

Achelous基於極道智能數據系統對業務系統的集中管理,可以通過可視化界面快速構建自動駕駛AI訓練模型。

· 智能業務計算

Achelous按照自動駕駛AI訓練模型的需要,可以快速輕鬆構建分布式的深度學習和機器學習環境,利用AI數據流進行數據並行和模型並行,有效壓縮研發時間,簡化多框架分布式計算環境。

· 跨系統數據管理

極道數據管理系統Metaview可按照AI訓練模型的需求,抽取調用多系統來源數據,充分理解數據特徵,輕鬆動態構建數據集合,進行複雜特徵管理。例如根據特徵構建訓練、測試集合、發現噪聲樣本、處理缺失值以及特徵將維等,讓數據集管理不再成為瓶頸。

在AI訓練全量業務模式下,所有數據業務系統都可以部署在極道智能數據系統上,通過集中管理並調度資源,完成跨系統計算和數據調用,提升業務關聯度以方便數據交互,為更高級自動駕駛模型AI訓練提供更統一、更高效、更智能的服務。在不涉及管理業務系統的輕量業務模式下,極道為高級自動駕駛模型AI訓練提供統一的資源管理,以提升AI算力的利用率,充分發揮稀有計算資源的能力。

作為智能網絡的重要延伸支點,自動駕駛領域正在成為極道的又一發力點。極道智能數據系統的高度智能化計算框架動態構建和系統資源的統一調度,正不斷突破計算集群規模瓶頸,為自動駕駛領域帶來巨大的計算力,同樣也將加速其他領域科學研究和商業創新的智能化進程。

關於極道

極道,專注於數據"存"、"管"、"算"的創新數據系統公司,由國內頂尖的存儲和數據分析專家團隊建立,是一家以分布式系統為核心幫助客戶提升IT資源效率,提供高效智能的數據處理基礎平臺的數據系統公司。

極道的核心產品涵蓋了分布式並行文件存儲、強關聯大規模實時數據管理系統,以及集群的調度系統和執行引擎,以滿足企業對數據處理、分析和建模的多樣化需求。極道注重自主智慧財產權和產品的可控性,核心軟體系統均為自主研發,已擁有多項專利和軟體著作權。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

相關焦點

  • 超越空間直擊NVIDIA GTC 中國線上大會,助力點亮AI
    超越空間直擊NVIDIA GTC 中國線上大會,助力點亮AI 來源:財訊網 • 2020-12-21 17:29:08
  • 雲測數據:打造AI數據大腦,讓自動駕駛技術「耳聰目明」
    前幾日在2020亞太新經濟大會(秋季線上峰會)上,雲測數據展示了智能駕駛領域首個AI訓練數據解決方案,並獲得「2020年度最佳人工智慧產品/平臺」榮譽獎項業界關注的一大亮點。那麼,無人化智能駕駛快速發展的背後擁有那些前沿技術方面的突破?雲測數據能夠帶來哪些優質解決方案?帶著這些問題,記者採訪了雲測數據總經理賈宇航。
  • 自動駕駛開發者利器:華為雲自動駕駛雲服務Octopus亮相上海車展
    華為雲自動駕駛雲服務Octopus包含自動駕駛數據、訓練和仿真三大子服務,覆蓋自動駕駛數據、模型、訓練、仿真、標註等全生命周期業務,將有力提升企業的自動駕駛產品開發效率。  數據服務:處理車載硬體平臺上輸出的傳感器數據,回放雷達、攝像頭等不同格式的數據;支持PB級海量存儲、交互式大數據查詢和海量數據治理。
  • 入選信通院「星河」案例,百度數據眾包「智能駕駛數據資產管理」為...
    基於在智能駕駛行業多年的數據經驗,百度智能雲數據眾包(以下簡稱「百度數據眾包」)打造的「數據資產管理實踐方案」,可提供數據採集、標註、存儲、管理、訓練、清洗、評測等全流程的配套產品和服務。2020年12月30日,交通運輸部發布《關於促進道路交通自動駕駛技術發展和應用的指導意見》,強力推動國內自動駕駛產業進一步發展。
  • Roadstar.ai自動駕駛新量產故事:Leo·靈、高精度地圖技術
    同時,人們也可選擇接駁區域任意地點搭乘Roadstar.ai自動駕駛汽車,實現任意A點到B點的搭乘。從黃金水岸大酒店起,Roadstar.ai自動駕駛汽車經分水墩路、環河路,到達烏鎮北柵絲廠附近,途經3座跨河橋,5個人車流較複雜的十字路口,多個T型十字路口,整段路程超過3公裡。
  • 信息技術:中國自動駕駛產業發展動態|汽車|大數據|自動駕駛|智能網...
    2019年,廣汽集團發布ADiGO生態系統,並與博世發布基於車聯網技術的L4級自動代客泊車系統。廣汽集團計劃於2020年實現半自動駕駛,2025年前實現高度自動駕駛,2030年前實現完全自動駕駛。2019年,吉利發布全新升級的GKUI 19吉客智能生態系統,博越PRO成為首次搭載該系統的車型。
  • 行業丨高精度地圖如何解決自動駕駛的「痛」
    可快速關注我們前言在視覺感知技術越來越成熟的今天,我們之所以說自動駕駛量產之路仍然有「痛」,是因為自動駕駛想要真正接管人類駕駛,絕不僅僅是攻克單車智能這麼簡單,而是要有能力面對比想像中更加複雜並且隨時存在變化的現實世界,而我們認為,高精度地圖作為未來自動駕駛車量產必備的關鍵傳感器之一
  • 極道創始人吳江:企業級數據系統,初創一樣可以做出好產品
    沒想到一次數據事故,讓吳江和團隊證明了自己的技術實力。2015年7月國內基因測序龍頭企業發生了一起數據事故,文件系統損壞導致120T的核心樣本數據丟失,當時的存儲使用了Lustre(並行分布式文件系統),所詢問的大廠幾乎修復不了,在大範圍求助修複數據無果後,幾經周折找到了吳江。
  • 自動駕駛計程車怎麼收費?哪個城市可以自動駕駛計程車?
    自動駕駛計程車 長眼睛  據悉,這臺應用了文遠知行WeRide.ai自動駕駛技術的白雲純電SUV計程車,配備了2個雷射雷達,3個專業攝像頭,1個毫米波雷達,通過多傳感器融合的方法,實現360度全方位感知,讓計程車真正地智能起來。
  • 蘇州相城區發布智能駕駛「上路計劃」,福特開放自動駕駛汽車數據集
    2020年2月,發改委、工信部、交通運輸部等11個國家部委聯合印發了《智能汽車創新發展戰略》,代表我國智能汽車頂層設計出爐,戰略提出要實現有條件自動駕駛的智能汽車達到規模化生產,實現高度自動駕駛的智能汽車在特定環境下市場化應用。
  • 阿里達摩院祭出「秘籍」,解決自動駕駛核心難點
    細心的你應該已經發現了,無論是5G還是V2X,本質上也只是能夠解決感知層面問題,並且由於目前車載算力已經足夠(如今Mobileye、英偉達、特斯拉等公司的車載自動駕駛晶片,算力角度應對自動駕駛需求已經綽綽有餘),其實雲計算的收益也不高,所以這些仍然不是自動駕駛的核心痛點。
  • AI每日精選:中國高鐵進入智能自動駕駛時代;小米定位智能製造
    行業動態1.京張高鐵正式運營,中國高鐵進入「智能自動駕駛」時代12 月 30 日,北京至張家口高速鐵路(京張高鐵)開通運營,崇禮鐵路同步建成投產,將助力京津冀一體化協同發展,為 2022 年北京冬奧會提供交通運營服務保障。
  • 深度揭密:華為自動駕駛雲服務Octopus,一隻八爪魚的前世今生
    2020年1月9日,華為自動駕駛雲服務首次在湘江新區落地:「湖南智能網聯汽車產業雲是華為自動駕駛雲服務在全球的首次落地。它被外界形象地稱為『八爪魚』,能牢牢抓住行業痛點,通過強大的數據服務、訓練服務、仿真服務能力,為從事自動駕駛、智能駕駛研發企業提供一站式全流程的服務。」
  • 加州車管所: 2019 年年度自動駕駛接管報告 | 網際網路數據資訊網...
    AutoX 與剛剛拿了豐田大號支票的 Pony.ai 分列第四和第五名。除了百度、AutoX 和 Pony.ai 這幾家中國血統自動駕駛公司,滴滴也第一次出現在報告中,並且來了個開門紅排在第八位。至於去年排在倒數的上汽(SAIC)也成功闖進了二十名之內。顯然,中美兩國已經成為自動駕駛行業眾人仰止的兩極。
  • AI、數據分析、語音識別助力航司解決客服痛點
    在不遠的將來,諸如人工智慧等新科技將在航企服務中佔據中心位置,助力航空公司解決超售、行李丟失以及其他旅客痛點。  航空公司怎樣使用基於人工智慧的新工具?  人工智慧(AI)是通過使用邏輯、決策樹等為預測分析和機器學習建立模型,從而模仿人類智力的一種廣義的科技範疇。
  • 車雲晨報 | 蘋果收購自動駕駛公司Drive.ai 北京取消純電動汽車...
    萬美元據外媒報導,福特自動駕駛汽車開發夥伴Argo AI周一(6月25日)宣布,在未來5年將會向位於匹茲堡的卡耐基梅隆大學的自動駕駛研究中心進行共計1500萬美元的投資。卡耐基梅隆大學的自動駕駛研究中心旨在對自動駕駛汽車在多種條件下的運行進行研究,例如冬日天氣和比較複雜的施工區域等等。雙方發布的聲明透露,在這個項目中,學生將能夠接觸到在其他地方難以獲得的車隊規模數據集、車輛以及大型基礎設施。
  • 自動駕駛數據集被迫開放「營業」
    雖然由自動駕駛測試生成的所有數據對於車輛感知其周圍環境,並在整個過程中都是有用的,但實際上只有其中的特定部分對開發和改進系統有用。比如在典型城市街道上一天的測試中,車輛中的工程師和技術人員會選擇性的記錄發生細微變化或具有挑戰性的場景。也就是說自動駕駛數據集需要更加多樣和精細化,對從業人員來說才有利用價值。
  • 自動駕駛車輛中的AI分析及作用
    圖1: 自動駕駛車(來源:Lentin, 2017) 自動駕駛車輛對傳送實時數據的傳感器數量,以及對數據進行智能處理的需求可能會非常龐大。而AI被用於現代汽車的中央單元以及多個電子控制單元(ECU)中。
  • 2019自動駕駛汽車脫離報告 加州DMV脫離數據引發爭議
    ,其中包括除分離之外的更多數據點。」 近日,加州車輛管理局(DMV)公布了《2019年自動駕駛接管報告》,共收到了60份不同企業的年度報告,這些允許在加州測試自動駕駛系統的車輛已完成了460萬公裡的測試,比2018年將近多了130萬公裡。
  • 為什麼說 CCF-GAIR 智能駕駛專場不容錯過?我們梳理了這些亮點 |...
    在汽車行業擁有近 30 年經驗的綦平,自 2016 年 7 月起擔任採埃孚(中國)投資有限公司工程技術中心總監,主要為採埃孚各業務單元在產品研發過程中提供各類本土化的技術支持,重點項目是電驅動系統和自動駕駛系統。綦平此次演講的主題便與規劃決策和執行控制相關:智能駕駛對汽車大腦及執行機構的挑戰。