計算機視覺創企Roboflow:自動駕駛汽車訓練語料庫遺漏關鍵數據

2020-11-29 蓋世汽車網

蓋世汽車訊 機器學習模型的性能取決於其訓練的數據集的質量,而在自動駕駛領域,讓此種性能不會受到失誤的影響是至關重要的。據外媒報導,計算機視覺初創公司Roboflow發布了一份報告,據該公司創始人Brad Dwyer所說,用於訓練自動駕駛汽車模型的語料庫確實遺漏了關鍵數據。

Dwyer表示,Udacity數據集2包含1.5萬張白天在山景城和附近城市開車時拍攝的照片,其中就遺漏了關鍵數據。在大約5000個樣本中,有數千輛未標記的車輛,數百名未標記的行人以及數十名未標記的騎自行車的車,佔總數的33%(而217個樣本中根本都沒有任何注釋,此類樣本涵蓋了汽車、卡車、路燈或行人)。更糟糕的是,還有「幻覺」注釋以及除了「嚴重」加大的邊界框(邊界框指代感興趣的對象),還有重複注釋的邊界框。

考慮到標籤是讓人工智慧(AI)系統理解模式的含義(如有人走到了汽車前面),並基於此類知識評估未來事件,上述現象是很有問題的。錯誤標記或未標記的物體可能會導致準確性低、決策糟糕,從而為自動駕駛汽車帶來災難。

AI很容易因為數據集不完整或不正確導致偏差,這很好理解。例如,單詞嵌入(word embedding)是一種常見的算法訓練技術,需要將單詞與向量連接起來的,不可避免地會捕捉到源文本和對話中隱含的偏見內容,在最糟糕的情況下,此種偏見還會被放大。此外,相比於白人,很多面部識別系統錯誤識別有色人種的次數更多,而且谷歌圖片(Google Photos)曾經將深膚色的人識別為「大猩猩。」

但是,如果將表現不佳的AI用於汽車,就會造成更大的傷害。目前,還沒有自動駕駛汽車引發碰撞事故的記錄,但是目前公共道路上的自動駕駛汽車數量很少。不過,這種情況很可能會改變,根據市場營銷公司ABI的數據,到2025年,將有多達800萬輛無人駕駛汽車上路;而Research and Markets公司預計,到2030年,美國將有大約2000萬輛無人駕駛汽車投入使用。

如果數百萬的汽車運行的是有缺陷的AI模型,帶來的影響可能是毀滅性的,會讓公眾更加不信任無人駕駛汽車。有兩項研究 – 一項由布魯金斯學會(Brookings Institution)和一項由高速公路與汽車安全倡議者(AHAS)表示,大多數美國人並不相信無人駕駛汽車的安全性。在布魯金斯學會進行的調查中,超過60%的受訪者表示,傾向於不乘坐自動駕駛汽車;而在AHAS的調查中,近70%的受訪者對於與自動駕駛汽車共享道路表示了擔憂。

解決數據集問題的方法可能在於更好地進行標記。根據Udacity數據集2的GitHub頁面所說,眾包語料庫注釋公司Autti結合使用機器學習與人工監工的方式來處理標記,目前尚不清楚是否此種方法導致了上述錯誤,不過嚴格的驗證程序可能有助於發現上述錯誤。(文中圖片均來自venturebeat.com)

相關焦點

  • 雷射雷達vs純計算機視覺 自動駕駛的兩大流派
    雷射雷達流派和純計算機視覺流派一直在自動駕駛技術中的感知層解決方案上喋喋不休。雷射雷達派認為純視覺算法在數據形式和精度上的不足;純視覺流派則認為雷射雷達不必要且過於昂貴。本文將對雷射雷達、攝像頭以及毫米波雷達等主流傳感器、各自動駕駛公司的解決方案以及傳感器市場格局作介紹。
  • 自動駕駛的視覺密碼丨科技說
    與之對應的,視覺晶片的圖像數據計算能力也正以每年十幾甚至幾十倍的速度快速迭代。在當下主流的多傳感器融合路線中,視覺感知技術本身玩法固然稱不上激進顛覆,卻始終被認為是自動駕駛落地整體方案的基石。某種層面上,只有理解了視覺,才能更好地認知自動駕駛。
  • 小鵬汽車吳新宙:P7視角下的高級別自動駕駛背後的視覺感知技術
    本文為小鵬汽車自動駕駛副總裁吳新宙來稿,以小鵬P7視角從L2級感知需求、高級別感知需求、自動駕駛研發架構等方面,解讀了小鵬汽車自動駕駛背後的視覺感知技術。以下為正文的內容我們知道,開始向電力驅動邁進,是如今每一家汽車製造商都必須要做的事情,但只有真正的智能電動汽車才是汽車未來的下一個賽道。小鵬的自動駕駛是小鵬汽車智能化的最主要標籤,也是小鵬的最核心差異化。
  • 自動駕駛的未來,是雷射雷達還是視覺識別?
    除此之外,調查顯示特斯拉Model 3的視覺算法訓練數據存在局限性。 一般自動駕駛的視覺訓練邏輯只能識別到車輛後部、側面 和 頭部,顯然特斯拉的工程師沒有想到有一天系統需要識別貨車車箱的頂部。
  • 蘇州相城區發布智能駕駛「上路計劃」,福特開放自動駕駛汽車數據集
    該平臺結合華為雲+AI、5G、C-V2X等領域優勢,向車企及開發者以分布式的方式提供包括數據服務、訓練服務、仿真服務3大服務。在該平臺支持下,智能網聯企業可加強在智慧停車、智慧公交、智慧物流、Robotaxi等方面應用,打造智能網聯汽車應用場景體系。
  • 雷射雷達加速自動駕駛汽車發展
    不過,目前我們依舊處於弱人工智慧階段,想要實現強人工智慧,物體識別升級為場景理解是關鍵,而實現場景理解首先需要理解物體與物體之間的關係,比如最基本的三維空間關係。作為人工智慧的重要應用方向之一,近年來自動駕駛汽車的遠距離深度相機雷射雷達作為汽車理解三維空間的主流方案備受認可,不過雷射雷達目前大且貴,這使得該技術的進一步普及充滿挑戰。
  • 自動駕駛技術終迎重大突破,眼擎科技讓汽車具有PK人眼的視覺能力
    自動駕駛汽車產業的三座大山:算法、量產能力、關鍵技術。 1769年,當法國人N·J·居紐製作第一蒸汽驅動三輪汽車「卡布奧雷」時,他可能做夢也想不到,僅僅兩百多年後,汽車完成了從化石能源到電動能源,從機械時代到自動駕駛時代兩個維度上的時代跨越。
  • 自動駕駛汽車利用卷積神經網絡學習人類決策
    對於自動駕駛汽車而言,也許有一種更好的學習駕駛的方法——觀察人類。據外媒報導,澳大利亞迪肯大學的研究人員發現,藉助改進的視覺校正系統,自動駕駛汽車可以通過觀察人類操作員來學習。
  • 自動駕駛的殘酷終局:特斯拉、華為、蘋果、蔚來小鵬、百度、滴滴...
    本文主要探討乘用車自動駕駛的技術和商業路徑,商用車的自動駕駛並不在本文裡討論。  目前,乘用車自動駕駛的公司大概可以分為三類。第一類是類似於蘋果(NASDAQ:AAPL)的閉環系統,關鍵組成部分比如晶片和算法都自己做,特斯拉(NASDAQ:TSLA)是這麼幹的,部分新勢力車企也希望逐步走上這條路。
  • 信息技術:中國自動駕駛產業發展動態|汽車|大數據|自動駕駛|智能網...
    隨著網際網路、大數據、人工智慧等技術在汽車領域的廣泛應用,汽車正加速由機械化向智能化轉變,智能網聯汽車已成為人工智慧、大數據、雲計算、通信等產業的綜合產物。當前,全球主要國家和地區紛紛加快產業布局,制定發展戰略,各項技術標準及法規等逐漸完善。中國政府高度重視智能網聯汽車的發展並頻頻出臺支持政策,自動駕駛產業得到迅猛發展。
  • LIDAR : 自動駕駛汽車的關鍵傳感器
    正如下圖中的 Uber 和 Baidu 的自動駕駛汽車,它是安裝在汽車頂部的不斷旋轉的笨重盒子。這種可預測性正是實現自動駕駛汽車這樣的技術所需要的,並且是過去5年來取得進步的重要原因。令人驚嘆的導航,不可思議的可預測性、高度解析物體的跟蹤相結合意味著LIDAR是主導當代自動駕駛汽車的關鍵,而且很難看出這種主導會生變化。
  • 基於機器視覺的汽車智能駕駛系統
    此外一些工程車輛在作業時環境惡劣、勞動強度大,這些車輛的駕駛自動化是非常有必要的。為了使汽車駕駛操作簡單、安全、舒適,把人從繁重枯燥的汽車駕駛中解脫出來,當今世界各國都在積極研究開發自動駕駛技術。  德國、美國和日本等國在汽車自動駕駛領域開展了積極的研究並取得了很大的成績。
  • 一文解讀全球頂級計算機視覺會議:CVPR 2019自動駕駛內容
    為期五天的全球頂級的年度計算機視覺會議,CVPR(計算機視覺與模式識別)已經在加利福尼亞州的長灘市落下帷幕。計算機視覺在自動駕駛擁有著一席之地,甚至有從業者認為純視覺可以實現自動駕駛,所以在CVPR2019舞臺,自動駕駛也成為了其中重要的內容。
  • 《自動駕駛汽車電氣系統的創成式設計》白皮書正式發布 內含PDF
    《自動駕駛汽車電氣系統的創成式設計》白皮書正式發布 | 內含PDF  蓋世汽車 忻文 2020-12-24 07:08:37    自動駕駛汽車設計固有的巨大複雜性將持續推動汽車工程師所用工具和方法的不斷發展,尤其在電氣和電子系統領域,已開始主導汽車安全關鍵系統和設施的運行。
  • 自動駕駛傳感器種類及布置方案
    自動駕駛汽車是一個集環境感知、規劃決策、運動控制、多級輔助駕駛等功能於一體的綜合系統,它集中運用了計算機、現代傳感、信息融合、V2X通訊、人工智慧及自動控制等技術,自動駕駛的關鍵技術依次可以分為環境感知、行為決策、路徑規劃和運動控制四大部分。而自動駕駛關鍵的環境感知用來採集周圍環境的基本信息,也是自動駕駛的基礎。
  • 總結頭部自動駕駛廠商經驗,手把手教你選擇更優質的AI數據
    沒有對車輛周圍環境的定量感知,就猶如人沒有了眼睛,自動駕駛的決策系統就無法正常工作。與其他應用場景相比,自動駕駛的落地場景相對複雜,尤其面對複雜多變的路況環境,背後尤其需要有海量的優質數據採集標註做支撐。AI數據服務在自動駕駛領域的應用分析作為AI在汽車領域的重要應用領域,自動駕駛經過最近十多年的發展,從技術、產業到政策監管都有了長足的進步。
  • 安霸立體視覺處理SoC會給自動駕駛市場帶來什麼?
    自動駕駛產業不乏想要超越Mobileye計算機視覺SoC的視覺晶片供應商,安霸(Ambarella)就是其中之一。該公司正致力於縮短與Mobileye的距離,特別是因為Mobileye不僅是業界先驅且仍持續主導基於視覺的先進駕駛輔助(ADAS)和高度自動駕駛車市場。
  • 汽車自動駕駛產業鏈深度報告:晶片及軟體專題
    目前,高通已經贏得全球領先的 20+家汽車製造商 的信息影音和數字座艙項目。目前高通通過驍龍 820A 和 602A 汽車平臺,在數 字座艙領域為汽車提供高水平的計算性能。其中,驍龍 820A 數字座艙平臺支 持計算機視覺與機器學習,能夠提供豐富的圖形與多媒體功能,加上廣泛的可 視化和作業系統選項組合及神經處理引擎,幫助汽車廠商打造差異化特性,提 供卓越用戶體驗。
  • GFM2020|理想汽車王凱:真正的自動駕駛可能還需依靠量子計算機突破
    在中國電動汽車百人會主辦的2020全球未來出行大會(GFM2020)上,理想汽車首席技術官王凱表示,目前自動駕駛的硬體、算法上沒有完全形成突破,真正的無人駕駛很有可能需要在量子計算機進行突破才能真正意義上的完成
  • Waymo利用AI生成攝像頭圖像 用於自動駕駛仿真
    蓋世汽車訊 據外媒報導,日前,Waymo表示開發了新方法SurfelGAN,利用自動駕駛汽車收集的傳感器數據,通過AI生成用於仿真的攝像頭圖像。SurfelGAN使用紋理映射表面元素(surface elements,簡稱surfel)重建場景和攝像頭視角,以獲取位置和方向。