Lyft公開了一個自動駕駛數據集,還要舉辦比賽!

2021-01-06 大數據文摘

大數據文摘出品

作者:寧靜、曹培信

7月4日舉辦的百度開發者大會上,李彥宏宣布百度L4級自動駕駛路測裡程破兩百萬公裡,百度的level4自動駕駛已經發展到了一個新的階段。

自動駕駛依賴高度精確的目標檢測能力,以應對路上可能出現的各種情況,而想訓練一個完善的目標檢測模型,則需要大量的車載傳感器提供的數據。所以說百度在自動駕駛方面取得的成就,基礎就是那兩百萬公裡的路測數據。

許多想嘗試做目標識別的機構或者個人,都苦於無法獲取足夠的數據而無法進行相關研究。

最近,Lyft公司專注於自動駕駛的Lyft level5團隊公開了一組他們採集的數據集,並且預計在12月舉辦一次基於該數據集的比賽,數據集一共將近60G,註冊一個帳戶即可下載。

數據來之不易

該數據集包括高質量的語義圖, 語義圖提供關於場景中車輛位置和移動方向的上下文推理,所有地圖元素都映射到基礎幾何圖,是數據集中所有場景的相同參照系。

提供的地圖有超過4000個車道段(2000個路段車道和約2000個車道),197個人行橫道,60個停車標誌,54個停車區,8X減速帶,11X減速帶。

所有數據均採集於福特Fusion車隊, 每輛車都配有以下傳感器:

雷射雷達:

一個安裝在車頂的40束雷射雷達和兩個安裝在保險槓的40束雷射雷達;每個雷達的方位角解析度為0.2度;所有三個雷射雷達共同產生約216,000個點,頻率為10赫茲;所有雷達的發射方向在任何給定時間都是相同的。

攝像頭:

六個寬視角(WFOV)攝像機均勻覆蓋360度視角(FOV), 每臺相機的解析度為1224x1024,FOV為70°x60°;一個長焦距攝像頭略微向上安裝,主要用於檢測交通信號燈,相機的解析度為2048x864,FOV為35°x15°;每個攝像機與雷達同步,使得當攝像機捕獲圖像時,雷達光束位於攝像機視野的中心。

數據格式

選用nuScenes format用於數據集,以確保與使用nuScenes數據集完成的現有工作兼容。

關於nuScenes format連結:

https://www.nuscenes.org/data-format

為了探索和使用數據集,下面提供nuScenes devkit的自定義版本以及如何使用它的教程:

通過下方連結登陸和下載數據集; https://level5.lyft.com/register/

下載Lyft版本的NuScenes SDK;按照README.md設置SDK並開始處理數據。

關於lyft level5

Lyft level5是Lyft公司下專注於開發自動駕駛的團隊,他們目前正在開發Level 4自動駕駛技術,目標是實現完全自主的自動駕駛技術。

他們通過Lyft公司駕駛服務的便利,每周可獲得1000萬輛次的駕駛數據用於模型訓練,同時還探索人類司機和自動駕駛共存的路面網絡架構。

Lyft level5團隊包括300多名工程師、應用研究人員、產品經理、運營經理等。其中不乏是世界上頂級的計算機視覺、機器人技術和機器學習專家,還有一些是參加過Kaggle的頂尖大師。

相關報導:

https://level5.lyft.com/dataset/

相關焦點

  • Lyft公開「業內最大」數據集, 自動駕駛戰場加速安卓化?
    記者 | 量子位 Susan WuUber的死對頭,來自矽谷的網約車公司Lyft,7月23日公開了一整套開放式自動駕駛數據集,號稱是L5級同類產品內數量世界第一。目前汽車行業正在經歷一個世紀以來的最大轉變。在上一個10年裡,科技大戰的主要戰場之一就是控制智慧型手機。從發展趨勢看,下一個10年,戰場會變成控制自動駕駛汽車。
  • 數據是自動駕駛「燃料」百度開放全球自動駕駛數據集ApolloScape
    自動駕駛已經從實驗室「象牙塔」進入到規模化上路、量產階段,在自動駕駛開發測試中,海量、高質的真實數據是必不可缺的「原料」。但是,少有團隊有能力開發並維持一個適用的自動駕駛平臺,定期校準並收集新數據,因此行業亟需一個數據量充沛、涵蓋場景豐富的自動駕駛專用數據平臺。
  • Waymo上線11萬美元挑戰賽,福特開放1.6TB自動駕駛數據
    曉查 發自 凹非寺量子位 報導 | 公眾號 QbitAI福特公司本周悄悄在官網和GitHub上線了自己的無人駕駛數據集,包含了2017~2018兩年間的自動駕駛車隊路測數據,總體積1.6TB。福特也成為繼Waymo之後另一家開放自動駕駛數據的商業公司,巧合的是Waymo在前一天剛剛更新了去年8月上線的數據集。
  • Waymo公開無人駕駛汽車數據集
    打開APP Waymo公開無人駕駛汽車數據集 cnBeta 發表於 2020-03-20 14:01:01 Waymo公開了其最新的自動駕駛汽車數據集,邀請無人駕駛汽車研究人員根據其無人駕駛車隊收集的大量數據參加一系列挑戰賽。
  • 自動駕駛人的福音!Lyft公開Level 5部署平臺Flexo細節
    Level 5 是自動駕駛等級分類的最高級別,可以實現完全自動駕駛,由車輛完成所有駕駛操作,人類駕駛員不需要集中注意力,不限定道路和環境。Lyft 的工程師和操作人員花費大量的時間了解每輛車的微妙差異和獨特環境。從雲計算模塊開始,Lyft 構建了一個名為 Flexo 的汽車部署平臺,以確保能自動構建車隊軟體,並為每個自動駕駛汽車(AV)部署相同的環境。
  • ECCV 2018挑戰賽開戰在即,百度ApolloScape提供自動駕駛數據集
    允中 發自 凹非寺 量子位 報導 | 公眾號 QbitAI數據是自動駕駛不可或缺的「養料」,對於高速發展的自動駕駛行業來說,亟需一個提供真實、海量數據的平臺。本次 ECCV 2018挑戰賽要求參賽者基於 3D 視覺系統來完成自動駕駛相關的一些相關任務,百度大規模自動駕駛數據集ApolloScape將為本次大會的計算機視覺社區提供一個大規模和高質量的真實場景數據集。據悉,ApolloScape還為優勝者準備了豐厚的獎金作為鼓勵,目前報名通道已正式開啟。
  • 給卡車穿上「隱身衣」,讓自動駕駛車輛撞上它:這場自動駕駛比賽,比...
    蕭簫 發自 凹非寺量子位 報導 | 公眾號 QbitAI自動駕駛算法,在這場比賽中成了實驗品:24小時內,不僅要在特定的場景中,讓它被攻破;還要在競速情況下盡力優化它,讓車跑得更快。
  • 神秘的Waymo一反常態,CVPR現場發布大型自動駕駛數據集
    機器之心報導參與:李亞洲、路在正在火熱進行的 CVPR 2019 現場,一直對技術都較為保密的 Waymo 宣布開源全新的自動駕駛數據集。該數據集包含 3000 段駕駛記錄、60 萬幀、大約 2500 萬 3D 邊界框、2200 萬 2D 邊界框,以及多樣化的自動駕駛場景。目前,自動駕駛領域已經出現很多數據集,例如 KITTI、Oxford、Cityscape、nuScenes、BDD100K 等。
  • 人工檢查,11 個類、97942 個標籤,Roboflow 開源自動駕駛數據集...
    機器學習即將帶來一系列的社會變革,其中一個被大肆宣傳的領域是自動駕駛。但是,伴隨著自動駕駛技術的巨大動力而來的是巨大的責任,如果一輛自動駕駛汽車訓練的不夠好,可能會引發車禍,導致人員傷亡。這是一個非常危險的問題。
  • 福特自動駕駛數據集公布 總體積達1.6TB或為數據最全的數據集之一
    福特自動駕駛數據集公布,這可能是迄今為止最全面的數據集之一。 最近十年來,自動駕駛開源數據集變得越來越多,無論是企業或者其他組織,都選擇與世界上的其他開發者共享數據,促進技術的進步。但其實這些不同的數據集之間類型並不完全一樣。
  • 百度Apollo加盟DeepDrive 發自動駕駛開放數據集
    百度Apollo加盟DeepDrive 發自動駕駛開放數據集 《百度Apollo加盟DeepDrive 發自動駕駛開放數據集》文章已經歸檔,不再展示相關內容
  • 蘇州相城區發布智能駕駛「上路計劃」,福特開放自動駕駛汽車數據集
    論文提出一個通用、高性能的自動駕駛檢測器,可兼顧3D物體的檢測精度和速度,提升自動駕駛系統安全性能,兩者兼得的實現在業界尚屬首次。該論文團隊表示,檢測器的創新是自動駕駛領域落地的關鍵突破口,此次提出的檢測器融合了單階段檢測器和兩階段檢測器的優勢,因此同時實現了3D檢測精讀和速度的提升,未來檢測器的創新研究還可以解決自動駕駛產業的更多難題。
  • 自動駕駛數據集-Argoverse Dataset
    Argoverse數據集是由Argo AI、卡內基梅隆大學、喬治亞理工學院發布的用於支持自動駕駛汽車3D Tracking和Motion Forecasting研究的數據集。數據集包括兩個部分:Argoverse 3D Tracking與Argoverse Motion Forecasting。
  • FLIR公布熱成像數據集 加速自動駕駛發展
    據外媒報導,當地時間5月27日,FLIR Systems公司宣布推出首個歐洲區熱成像數據集,以及用於機器視覺測試的熱成像數據集系列的第三個數據集。此類數據集旨在幫助研究人員、開發人員和汽車製造商改進和加速研發安全、高級駕駛輔助系統(ADAS)自動緊急制動(AEB)和自動駕駛車輛(AV)系統。
  • Lyft的自動駕駛技術突飛猛進
    一年前,Lyft向加州機動車輛管理局提交了一份報告,簡要的總結了該公司2018年的自動駕駛汽車測試活動。文中說:「在報告所述期間,Lyft公司沒有在加州公共道路上以自動駕駛模式運營任何車輛。」然而,結果真的是這樣嗎?2019年的數據顯示了一個不同的情況。
  • 華為榮獲ICRA2020 國際自動駕駛3D目標檢測挑戰賽冠軍
    近日,第二屆大規模自動駕駛數據集2020 nuScenes Challenge (Workshop on Benchmarking Progress in Autonomous Driving, ICRA 2020)落下帷幕。
  • 禾賽科技攜手Scale AI發布自動駕駛開源數據集
    全球TMT2020年7月10日,近日,禾賽科技與Scale AI聯合發布了自動駕駛開源數據集 -- PandaSet。PandaSet採用禾賽科技先進的雷射雷達進行數據採集,並通過Scale AI強大的標註平臺進行精準的數據標註,為從事自動駕駛研發的公司、機構和個人,提供了內容豐富、目標物密集的高質量免費數據。PandaSet數據集採用2款雷射雷達和6個攝像頭進行數據採集,包含超過16000幀雷射雷達點雲和超過48000張照片,共100多個場景。
  • 資源|伯克利發布BDD100K:目前最大規模開放駕駛視頻數據集
    近日,UC Berkeley 發布了迄今為止規模最大、最多樣化的開放駕駛視頻數據集——BDD100K。該數據集共包含 10 萬個視頻,BAIR 研究者在視頻上採樣關鍵幀,並為這些關鍵幀提供注釋。此外,BAIR 還將在 CVPR 2018 自動駕駛 Workshop 上基於其數據舉辦三項挑戰賽。
  • Graviti攜手UC Berkeley探索自動駕駛預測模型,INTERACTION預測...
    為促進自動駕駛領域的行為預測技術發展,加速預測模型/算法評價的研究,加州大學伯克利分校機械系統控制實驗室(MSC Lab)攜手AI數據服務平臺提供商Graviti(格物鈦)、世界領先的雲服務商AWS(亞馬遜雲)舉辦的「INTERACTION數據集預測挑戰賽」正式啟動。
  • 數據分析公開數據集網站&數據應用網站分享
    下面給小夥伴分享一下我在獲取公開數據集和數據應用的一些網站。數據獲取的途徑多種多樣,可簡單劃分為以下幾種:業務系統資料庫提取網絡爬蟲自主生成程序語言隨機生成公開數據集下載從業務系統資料庫提取需要在公司資料庫系統使用,對於學習者而言這部分數據取到較為困難,並且也沒有公司會願意開放數據;通過網絡爬蟲進行數據爬取需要一定的程式語言能力;自主生成和程序語言隨機生成又會與實際業務產生較大偏差,因此,在學習數據分析的時候最好的方法是去公開數據集網站進行下載