自動駕駛已經從實驗室「象牙塔」進入到規模化上路、量產階段,在自動駕駛開發測試中,海量、高質的真實數據是必不可缺的「原料」。但是,少有團隊有能力開發並維持一個適用的自動駕駛平臺,定期校準並收集新數據,因此行業亟需一個數據量充沛、涵蓋場景豐富的自動駕駛專用數據平臺。今年3月,百度大規模自動駕駛數據集ApolloScape應需開放,致力於為全世界自動駕駛技術研究者提供更為實用的數據資源及評估標準。
ApolloScape是百度Apollo自動駕駛開放平臺的專題項目之一,是目前行業內環境最複雜、標註最精準、數據量最大的三維自動駕駛數據集。ApolloScape開放了比Cityscapes、Kitti等同類數據集大10倍以上的數據量,包括感知、仿真場景、路網數據等數十萬幀逐像素語義分割標註的高解析度圖像數據,以及與其對應的逐像素語義標註、稠密點雲、立體圖像、立體全景圖像,並進一步涵蓋更複雜的環境、天氣和交通狀況等。
ApolloScape涵蓋了最複雜的道路狀況,提供最有挑戰性的數據支持,數據集包括了全新提供的逐幀標註的視頻序列和三維背景,以及中國最複雜的街景, 單張圖片內可以包含上百個車和行人。
同時,ApolloScape開放數據集採用了逐像素語義分割標註的方式,包含數十萬幀逐像素語義分割標註的高解析度圖像數據,為便於研究人員更好的利用數據集的價值。ApolloScape在數據集中定義了共26個不同語義項的數據實例(例如汽車、自行車、行人、建築、路燈等),並將進一步涵蓋更複雜的環境、天氣和交通狀況等。
環境模擬用於自動駕駛在汽車和計算機行業引起了很多關注。ApolloScape還將進行更多關於仿真的前沿技術研究,打造真實世界還原度最高、場景最豐富的仿真平臺。基於Apollo仿真平臺,ApolloScape計劃同時將數十輛自動駕駛車輛投入到同一個路網中行駛,可以模擬真實的複雜駕駛場景和多車博弈過程。這也是目前最先進的智能駕駛仿真技術之一,不僅適用於典型的相對安全的場景,而且還適用於不確定和危險的環境,可以幫助研發人員有效檢驗並優化預測、決策和路徑規劃等算法,顯著提升自動駕駛的測試多樣性。目前ApolloScape開放模擬工具包括WorldSim和LogSim,同時還在開發下一代技術,可用於生成真實世界駕駛場景和駕駛員行為的真實模擬。
未來,ApolloScape計劃為數據集拓展更多類型、更多屬性的數據。例如,通過添加紅外圖像,幫助自動駕駛算法更容易進行夜間檢測;提取更稠密的軌跡信息,用於對駕駛行為進行建模;以及通過眾包模式採集立體視覺的駕駛特殊事件圖像等。
除了開放工具及數據,ApolloScape還旨在為全球開發者、研究人員搭建起一個學術交流的高端平臺,共同探索前沿領域技術突破及應用創新。4月24日,首屆ApolloScape學術峰會在北京召開,會議匯集了來自美國、德國, 澳洲、中國等地的國內外自動駕駛領域傑出的專家學者,一同交流分享自動駕駛數據相關的先進理念和研究成果,為自動駕駛業界與學界能量交換搭建了新接口,以凝聚學術力量。
此外,Apollo開放平臺還將在6月開幕的CVPR(IEEE國際計算機視覺與模式識別會議)期間舉辦大會唯一的自動駕駛研討會(Workshop on Autonomous Driving),並將基於ApolloScape的大規模數據集定義了多項任務挑戰。ApolloScape已正式於國外知名機器學習競賽平臺Kaggle上線Video Segmentation Challenge(視頻場景解析挑戰賽),比賽中所提供的數據集中將包含大量的分段原始駕駛圖像,包含有20+種場景標註信息。賽事將持續到6月12日。目前已有來自全球的一百多隻隊伍正式報名參加。
雖然國外有不少可供選擇的數據集,但是國內的路況複雜程度顯然與國外不同。自動駕駛在複雜路況下的測試僅依靠技術手段很難解決,需要大規模精準數據集的幫助,這也是百度決定開放ApolloScape的初衷。百度希望通過公開的方式,吸引更多企業和開發者利用並補充數據集,進而提高自動駕駛的感知能力。隨著源源不斷的合作夥伴、開發者和學界能量的導入,將給ApolloScape帶來更充沛的生長養分,其數據量還將越來越大,涵蓋更為豐富、複雜的全球化場景,打造全球最大的自動駕駛開放數據集。