interaction dataset
這篇文章裡所提的場景應用範圍包括模型在環、軟體在環、硬體在環、車輛在環,以及路測。當前的路測場景往往有相關標準作為支撐,因而不在本文的討論範圍內。今天要說的是更廣義的場景,這些場景因為其複雜性往往需要仿真來支撐。
場景測試對自動駕駛發展是極其重要的,這基本已經成為共識。想有一個整體的了解可以閱讀朱冰老師寫的綜述《基於場景的自動駕駛汽車虛擬測試研究進展》。之前在文章中也提到過,場景是對知識和自動駕駛數據的一種總結,是發揮數據價值的必須且高效的途徑之一,它屬於整個仿真系統的輸入端。基於場景的測試方法可以提高系統的開發效率,也可以通過驗證提高產品落地效率。
今天這篇文章的主要內容框架來自 Simon Chauvin,他的總結覆蓋了我們討論場景時常關注的幾個問題。我對這篇文章進行了意譯,以使讀者對場景測試中的關鍵問題有一個大致的認知。在翻譯過程中。我也融入了一小部分自己學習過程中的認知和思考。
我們會討論以下幾個問題:
1. 如何描述交通場景,用什麼格式或語言?
2. 如何找到頻繁出現的碰撞場景(frequent crash scenarios),人類駕駛員又通常在哪裡失敗?
3. 哪些數據集對於預測以及決策算法的學習和測試有益?
場景語言格式
為了提高測試的可復現性,Queiroz, Berger, and Czarnecki在2019年引入了一種用於表示場景的領域特定語言GeoScenario。該語言構建在OSM之上。
GeoScenario的目標類似於OpenSCENARIO,後者描述了仿真場景中的動態內容,並經常與表徵靜態內容的OpenDRIVE一起,共同組成測試場景。
另一個工具CommonRoad也被多次使用,其中一個原因是它基於NGSIM US 101數據集中實現了高速公路場景。這一系列應用於道路規劃的可組合的benchmark目的是為研究人員提供一種評估和比較他們的規劃器的方法。
為了在場景中表示道路網絡,LanLets地圖(OSM格式的一個開放擴展)被廣泛使用(例如GeoScenario和CommonRoad)。
譯者註:場景基本上可以分為靜態和動態兩大塊。靜態需要地圖,對於開發階段,可以把系統中使用的地圖作為底層來構建靜態場景,使用特定的數據格式構建動態場景;對於產品落地時的測試階段,則往往需要使用標準地圖格式和標準的動態場景格式。OpenDrive、Lanlet、OpenSCENARIO、GeoScenario都同屬此列。
重新做一個類似於OpenDrive和OpenSCENARIO的東西並不難,但正如作者提到的,這裡的關鍵是一個標準化的格式,是可以幫忙減少切換仿真工具的使用開銷,方便統一標準化場景庫的格式。OpenDrive和OpenSCENARIO以及其他的OpenX系列標準最初由VTD推動,後來又把這個標準立項交給了標準化組織ASAM,這個轉交對於推動測試標準化的過程而言是很有意義的。
國內目前也有相關的工作,華為、上汽集團、中汽中心數據資源中心、51VR、騰訊科技、亮道智參與了C-ASAM的工作。
另外需要順便提一點,OpenDrive、lanlet、OSM是可以通過簡單的解析腳本相互轉換的,通過這些轉換可以復用很多其他軟體的建模工作。另外,支持OpenSCENARIO的軟體,我目前看到的有VTD和Carla,github上也有一些開源的解析器。其他仿真軟體其實可以快點支持這個功能,這不是太難的事,但卻是一件很重要的事。
OpenDrive和OpenSCENARIO這些標準也帶來了一些衍生問題,如在某種程度上增加了建模場景的時間成本。例如,如何將路測數據自動化轉化為標準場景格式?這就需要新的解決方案。關於這個話題,本文不再進一步展開。
常見的關鍵場景(Common Critical Scenarios)
從NHTSA的車禍數據中可以檢索到最頻繁出現的crash 場景。CARLA AD Challenges就使用了NHTSA pre-crash裡的常見關鍵場景來測試agent的表現。Pusse和Klusch 2019則使用GIDA分析了德國發生的數千起事故,並以此作為基準,使用開源的3D駕駛模擬器OpenDS對場景進行虛擬建模。
譯者註:對於L2級的產品,NHTSA和GIDAS是很有價值的。但在面對L4級產品時,這兩個經典的場景來源則相對有些捉襟見肘。
對於L4,最終的答案應該還是繞不開數據和關鍵場景這兩個詞。它們的關係是不解耦的。
數據不用多說了,有自動駕駛功能(或數據搜集功能)的車輛大規模部署的最直觀好處是什麼?就是各種各樣的數據,這方面的典型例子是特斯拉。數據能幫我們分析出各種不常見的長尾場景,也能幫助統計不同地區不同行為的參數規律,這些數據經過分析後,可以凝練成關鍵場景,也可以針對性的修改系統的策略或參數,以提高系統的表現。
再來談談關鍵場景,除了前面提到的數據提煉的角度,還有一種是迭代分析的角度,其中的關鍵問題是如何定義「關鍵」,在這裡我們就不做進一步的展開了。
對新數據集的需求
在許多論文中,在真實世界中進行實驗一般都被放到展望中去了。這其中一個重要原因是,因為Reality Gap的存在,在模擬或手工設計的場景中驗證的模型很難被轉換部署到真實環境中去。這催生了兩種需求:
對更逼真的模擬器的需求。
對更豐富的帶有關鍵場景的交通數據集的需求。讓我們先來想想雞和蛋的問題:如果算法最終效果表現不好,那麼到底是餵的數據有問題,還是算法本身有問題?實際上,驗證模擬器可能比驗證算法本身更困難,這很讓人失望。所以接下來讓我們把重心轉到數據集上看看。
現實世界中的駕駛數據集對基於學習的方法非常重要,這些方法試圖對人類駕駛風格和行為建模。它們的多樣性和完整性對於預測和決策模型的一般化也是必不可少的。目前存在一些基於真實交通的場景記錄集合。但大多數還是主要涉及感知的。研究與易受傷害的道路用戶(即行人和騎自行車者)進行交互的工作主要可以使用的數據集包括:Stanford Drone數據集、清華-戴姆勒TDC數據集、JAAD數據集或Eurocity PersonsECP數據集。對於高速公路和十字路口場景,highD 和NGSIM被提及的次數比較多。HighD的車輛軌跡是用一架無人機在德國高速公路上記錄下來的,而NGSIM數據集包含了安裝在舊金山灣區一幢建築物頂部的攝像頭45分鐘內記錄下來的車輛軌跡數據。SIPD研討會的參與者認為這些數據「被過度使用」,「比較無聊」,因為它們缺乏複雜的狀況。不同的團隊對數據集的需求是不同的。有些人想要全知的鳥瞰圖,特別是在提取帶有遮擋情況的場景時。有些人更喜歡從車輛上記錄的數據(Pool, Kooij,和Gavrila2019),因為藉助這些數據可以捕捉上下文線索,在規劃前推斷意圖,比如騎自行車的人在轉彎前可能會舉起手臂。
在IV19上的許多工作使用了自己的駕駛模擬器或自己構建的數據集。這使得實驗難以複製、比較。此外大多數手工製作的數據集都非常小,這不利於基於學習的模型的訓練。另外,一個致命問題是,這些數據集包含的場景多樣性較低。結論其實蠻清楚: 我們還是缺少一個數據集的,它具有多種多樣的、複雜的和關鍵的情況,且可用於交互感知的預測和決策。SIPD研討會的聯合組織者Wei Zhan藉此機會宣布發布了一個新的數據集,名為Interaction Dataset,用於社會互動預測和決策。以下是一些要點:
註:本文已經授權轉載,文章來源:公眾號-自動駕駛仿真