在自動駕駛仿真中,隸屬於動態場景仿真的交通仿真是一個重難點。這篇綜述《A Survey on Visual Traffic Simulation: Models, Evaluations, and Applicationsin Autonomous Driving》對交通仿真的工作進行了一個詳盡的梳理。本文在不改變原意的前提下對文章進行了整理翻譯。如有侵權,請聯繫作者刪除。
1 引言
基於各種仿真模型和真實交通數據實現的虛擬交通(Virtualized traffic)是重建交通流的理想方法。虛擬交通對視頻遊戲、虛擬實境、交通工程和自動駕駛等都有很大益處。
這篇文章首先討論了三種不同層次的交通仿真模型;其次介紹了基於數據驅動的虛擬交通構建技術;再次討論了如何將交通仿真應用於自動駕駛車輛的訓練和測試;最後討論了交通仿真的研究現狀,並提出了未來的研究方向。
1.1 為什麼要研究交通仿真
近年來,可視化交通(visual traffic)受到了越來越多的關注。其中,在構建城市場景時不可避免的會涉及大量的車輛。為了控制單個車輛的運動,一個簡單的方案是使用關鍵幀方法(keyframe methods)。然而關鍵幀方法在模擬大規模交通場景中的交通擁堵、頻繁的換道以及行人與車輛的交互行為時,不僅需要設計師進行複雜的設計和重複的調整,而且生成的車輛運動一般不符合物理規律。因此,有效地模擬大規模交通流已成為計算機圖形學中一個重要課題。此外,由於OpenStreetMap、ESRI和谷歌Maps等道路網絡可視化工具的普及,將實時交通流整合到虛擬道路網絡中也變得至關重要。然而,實時獲取車輛的實際軌跡並將其整合到虛擬應用中是非常困難的,這些趨勢推動了數據驅動的交通仿真的研究工作。
除了上述應用外,交通仿真在交通研究中有著廣泛的應用。
基於虛擬實境的駕駛訓練項目能通過生成真實的交通環境幫助新駕駛員提高駕駛技能。交通仿真還可以作為生成各種交通條件的有效工具,用於訓練和測試自動駕駛車輛。日益增長的車流量和複雜的道路網絡導致了許多與交通相關的問題,如交通堵塞、事故管理、信號控制和網絡設計優化等。
這些問題很難用基於分析模型的傳統工具解決。因此人們嘗試使用先進的計算技術對交通進行建模、仿真和可視化,以分析交通管理的交通條件,或幫助城市發展中的交通重建。
1.2 需要研究哪些問題
交通仿真的一個主要焦點是回答以下問題:給定道路網絡、行為模型和初始車輛狀態,交通將如何演變?
交通流的建模與仿真有大量的數學描述,大致可以分為宏觀模型、微觀模型、中觀模型。宏觀模型將車輛集合視為一個連續的流動,微觀模型模擬每輛車在其周圍車輛影響下的動態。中觀模型結合了微觀和宏觀模型的優點來模擬不同層次的交通細節。此外,道路網絡的生成和表示也是交通仿真中的一個基本問題。
前面提到的交通模型可以有效地捕獲交通流外觀,但得到的模擬結果通常並不真實。隨著傳感器硬體和計算機視覺技術的發展,以視頻、雷射雷達和GPS傳感器形式存在的交通流數據越來越多。這種現象催生了數據驅動的交通動畫技術。例子包括:重建從現有道路交通流量傳感器中獲取的時空數據;從有限的樣本軌跡合成新的交通流;從交通監控數據集學習行為模式和獨立特徵以產生交通流。
如何測量模擬交通的真實感的研究也不充分。為了解決這些問題,目前的主流方法包括使用主觀的用戶評價方法,並將客觀的評價指標納入度量。
虛擬交通也被應用到自動駕駛的訓練中。目前進行自動駕駛性能測試時,通常只使用一個具有預定義行為的單一道路用戶例如車輛、行人或自行車(譯者註:single actor)。通過在擁有豐富的不同道路使用者之間交互的模擬交通流中進行訓練,自動駕駛汽車有可能獲得在複雜的城市環境中處理複雜交通條件的能力。考慮到交通仿真在自動駕駛研究中的重要性,本文也從數據採集、運動規劃和模擬測試三個方面描述了自動駕駛的最新進展。
1.3 整體框架
第2節介紹了三種基於模型的交通仿真方法,並提供了面向道路網絡的過程建模和幾何表示的不同方法。第3節介紹了基於不同數據獲取方法的數據驅動交通仿真技術。第4節介紹了評價生成的虛擬交通流的真實程度的方法。第5節介紹了數據集、e2e運動規划算法和使用虛擬交通進行的自動駕駛研究。第6節討論了現狀和展望。
整體框架
2 基於模型的交通流建模
在交通仿真中,一個重要工作是在不同的細節水平上描繪車輛的運動。目前交通仿真技術大致分為三種類型,分別為宏觀、微觀和中觀。
交通流可以被看作是一種流,流中的車輛共享相似的目標和行為規則,與鄰居交互同時保持各自的駕駛特性。在計算機圖形學中,群體仿真一直是一個重要的研究領域,它為集體行為和動力學的研究提供了支持。人群模擬可以通過宏觀方式以個體真實運動為代價對群體進行整體建模,也可以通過微觀方式將群體建模為個體運動的集合。
2.1 宏觀方法
宏觀方法也稱為連續體方法,以較低的水平描述車輛的行為和相互作用:交通流由速度、流量、密度等連續體表示。宏觀方法主要是為了效率而設計,重點是再現用流量密度和交通流量等集體量測量的聚集行為。
早期的一階宏觀模型之一是由Lighthill、Whitham以及Richards開發的LWR模型。從本質上講,LWR模型以低解析度的細節描述了大規模交通流的運動。它的局限性是不能模擬車輛在非平衡條件下的運動。
Payn和Whitha提出了連續二階交通流模型Payne-Whitham (PW)模型。一階模型假設存在一個固定的平衡狀態,二階模型引入一個二階微分方程來描述交通速度動態。但在PW模型中司機可以受到他們的後續車輛的影響。
Aw、Rascle和Zhang對PW模型進行了修正,以消除其非物理行為。Zhang同樣提出了對PW模型動量方程的修正來處理向後傳播的交通,構建了Aw-Rascle-Zhang (ARZ)模型。
為了生成詳細的交通流三維動畫,Sewall等提出了連續交通仿真模型以生成大規模道路網絡上真實的交通流。他們將車道離散為多個單元格來進行仿真,並通過引入一種新的變道模型,使單車道的ARZ模型適應於處理多車道交通。為了更新每個單元的狀態,LEVEQUE R. J使用有限體積法(FVM)進行空間離散化,並結合Riemann求解器對ARZ方程進行求解。為了對車道合併和變道行為進行建模,Sewall等人將連續動態與離散車輛信息相結合,將車輛表示為車輛粒子系統。這些粒子系統是由底層的連續流驅動的。
離散道路
綜上,宏觀模型是模擬大規模交通的有效工具。然而這些技術僅限於高速公路網絡,但因為城市交通包含了汽車之間豐富的交互行為,因而不適合模擬城市交通。此外,由於這些模型不模擬匯入等行為,因此無法處理換道過程中的密度傳遞。
2.2 微觀方法
微觀模型在高水平的細節上產生車輛運動,每輛車都被視為一個離散的代理,且滿足一定的控制規則。針對城市交通仿真已經開發了大量的微觀模型,這是因為微觀模型可以靈活地建模代理的異構行為、不同的道路拓撲以及車輛之間的交互關係。
早期的微觀模型包括元胞自動機模型和跟車模型。元胞自動機模型中車輛的運動由預先指定的時間、空間和狀態變量中的演化規則來描述。具體來說,道路被離散化為單元,模型決定車輛何時從當前單元移動到下一個單元。由於其簡單性,元胞自動機模型計算效率高,可以模擬大型路網上的大量車輛。然而由於其離散性,因此只能再現有限數量的真實交通行為。
相比之下,車輛跟馳模型,可以生成真實的駕駛行為和詳細的車輛特徵,但其計算成本相對較高。模型假設交通流由分散的粒子組成,並對汽車間的相互作用進行了詳細的建模。模型通過基於刺激-響應框架(Response = Sensitivity Stimulus)的連續時間微分方程來表示每輛車的位置和速度。
在過去的幾十年裡,跟馳模型發展很快。其中兩個著名的例子是最優速度模型(OVM) 和智能駕駛模型(IDM)。OVM模型假設主車保持最優速度,它的加速度由它的速度和前車的最佳速度之差決定。IDM模型根據車輛當前速度和相對於前車的速度和位置計算車輛的加減速,特定參數使IDM模型能夠模擬各種車輛類型和駕駛風格。
對於多車道模擬,其中一個方法是使用改進的OVM,該模型用於模擬雙車道高速公路和有入口匝道的單車道高速公路的交通。另一種方法是使用twolane交通模型,該模型用來模擬交通的橫向效應。
Shen和Jin 提出了一種增強的結合連續換道技術的IDM,可以產生具有平滑的加減速策略和靈活換道行為的交通流。該模型對原有的IDM模型進行了修正,使其更適合於城市路網。該模型將加速度過程分為自由道路加速項和減速項,加速項描述了駕駛員達到期望速度的意願,減速項描述了駕駛員與附近車輛保持安全距離的意願。另外,對於減速項增加了一個激活控制部分,使停車更加平穩。該模型將城市道路變道行為分為自由變道和強制變道兩種情況,並為這兩種情況提供了一個靈活的連續模型。自由變道行為出現在相對自由的道路條件下,由雙車道MOBIL模型建模。強制換道則應用於主車因為一些必要的因素要求的換道行為,如到達車道終端或在十字路口轉向,而主車及周邊車輛之間的gap不支持自由換道。
LU等人擴展完整的速度差異模型(FVDM) 以處理在農村交通仿真中的close-car-braking情況。並在交通仿真中引入了人格模型。
必須換道的情況
與單車道或多車道的交通仿真相比,交叉口交通仿真難度更大。Doniec等人提出了一種多智能體的交通仿真行為模型,將交叉口交通視為一個多智能體協調任務。具體來說,首先每輛車感知周圍的交通情況並做出決策,其次提出了一種預測算法來模擬車輛的預測能力。
Wang等在交通仿真中引入了影子交通的概念,以統一的方式對交通異常進行建模。Chao等人設計了一個基於規則的流程來模擬混合交通仿真中車輛與行人的交互作用。
綜上所述,微觀交通模型的目的是描述特定的車輛行為,因此可以用來模擬連續車道和十字路口的交通情況。該模型的瓶頸通常是計算成本,尤其是在進行大規模仿真時。
2.3 混合方法
Sewall等人使用基於代理的模型來模擬感興趣區域的交通,而其餘區域使用連續體模型,提出了一種混合方法。通過在兩種建模方法之間動態和自動切換,進而可以根據用戶偏好來模擬不同詳細級別下的交通。
黃框內使用微觀agent,其他區域使用宏觀flow
2.4 路網生成
交通仿真是車輛與路網相互作用的一種形式。底層道路網絡的獲取和建模是重要且具有挑戰性的。真實世界道路網絡的數字表示已經越來越有可用性,但這些數據往往不能直接用於模擬交通。對於道路網絡的過程建模和幾何表示,已經提出了許多方法:
CityEngine軟體,採用基於L-system過程的方法來生成道路網絡。它可以以地圖圖像為輸入,生成一組公路和街道,將土地分割成地塊,並在相應的地塊上為建築物構建合適的幾何形狀。在基於CityEngine的路網生成模型的基礎上學者還陸續提出了具有更大的靈活性基於模板的路網生成模型,如利用生成對抗網絡(GAN)來合成的道路網絡模型等。這些方法是為構建虛擬場景而設計的,但它們常常無法為交通仿真提供必要的信息,如車道到車道的連接和鄰接。
CityEnginge地圖和WilKie地圖
交通仿真軟體MITSIM使用node,link,segment和lane來描述道路網絡的語義。在該模型中,segment表示具有相同幾何線的lane集合,link表示segment集合,向量數據存儲在segment的數據結構中,所存儲的信息包括起始點/結束點和段弧的曲率,一個node用來描述一個交點,這裡node必須作為輸入數據提供給模型,並且僅用於描述link是否連接,不考慮交叉口各方向link之間的衝突關係。
在VISSIM 交通仿真軟體中,link和connector被用來描述道路網絡的拓撲結構,這有助於描述具有更複雜幾何形狀的道路。然而,VISSIM的路網只由連續的路段組成,因此在交叉口處理不同方向的衝突是很困難的。
有人利用真實地理信息系統(real Geographic Information System, GIS)數據建立了一個包含拓撲交通信息、路面和街道對象的連貫的街道網絡模型,該系統可以提供車道和車道間的相互連接,以作為交通仿真所需的基本幾何信息,然而,他們使用lane作為原子單位來定義和組織道路網絡,而忽略了道路網絡的矢量數據。值得一提的是,為了方便不同駕駛模擬器之間的數據交換,目前提出了一種開放數據格式OpenDRIVE來規範邏輯道路描述。
一種新的道路網絡模型圖能將低細節的GIS數據自動轉換為高細節的功能道路網絡進行仿真。利用該模型可以生成區域中心拓撲結構和弧路表示。該模型以車道為基礎定義交叉口,通過交通信號和預先確定的移動優先級,在模擬中對交叉路口進行管理,生成的道路網絡庫可以在http://gamma.cs.unc.edu/RoadLib/上找到。該模型激發了更多基於車道的模擬技術,如Mao等在Frenet框架下基於道路軸線的車道模型,以方便複雜的交通仿真。
(編者按:為了方便不同駕駛模擬器之間的數據交換,針對自動駕駛也有專用的道路網絡,目前也有專用的道路網絡庫,相對重要的是OpenDRIVE,相關文章很多,這裡不再贅述,使用RoadRunner可以很高效地生成,它還可以配合OpenSCENARIO使用。還有一種開放數據格式是lanelet,在它們之間還有轉換庫,OpenDrive2Lanelet。)
一般情況下,宏觀交通仿真對路網的細節要求較少,主要是需要幾何信息,以便對交通流密度和速度的傳播進行建模。相比之下,微觀交通仿真由於輸出單個車輛的詳細運動,通常需要更多關於道路網絡的信息。這些信息包括車道的分隔和連接、交通信號邏輯、在十字路口和坡道上移動優先級等。
3 數據驅動的交通流仿真
本節中主要探討真實世界交通數據的獲取方法和各種數據驅動的交通重建和合成方法。
3.1 真實數據收集
交通傳感器有幾種形式:感應環探測器通常被放置在高速公路和主要道路上,記錄每輛經過的車輛的屬性。攝像機作為另一種固定的傳感器也可用於監控交通情況。手機和GPS設備作為移動傳感器也被用來記錄車輛的速度和位置。
除了單車數據外,許多研究還致力於收集聯網車輛的交通數據。例如,2012年在美國密西根州的安娜堡啟動了安全試點模型部署SPMD計劃。大約3000輛車輛裝備了GPS天線和DSRC(專用短程通信)設備。每輛車都向附近的車輛和路邊的單位廣播基本的安全信息,包括它的位置和速度。由於這種類型的數據可以在高頻率下採樣(10hz),這可能會導致存儲和通信系統的巨大成本。
3.2 交通重建和合成
創建符合真實世界交通的數字表徵被稱為虛擬交通,它由Van Den Berg等人首先提出。他們的工作利用交通傳感器提供的時空數據重建和可視化一個連續的交通流。如下圖所示,傳感器(點A、點B、點C)每隔200-400米放置在道路上。對於某一輛車,傳感器提供了一個元組,包含ABC三點的數據, 每個數據點分別包含了車輛通過時間t,車道id,車速v。任務是計算在給定車道上,在給定時間內,以給定速度啟動和到達車輛的軌跡。該方法首先離散可能的狀態-時間-空間,並約束車輛的運動到預先計算的路線圖。然後,在路線圖中為每輛車尋找最優軌跡,使換道次數和加減速度最小化,並與其他車輛的距離最大化,以獲得平滑、真實的運動。
對於多輛車,採用基於優先級的多機器人路徑規划算法來計算車輛的軌跡。但基於優先級的多智能體路由規划算法耗時較長,使得該方法隨著搜索空間離散化解析度的提高而變得難以處理。
從道路中獲取的時空數據進行交通重建
Wilkie等人將稀疏傳感器測量的宏觀狀態估計與基於agent的交通仿真系統相結合,引入了一種實時技術來重建單個車輛的真實運動。如下圖所示,該方法具有一個交通狀態估計階段,在這個階段,使用Kalman smoothers (EnKS)和一個連續交通仿真器來創建整個道路網絡的速度和密度場的估計。然後利用狀態估計來驅動一個基於agent的交通仿真模型,生成各個車輛的詳細運動。最後輸出與傳感器測量的原始交通信號相一致的二維交通流。該方法具有更高的靈活性和更低的計算成本。然而這種估計方法除了個別車輛的匹配外,基本上還是一種宏觀模型。
交通流重構算法流程
Li等提出了一種利用GPS數據重建城市尺度交通的方法。為了解決數據覆蓋不足的問題,該方法以GIS地圖和GPS數據為輸入,採用雙階段過程重構城市尺度的交通。在第一階段,即交通重建過程中,利用統計學習與優化、地圖匹配和行程時間估計技術相結合的方法,從稀疏的GPS數據中重建並逐步細化單個路段的交通條件。在第二階段,即動態數據補全過程中,引入了基於元模型的仿真優化,以有效地細化第一階段的重建結果,同時引入了一個微觀仿真器,在數據覆蓋不足的區域動態補全缺失的數據。
上述交通重建技術主要用於預測同一場景下具有稀疏輸入數據的完整交通流,而其他數據驅動的交通綜合方法則旨在從有限的交通軌跡樣本中生成新的交通流。Chao等人利用一組有限的車輛軌跡作為輸入樣本,通過紋理合成(texture synthesis)和交通行為規則的融合來合成新的車輛軌跡。如下圖所示,輸入車輛軌跡集包含多種考慮車道數和交通流密度的段,將交通流時空信息作為二維紋理,可以將新交通流的生成表示為紋理合成過程,通過最小化新開發的交通紋理能量度量來解決這一問題。
兩車道車輛軌跡的紋理類比
另外一種方法是使用機器學習算法來學習車輛的詳細運動特徵,包括縱向加減速和換道過程。Chao等人提出了一種基於視頻的方法,從交通動畫視頻中學習駕駛員的具體駕駛特性。該方法將每輛車獨特駕駛習慣的估計問題轉化為尋找微觀駕駛模型的最優參數集的問題,並採用自適應遺傳算法求解。Bi等人從車輛軌跡數據中學習變道特性,該方法首先從預先收集的車輛軌跡數據集中提取與換道任務最相關的特徵,然後利用所提取的特徵對換道決策過程進行建模,並對換道執行過程進行估計。
數據驅動換道模型的pipline示意圖。預處理步驟從預採集的交通數據集中提取最相關的特徵,然後決策模塊推斷出目標車輛是否需要變道,以及需要變到哪個目標車道/間隙。最後,執行模塊計算所涉及車輛的詳細軌跡,以完成變道任務
上述工作的重點是模擬高速公路或大型城市網絡上的車輛。最近,Bi等提出了一種基於深度學習的交叉口交通仿真框架。為了描述車-環境相互作用的視覺感知效應,他們建立了一個稱為網格地圖的網格坐標系統,編碼異源之間的車輛與行人混合的相互作用。如下圖所示,在網格地圖上滑動五個通道的窗口可以為每輛車生成一個環境矩陣。環境矩陣可以捕捉車輛和行人在車輛周圍的速度和位置。除了環境矩陣外,基於所收集的交叉口交通數據集的車輛標識還被用來描述當前車輛狀態,然後利用卷積神經網絡和遞歸神經網絡對交叉口處的車輛軌跡模式進行學習。除了模擬路口交通,它還可以通過提供車輛新的目的地和駕駛環境來改變現有的路口交通動畫。
4 驗證和評估
一般來說有兩種交通真實度評估方法:可視化方法和統計方法。在可視化驗證中,將真實交通和模擬交通的圖形表示並排顯示,以確定它們是否可以區分。但主觀的用戶研究會耗費大量時間且容易出錯,使用定量和客觀的度量進行統計驗證不僅可以用來測量各種模擬交通流的真實性,還可以用以一致的方式客觀地比較不同交通仿真模型的性能。在交通仿真中,由於交通的隨機性,通常不進行直接的軌跡比較,而是比較平均速度和流量隨時間的變化等,此外,更詳細的比如特定的運動參數,包括速度、加速度和車輛間隙也被用來驗證交通仿真技術的有效性。
5 在自動駕駛中的應用
本章介紹自動駕駛訓練數據收集,基於深度學習的運動規劃方法和自動駕駛仿真
5.1 自動駕駛數據集
自動駕駛數據集也可以用於交通仿真和動畫。首先,車輛軌跡可以用來校準交通仿真模型。其次,大規模的交通數據集豐富了數據驅動的交通綜合方法。最後,各種真實的交通數據集也能對虛擬交通評估提供幫助。
常用的數據集包括comma.ai數據集、Berkeley DeepDrive視頻數據集(BDDV)、LiDAR-Video數據集(LiVi-Set) 、本田研究所(Honda Research Institute)的駕駛數據集(HDD)、 Drive360。
其他一些沒有駕駛行為的數據集也有助於自動駕駛的視覺語義理解和基於視覺的控制。包括KITTI數據集、Cityscape數據集、牛津RobotCar數據、Udacity 數據集等。
5.2 運動規劃與決策
運動規劃和決策對於智能體在其環境中導航至關重要。(編者按:構建更真實的agent模型)這一節將回顧了幾種基於學習的自動駕駛車輛和其他智能體的運動規劃方法和決策算法。
ALVINN神經網絡開創了自動駕駛導航的端到端方法。Xu等使用基於大規模眾源車輛動作數據的FCN-LSTM框架來學習通用的車輛運動。這種方法採用了一種新的範式,從未經校準的來源學習模型。經過訓練後,它可以產生離散的動作如直行、停車、左轉彎、右轉彎,也可以產生連續的動作如車道跟蹤和轉向控制用於自動駕駛車輛的導航。
Lenz等研究了高速公路入口處的車輛運動。利用部分可觀測的馬爾科夫決策過程(POMDPs)來預測車輛的運動。Kuefler等採用生成式對抗模仿學習(GAIL)學習駕駛行為,該方法克服了級聯誤差的問題,能夠產生真實的駕駛行為。Hecker等人將周圍360度視角攝像頭的信息整合到路線規劃器中。該方法中使用的網絡將傳感器輸出直接映射到低水平駕駛動作,包括轉向角和速度。Kim等人引入了一種端到端的、可解釋的自動駕駛方法,該方法結合了一個基於內省的解釋模型。該模型由兩部分組成:第一部分是基於cnn的視覺注意力機制,將圖像映射到駕駛行為;第二部分是基於注意力的視頻-文本模型,用於對模型動作進行文本解釋。Yang等人利用在CARLA和TORCS中收集的虛擬交通數據來預測車輛行為,即DU-drive,如下圖所示。
近年來,強化學習也被應用於自動駕駛。Abbeel等人提出了一種有效的算法來協調全局導航和生成車輛軌跡的局部規劃之間的權衡。Silver等人提出了一種適合自動導航系統的耦合成本函數,以平衡不同的偏好,包括車輛應該在哪裡以及如何駕駛。Lillicrap等人採用深度q-learning實現無模型系統,該系統在模擬駕駛環境中學習引導車輛保持在賽道上的策略。Kuderer等人提出了一種基於特徵的反強化學習(IRL)方法來學習自動駕駛的個體駕駛風格。Wolf等人提出了一種深度Q-Networks (Deep Q-Networks, DQN),用於在三維物理仿真中引導車輛。Pan等人利用新型的現實翻譯網絡(VISRI)在虛擬環境中訓練自動駕駛模型,並將其應用於現實環境中。Liang等人提出了一種通用的可控模仿強化學習(CIRL)方法來緩解大連續動作空間的低探索效率,基於直接從CARLA模擬器輸入的視覺信息。
為了在複雜的交通環境中高效、安全地駕駛車輛,自動駕駛汽車需要對周圍車輛的運動進行預測。車輛與行人之間的相互作用要準確表達。軌跡預測的任務可以分為幾個類別:基於物理、基於行為策略和基於交互的模型。此外,基於深度學習的大量工作已經用於軌跡預測。(編者按:基於軌跡預測方法進行交通建模)
Lee等人提出了一種深層隨機IOC RNN編解碼器框架DESIRE,用於預測動態場景中代理未來的距離,進而可以生成準確的車輛行駛軌跡。Kim等人提出了一種基於lstm的概率車輛軌跡預測方法,該方法使用佔用網格圖來表徵駕駛環境。Deo和Trivedi採用卷積社會池網絡來預測高速公路上的車輛軌跡,整個網絡包括LSTM編碼器、卷積社會池層和基於操作的解碼器。具體來說,它首先使用LSTM編碼器基於跟蹤歷史來學習車輛動力學,然後,使用卷積社會池層捕獲所有車輛軌跡的相互依賴關係,最後訓練一個基於機動的LSTM解碼器來預測未來車輛軌跡的分布
5.3 自動駕駛仿真
現實世界的數據量還不足以覆蓋許多複雜的交通場景,這制約了自動駕駛系統學習不同的駕駛策略,更重要的是,無人駕駛汽車出於安全考慮,總是採取最保守、最低效的決策。作為一種有效的替代工具,使用高保真駕駛模擬器的發可以為訓練自動駕駛車輛提供各種類型的交通條件。
事實上,從自動駕駛研究的早期開始,仿真就被用於訓練駕駛模型。賽車模擬器就被用來評估各種駕駛方法。例如,Chen等使用TORCS來評價感知模型。也有研究人員利用GTAV來推導自動駕駛策略,也獲得了與藉助手動注釋的真實世界圖像產生的控制策略相媲美的性能。
CARLA是一個開源的模擬器,用於支持城市自動駕駛模型的開發、培訓和驗證。該仿真平臺支持傳感器套件的靈活設置,並提供可用於訓練駕駛策略的數據。這些數據包括GPS坐標、速度、加速/減速和碰撞的等。可以指定範圍廣泛的環境因素,包括天氣和一天中的時間。通過這些設置,CARLA已經被用於研究許多自動駕駛方法的性能,包括經典的模塊化方法、通過模仿學習的端到訓練模型,以及通過強化學習的端到端訓練模型。
Best等人也提出了一種用於自動駕駛數據生成和駕駛策略測試的高保真仿真平臺autonova-sim。autonova-sim是一組高級可擴展模塊。與CARLA類似,它還支持車輛傳感器系統的特定配置、時間和天氣條件的變化,以及非車輛參與者(如騎自行車者和行人)。
此外,最近的幾個項目試圖建立仿真平臺來訓練端到端駕駛系統,並為自動駕駛測試提供豐富的虛擬交通場景。例如,Apollo 整合了大量來自實際交通和虛擬交通的駕駛數據。這其中一個局限性是,虛擬交通數據是用特定的、定義明確的障礙物和交通信號手動創建的,與真實的交通狀況相比,這些數據的真實性和複雜性不高。
最近,Li等開發了一個仿真框架AADS,它可以用模擬的交通流增強真實圖像,從而生成具有真實感的圖像。利用雷射雷達和攝像機的數據,該框架可以根據車輛的實際行駛軌跡,將模擬的交通流合成到背景中。複合圖像可以被修改為不同的視點,並進行充分的注釋,可以用於自動駕駛系統的開發和測試。該框架旨在克服人工開發虛擬環境的成本較高和使用虛擬圖像訓練自動駕駛時可能的車輛性能下降問題。
Li等人開發的另一個框架ADAPS從事故中獲取相關自動駕駛數據。該框架由兩個仿真平臺組成。第一個仿真平臺以3D方式運行,用於測試所學習的策略和模擬事故;第二個仿真平臺運行在2D中,用於分析第一個仿真平臺中發生的事故,並通過提供備用安全軌跡來解決事故。然後根據安全軌跡生成大量帶注釋的數據,用於訓練和更新控制策略。與以前的技術(如DAGGER )相比,ADAPS還代表了一種更有效的在線學習機制,可以極大地減少生成健壯控制策略所需的迭代次數。
6 討論
首先,交通仿真模型應該能夠對儘可能多的複雜交通行為進行建模,同時保持計算效率。然而,對於現有的微觀交通模型,車輛的每一個行為,如加速/減速和換道,都是單獨建模和控制的。此外,微觀交通模型更多地關注車輛在前進方向上的運動,換道行為和車輛橫向運動一般被忽略。此外,根據車輛跟馳規律,車輛的運動主要受前車的影響,因此得到的仿真結果很少涉及視場中其他車輛的加減速計算。為了模擬更真實的交通流,需要開發一個統一的、可擴展的仿真框架,用於豐富的車輛行為,包括加速/減速、停留在車道內、變道以及與非車輛交通參與者(如行人和騎自行車者)的交互。
其次,儘管有許多成功的演示,目前的數據驅動的交通動畫方法不能處理車輛和其他移動對象(例如行人)之間的交互。其中一個主要原因是同時獲取車輛、行人和環境因素的大尺度時空數據是一項艱巨的任務。在交通重建中,通常將道路內傳感器和GPS數據作為兩類交通數據分別進行計算。同時,現有的數據限制了交通重建的準確性。因此,結合各種數據源,如道路傳感器、視頻流和GPS跟蹤,有可能提高重建精度。
第三,對於虛擬交通保真度的評估,基於字典的度量提供了一個可行的解決方案。然而,交通數據的質量和組成對生成的字典有直接和實質性的影響,從而影響評價結果。此外,該框架提取出每輛車的加速度、速度、相對速度和與前車的間隙距離來描述車輛的瞬時狀態,為了更好地捕獲交通模式進行字典學習,還應該考慮和提取交通流的更多特徵,包括車輛運動學約束、道路約束和駕駛員特徵。對於宏觀的交通仿真,有必要開發保真度指標,以一種聚集的方式測量交通流,包括流密度和速度。
最後,對於自動駕駛來說,解決自動駕駛車輛和其他道路使用者之間的交互仍然是一個挑戰。現有的仿真器較少考慮雙方的相互作用。舉例來說,在Apollo仿真平臺中實現了兩種類型的非車輛交通參與者:行人和騎自行車的人。然而,這些非車輛代理的行為是預先定義的,因此它們不能實時地對車輛做出反應。雖然在CARLA 中引入了動態行人,但是車輛與行人之間的交互是以一種簡單的預先指定的方式進行處理:行人在移動之前會查看附近是否有車輛,然後在沒有進一步檢查的情況下繼續移動,這種交互模式還過於簡單,需要再深入研究。