我們在前兩節分享了實時路徑規劃(自動駕駛實時路徑規划算法簡介(RRT 和Lattice Planner))和局部搜索(自動駕駛實時路徑規划算法簡介(Local search局部搜索)),那是不是這樣就可以構成自動駕駛了呢?其實不然,在2007年DARPA城市挑戰賽期間,由於車輛和駕駛之間缺乏人性化的互動,所以導致不少事故(如下圖),在有了路徑之後還需要進行機動規劃和決策。
在公共道路上自動駕駛時,車輛在每一時刻都應能夠在找到要遵循的最佳幾何順序的航路點後,決定進行最佳和最安全的操縱。這個決定必須在不忽略ego車輛與周圍交通環境的相互作用的情況下做出。因此,機動規劃包含了預測機動和非機動交通參與者的行為並評估周圍交通狀況的技術,從而使無人駕駛車輛能夠決定其最佳操縱。
本節介紹的技術在機動規劃不再僅僅搜索路徑或生成軌跡;而是充當「大腦」,過濾路徑搜索的結果,與其他交通參與者交互,並在幾何路徑轉換為可行軌跡之前批准幾何路徑。
機動規劃技術可分為兩類:
(1) 強調運動建模和障礙預測的。
(2) 基於交通環境建模的自動駕駛汽車決策模塊。
運動建模-障礙預測
Lefèvre等人。(2014)提供了一份詳細的調查,對交通環境建模和預測的最新研究進行了分類,並介紹了幾種智能車輛的風險估計器。根據他們的工作,運動模型分為基於物理的、基於操縱的和交互感知的模型。
第一類僅根據物理定律描述運動模型,第二類則依賴於根據群集軌跡或基於操縱估計和執行來估計其他交通參與者的意圖。這兩類運動模型不考慮環境,而是將車輛視為獨立的實體。第三類開發了交互感知模型,可以感知車輛間的關係,以便能夠輕鬆地對危險情況進行建模和實時識別。
就風險估計而言,Lefèvre等人。表明可以通過碰撞預測(二進位或概率)通過估計的軌跡預測碰撞,也可以通過車輛之間的意外行為或衝突操縱來預測碰撞。讀者可參考Lefèvre等人的調查。有關技術和風險指標的詳細說明。
大多數障礙物預測方法(也包括在Lefèvre等人的調查中)都是指筆直的道路,並不適用於每次機動的情況。
Alin等人使用了基於網格的貝葉斯濾波器。(2012)將行為建模為樣條函數,以預測彎道並推斷其他車輛的軌跡。與不考慮環境因素,但只考慮切入和變道操縱的貝葉斯濾波器相比,該技術顯示出更好的結果。
Gadepally(2013)使用層次隱馬爾可夫模型和有限狀態機的混合狀態系統來預測交叉口處交通參與者的未來狀態。該模型的動機在於,人類駕駛員可以很容易地估計出車輛的行為(如轉向不同的方向),但自動化車輛卻無法有效地預測這些行為。然而,這種方法需要大量的訓練和大量的數據採集來訓練模型。
本體是計算機和信息科學中使用的,實體、層次結構和相互關係的正式描述,Armand等人(2014)使用本體來推理交通參與者的行為。只有有限數量的情況(直行、跟車和到跟著車輛或行人)僅使用很少的規則就可以進行評估,而且還注意到時間效率問題。
Gindele等人(2015)使用部分可觀測馬爾可夫決策過程(POMDP)處理交通環境的簡化模型,並為其他交通參與者做出準確預測。他們可以預測未來在交叉口環境下6秒左右的運動,而且他們的技術可以很好地響應有噪聲的傳感器,允許長期預測。然而無法在線學習能力,因此,適應新的交通狀況可能很困難。
基於交通環境建模以障礙預測和決策為重點的規劃
Furda和Vlacic(2011)使用多準則決策(MCDM)和確定性有限自動機(DFA)來驅動操縱執行。輸入來自先驗已知的數據、傳感器測量和車輛通信。交通規則和駕駛過程中的目標層次結構被考慮用於決策(即道路邊界內的運動、安全距離、避免碰撞和最小化等待時間)。該方法需要在決策過程中為每個目標提供精確的信息和手動指定的權重。
在Hardy和Campbell(2013)中,根據動態障礙物的預測運動和靜態障礙物的存在來構建駕駛走廊。車輛被建模為矩形;它們的軌跡被聚集以便於識別,衝突的軌跡用於估計每一時刻的風險。在這項工作中,規劃被視為一個非線性約束優化問題。要優化的函數包括靜態和動態障礙物、可能的碰撞和到目標的距離。考慮了單個障礙物和多個障礙物,但根據障礙物的數量和忽略的車輛之間的相互作用,修建駕駛走廊會線性地增加計算工作量(如自動駕駛實時路徑規划算法簡介(RRT 和Lattice Planner)所述)。
Ziegler等人也採用了類似的方法。(2014b)其中分層並發狀態機用於靜態和動態障礙,以及生成和合併規則。為了使車輛在旅途中的每一部分都有最佳的自由空間,同時避免碰撞,還指示了駕駛走廊。然而,這種技術的主要缺點是,假定其他車輛不加速,並且與道路邊界保持安全距離。
Kala和Warwick(2013)考慮相對非結構化道路環境。他們假設沒有道路車道,而且大部分交通參與者都是非自動駕駛的,車輛之間沒有通信。在每一時刻,車輛都應該根據附近車輛的運動來顯示一定的行為。障礙物避免、在道路/車道中心行駛、車道變化、超車和超車、減速、發現衝突行為和直線行駛是預先設計的行為。距離和速度約束用於在線分類不同的行為。但這種方式僅對無限長直線道路進行研究,結果表明,在曲線道路上中心恆定或超車等情況下,車輛決策存在滯後性。快速、正確地識別道路使用者之間的衝突行為是這種方法的另一個缺點。
Wei等人採用了基於預測和成本函數(PCB)的方法。(2014年)。利用參考軌跡,以及靜態和動態障礙物作為輸入,生成多個候選軌跡,並在預測交通環境演變後,根據舒適性、安全性、油耗和朝目標前進的進度選擇最佳策略。考慮了車輛在其他車輛附近的運動,並對控制器的反應和時滯進行了仿真,以獲得更好的性能。通過仿真和道路試驗驗證了該方法的有效性,與時空網格規劃器相比,該方法計算量減少了90%。但是,只考慮單車道行為。
White and White(1989)採用馬爾可夫決策過程(MDP)來估計車輛的最佳操縱,MDP包括一組假定的在不確定條件下執行的動作,並試圖使每個動作的總回報或權重最大化。mdp在狀態空間中工作,試圖確定一個規則,該規則描述從一個狀態到另一個狀態的操作決策。
與mdp不同,mdp假設狀態是完全可觀測的,部分可觀測的馬爾可夫決策過程(POMDPs)假設機器人或車輛的狀態未知(Ong等人,2010)。因此,POMDPs將狀態空間轉換為一個信念空間,其中包含了被建模系統的每個可能狀態的所有可能概率分布。但是,如果已知車輛狀態的某些特徵(例如,方向已知,但位置未知),則我們指的是混合觀測MDP或MOMDP(Ong等人,2010年)。
在Bandyopadhayy等人的工作中。(2012)在規劃中嵌入了對交通參與者的意圖預測。一種離散混合可觀測性馬爾可夫決策過程(MOMDP)對自動駕駛車輛與行人之間的交互作用進行建模,同時對行人的意圖進行預測。自動駕駛車輛對行人的預測行為包括:「合理但分心」、「忘卻」、「不耐煩」和「機會主義駕駛」。這個實驗是通過模擬和真實世界的高爾夫球車進行的;其中假設行人的位置和速度信息是完全已知的。此外,不是同時處理一組行人,而是分別計算每個行人的MOMDP,並且假設意圖不會隨時間而改變。最後,實驗結果只有一半的行為被考慮在內。
與之前的研究相反,布萊希特爾等人。(2014)實施連續的部分可觀測MDP,假設信念狀態無限大,因為駕駛是一個連續的空間問題。輸入是假定已知的交通參與者的位置和速度。合併場景是模擬的,在這種情況下,由於一輛假想的非法停放的汽車,ego車輛遮擋了視線。擁有一個連續的信念空間可能會導致需要大量的樣本來進行自動駕駛的決策。如此大量的樣本可能會導致大量的計算工作,同時也會增加決策的密切要求的數量。
博弈論也被研究者用來考慮車輛之間的相互作用。例如,Aoude等人。(2010a)研究交叉口環境,並嘗試在交通參與者之間形成一個完美的信息博弈。如果發生碰撞,每一個遊戲都會終止,每輛車都會儘量縮短碰撞時間,而其他所有車輛則扮演「敵人」的角色,試圖將時間減至最少。然後,將該威脅評估模型嵌入到一個類似RRT的全局規劃器中,生成要遵循的路徑。該方法的實時能力通過對兩輛最高速度為0.5 m/s的模型車進行的評估提供。
在Martin(2013)的工作中遵循了同樣的博弈論概念,同樣,一個完美的信息博弈被用來預測其他車輛在高速公路上的運動規劃。對於要由電動汽車軸心化的支付功能,位置、速度和加速度作為輸入;使用包括直線行駛以及左或右車道變換的操縱裝置,產生最佳可能的操縱作為輸出。假設道路是無限直的,並在交通場景中使用最多4輛車進行模擬。
總結比較
下表總結了強調障礙預測和決策的規劃方法
機動規劃在很大程度上依賴於其他交通參與者在做出決策和估計某種情況下的風險的相對位置。根據Ward等人的建議,可以使用諸如
碰撞時間(TTC)等風險指標進行風險估計
概率缺口接受模型,由Lefèvre(2012)提出,
形成態勢評估並選擇最佳機動作為決策理論問題(使用馬爾可夫決策過程或博弈論原理)。
採用以上方法在障礙物預測和風險評估中,提供了更準確的結果,但規劃中往往忽略了上下文,並且在預測自主車輛附近障礙物的運動時可能會產生沉重的計算負擔。決策理論方法能很好地應對環境,並能為諸如通過交叉口(例如在城市或郊區環境中)或遵守高速公路上的操縱等問題提供解決方案。
參考文獻:
1,Real-time motion planning methods for autonomous on-road driving: State-of-the-art and future research directions -Christos Katrakazas a , Mohammed Quddus a, , Wen-Hua Chen b,1 , Lipika Deka a
2,Partial Motion Planning Framework for Reactive Planning Within Dynamic Environments
3,Self-driving car: Path planning to maneuver the traffic- Jonathan Hui.
文中部分圖片版權歸其所有
*未經準許嚴禁轉載和摘錄-加入我們的知識星球Vehicle可以下載以上參考資料。
>>>>