自動駕駛機動動作規劃和決策

2020-12-16 VehicleEngineering

我們在前兩節分享了實時路徑規劃(自動駕駛實時路徑規划算法簡介(RRT 和Lattice Planner))和局部搜索(自動駕駛實時路徑規划算法簡介(Local search局部搜索)),那是不是這樣就可以構成自動駕駛了呢?其實不然,在2007年DARPA城市挑戰賽期間,由於車輛和駕駛之間缺乏人性化的互動,所以導致不少事故(如下圖),在有了路徑之後還需要進行機動規劃和決策。

在公共道路上自動駕駛時,車輛在每一時刻都應能夠在找到要遵循的最佳幾何順序的航路點後,決定進行最佳和最安全的操縱。這個決定必須在不忽略ego車輛與周圍交通環境的相互作用的情況下做出。因此,機動規劃包含了預測機動和非機動交通參與者的行為並評估周圍交通狀況的技術,從而使無人駕駛車輛能夠決定其最佳操縱。

本節介紹的技術在機動規劃不再僅僅搜索路徑或生成軌跡;而是充當「大腦」,過濾路徑搜索的結果,與其他交通參與者交互,並在幾何路徑轉換為可行軌跡之前批准幾何路徑。

機動規劃技術可分為兩類:

(1) 強調運動建模和障礙預測的。

(2) 基於交通環境建模的自動駕駛汽車決策模塊。

運動建模-障礙預測

Lefèvre等人。(2014)提供了一份詳細的調查,對交通環境建模和預測的最新研究進行了分類,並介紹了幾種智能車輛的風險估計器。根據他們的工作,運動模型分為基於物理的、基於操縱的和交互感知的模型。

第一類僅根據物理定律描述運動模型,第二類則依賴於根據群集軌跡或基於操縱估計和執行來估計其他交通參與者的意圖。這兩類運動模型不考慮環境,而是將車輛視為獨立的實體。第三類開發了交互感知模型,可以感知車輛間的關係,以便能夠輕鬆地對危險情況進行建模和實時識別。

就風險估計而言,Lefèvre等人。表明可以通過碰撞預測(二進位或概率)通過估計的軌跡預測碰撞,也可以通過車輛之間的意外行為或衝突操縱來預測碰撞。讀者可參考Lefèvre等人的調查。有關技術和風險指標的詳細說明。

大多數障礙物預測方法(也包括在Lefèvre等人的調查中)都是指筆直的道路,並不適用於每次機動的情況。

Alin等人使用了基於網格的貝葉斯濾波器。(2012)將行為建模為樣條函數,以預測彎道並推斷其他車輛的軌跡。與不考慮環境因素,但只考慮切入和變道操縱的貝葉斯濾波器相比,該技術顯示出更好的結果。

Gadepally(2013)使用層次隱馬爾可夫模型和有限狀態機的混合狀態系統來預測交叉口處交通參與者的未來狀態。該模型的動機在於,人類駕駛員可以很容易地估計出車輛的行為(如轉向不同的方向),但自動化車輛卻無法有效地預測這些行為。然而,這種方法需要大量的訓練和大量的數據採集來訓練模型。

本體是計算機和信息科學中使用的,實體、層次結構和相互關係的正式描述,Armand等人(2014)使用本體來推理交通參與者的行為。只有有限數量的情況(直行、跟車和到跟著車輛或行人)僅使用很少的規則就可以進行評估,而且還注意到時間效率問題。

Gindele等人(2015)使用部分可觀測馬爾可夫決策過程(POMDP)處理交通環境的簡化模型,並為其他交通參與者做出準確預測。他們可以預測未來在交叉口環境下6秒左右的運動,而且他們的技術可以很好地響應有噪聲的傳感器,允許長期預測。然而無法在線學習能力,因此,適應新的交通狀況可能很困難。

基於交通環境建模以障礙預測和決策為重點的規劃

Furda和Vlacic(2011)使用多準則決策(MCDM)和確定性有限自動機(DFA)來驅動操縱執行。輸入來自先驗已知的數據、傳感器測量和車輛通信。交通規則和駕駛過程中的目標層次結構被考慮用於決策(即道路邊界內的運動、安全距離、避免碰撞和最小化等待時間)。該方法需要在決策過程中為每個目標提供精確的信息和手動指定的權重。

在Hardy和Campbell(2013)中,根據動態障礙物的預測運動和靜態障礙物的存在來構建駕駛走廊。車輛被建模為矩形;它們的軌跡被聚集以便於識別,衝突的軌跡用於估計每一時刻的風險。在這項工作中,規劃被視為一個非線性約束優化問題。要優化的函數包括靜態和動態障礙物、可能的碰撞和到目標的距離。考慮了單個障礙物和多個障礙物,但根據障礙物的數量和忽略的車輛之間的相互作用,修建駕駛走廊會線性地增加計算工作量(如自動駕駛實時路徑規划算法簡介(RRT 和Lattice Planner)所述)。

Ziegler等人也採用了類似的方法。(2014b)其中分層並發狀態機用於靜態和動態障礙,以及生成和合併規則。為了使車輛在旅途中的每一部分都有最佳的自由空間,同時避免碰撞,還指示了駕駛走廊。然而,這種技術的主要缺點是,假定其他車輛不加速,並且與道路邊界保持安全距離。

Kala和Warwick(2013)考慮相對非結構化道路環境。他們假設沒有道路車道,而且大部分交通參與者都是非自動駕駛的,車輛之間沒有通信。在每一時刻,車輛都應該根據附近車輛的運動來顯示一定的行為。障礙物避免、在道路/車道中心行駛、車道變化、超車和超車、減速、發現衝突行為和直線行駛是預先設計的行為。距離和速度約束用於在線分類不同的行為。但這種方式僅對無限長直線道路進行研究,結果表明,在曲線道路上中心恆定或超車等情況下,車輛決策存在滯後性。快速、正確地識別道路使用者之間的衝突行為是這種方法的另一個缺點。

Wei等人採用了基於預測和成本函數(PCB)的方法。(2014年)。利用參考軌跡,以及靜態和動態障礙物作為輸入,生成多個候選軌跡,並在預測交通環境演變後,根據舒適性、安全性、油耗和朝目標前進的進度選擇最佳策略。考慮了車輛在其他車輛附近的運動,並對控制器的反應和時滯進行了仿真,以獲得更好的性能。通過仿真和道路試驗驗證了該方法的有效性,與時空網格規劃器相比,該方法計算量減少了90%。但是,只考慮單車道行為。

White and White(1989)採用馬爾可夫決策過程(MDP)來估計車輛的最佳操縱,MDP包括一組假定的在不確定條件下執行的動作,並試圖使每個動作的總回報或權重最大化。mdp在狀態空間中工作,試圖確定一個規則,該規則描述從一個狀態到另一個狀態的操作決策。

與mdp不同,mdp假設狀態是完全可觀測的,部分可觀測的馬爾可夫決策過程(POMDPs)假設機器人或車輛的狀態未知(Ong等人,2010)。因此,POMDPs將狀態空間轉換為一個信念空間,其中包含了被建模系統的每個可能狀態的所有可能概率分布。但是,如果已知車輛狀態的某些特徵(例如,方向已知,但位置未知),則我們指的是混合觀測MDP或MOMDP(Ong等人,2010年)。

在Bandyopadhayy等人的工作中。(2012)在規劃中嵌入了對交通參與者的意圖預測。一種離散混合可觀測性馬爾可夫決策過程(MOMDP)對自動駕駛車輛與行人之間的交互作用進行建模,同時對行人的意圖進行預測。自動駕駛車輛對行人的預測行為包括:「合理但分心」、「忘卻」、「不耐煩」和「機會主義駕駛」。這個實驗是通過模擬和真實世界的高爾夫球車進行的;其中假設行人的位置和速度信息是完全已知的。此外,不是同時處理一組行人,而是分別計算每個行人的MOMDP,並且假設意圖不會隨時間而改變。最後,實驗結果只有一半的行為被考慮在內。

與之前的研究相反,布萊希特爾等人。(2014)實施連續的部分可觀測MDP,假設信念狀態無限大,因為駕駛是一個連續的空間問題。輸入是假定已知的交通參與者的位置和速度。合併場景是模擬的,在這種情況下,由於一輛假想的非法停放的汽車,ego車輛遮擋了視線。擁有一個連續的信念空間可能會導致需要大量的樣本來進行自動駕駛的決策。如此大量的樣本可能會導致大量的計算工作,同時也會增加決策的密切要求的數量。

博弈論也被研究者用來考慮車輛之間的相互作用。例如,Aoude等人。(2010a)研究交叉口環境,並嘗試在交通參與者之間形成一個完美的信息博弈。如果發生碰撞,每一個遊戲都會終止,每輛車都會儘量縮短碰撞時間,而其他所有車輛則扮演「敵人」的角色,試圖將時間減至最少。然後,將該威脅評估模型嵌入到一個類似RRT的全局規劃器中,生成要遵循的路徑。該方法的實時能力通過對兩輛最高速度為0.5 m/s的模型車進行的評估提供。

在Martin(2013)的工作中遵循了同樣的博弈論概念,同樣,一個完美的信息博弈被用來預測其他車輛在高速公路上的運動規劃。對於要由電動汽車軸心化的支付功能,位置、速度和加速度作為輸入;使用包括直線行駛以及左或右車道變換的操縱裝置,產生最佳可能的操縱作為輸出。假設道路是無限直的,並在交通場景中使用最多4輛車進行模擬。

總結比較

下表總結了強調障礙預測和決策的規劃方法

機動規劃在很大程度上依賴於其他交通參與者在做出決策和估計某種情況下的風險的相對位置。根據Ward等人的建議,可以使用諸如

碰撞時間(TTC)等風險指標進行風險估計

概率缺口接受模型,由Lefèvre(2012)提出,

形成態勢評估並選擇最佳機動作為決策理論問題(使用馬爾可夫決策過程或博弈論原理)。

採用以上方法在障礙物預測和風險評估中,提供了更準確的結果,但規劃中往往忽略了上下文,並且在預測自主車輛附近障礙物的運動時可能會產生沉重的計算負擔。決策理論方法能很好地應對環境,並能為諸如通過交叉口(例如在城市或郊區環境中)或遵守高速公路上的操縱等問題提供解決方案。

參考文獻:

1,Real-time motion planning methods for autonomous on-road driving: State-of-the-art and future research directions -Christos Katrakazas a , Mohammed Quddus a, , Wen-Hua Chen b,1 , Lipika Deka a

2,Partial Motion Planning Framework for Reactive Planning Within Dynamic Environments

3,Self-driving car: Path planning to maneuver the traffic- Jonathan Hui.

文中部分圖片版權歸其所有

*未經準許嚴禁轉載和摘錄-加入我們的知識星球Vehicle可以下載以上參考資料。

>>>>

相關焦點

  • 美團技術解析:自動駕駛中的決策規划算法概述
    引言 在一套完整的自動駕駛系統中,如果將感知模塊比作人的眼睛和耳朵,那麼決策規劃就是自動駕駛的大腦。大腦在接收到傳感器的各種感知信息之後,對當前環境作出分析,然後對底層控制模塊下達指令,這一過程就是決策規劃模塊的主要任務。同時,決策規劃模塊可以處理多麼複雜的場景,也是衡量和評價自動駕駛能力最核心的指標之一[1]。
  • 什麼是自動駕駛實時運動規劃
    目前,自動駕駛或自動駕駛汽車是學術界和汽車界研究的核心,因為它具有多方面的優勢,包括提高安全性、減少擁堵、降低排放和提高機動性。其實軟體是支持自動駕駛的關鍵驅動因素,在將乘客或貨物從指定的起點運送到指定的目的地時,其中負責關鍵任務決策的規划算法是核心中的核心。
  • LUCIDGames: 為自動駕駛車輛規劃自適應軌跡的技術
    自動駕駛汽車在很多地方都進行了模擬測試,但真正上路測試並不多,因為在真實的街道環境中,自動駕駛汽車還無法根據周圍環境中其他車輛和人的動作或運行軌跡進行自動調整。史丹福大學的研究人員最近創建了LUCIDGames,這是一種可以預測和規劃自動駕駛車輛自適應軌跡的計算技術。
  • 自動駕駛環運動規劃的相關術語和定義
    在上期我們分享了什麼是自動駕駛實時規劃(什麼是自動駕駛實時運動規劃)之後,我們將繼續分享自動駕駛實時規劃裡面的定義和術語,畢竟任何一個行業都會衍生出一定的定義和術語,只有理解這些定義和術語才能夠去理解這些意義和內容。本節描述了機器人規劃領域文獻中常用的關鍵概念術語,因此也介紹了自動駕駛車輛。
  • 跳過L2和L3,眾泰汽車說2018年量產自動駕駛汽車
    日前,雷鋒網記者體驗了眾泰的自動駕駛汽車,並和眾泰自動駕駛汽車項目的工程師聊了聊。和其它自動駕駛或者無人駕駛企業相比,眾泰汽車可以說是趕了個晚集。據了解,眾泰自動駕駛汽車項目是今年年初才立項的,到今年5月,第一輛原型車開始上路測試,而現在,團隊已經完成了第二款原型車(基於眾泰SR9)的研發。
  • 豐田資助自動駕駛項目LUCIDGames
    史丹福大學的研究人員最近創建了LUCIDGames,這是一種計算技術,可以預測和規劃自動駕駛汽車的自適應軌跡。他們在arXiv上發表的一篇論文中,提出了一種基於博弈論的算法和一種估算方法。人類通常能夠找出其他司機在他們周圍駕駛車輛的目標,並進行決策,比如在給定的十字路口誰先走。在他們的研究中,勒克萊克和他的同事們試圖在自動駕駛汽車上複製這種能力,以及支持這種能力的複雜行為。他們的總體目標是讓自動駕駛汽車識別周圍其他車輛的目標,以便在涉及某種協商的情況下規劃出更合適的軌跡。
  • 自動駕駛時代將至 入國家頂層發展規劃
    如果文件獲得通過,中國將正式擁有自己的自動駕駛汽車分級國家標準,這將幫助各類企業更有針對性展開研發和技術部署的工作,推動自動駕駛技術實現大規模應用落地。近期智能汽車領域持續利好。不久前,發改委、工信部等11個國家部委聯合出臺了《智能汽車創新發展戰略》中,針對自動駕駛提出了包括夯實複雜環境感知、智能決策控制、人機互動等在內的關鍵基礎技術,建立健全智能汽車測試評價體系重點研發虛擬仿真、軟硬體結合仿真、實車路測等測評技術,開展特定區域智能汽車測試運行及示範應用等內容。
  • 當前自動駕駛方法的-限制和極限
    前幾節中討論的方法在尋找路徑、選擇最佳操縱和構建可行軌跡方面具有良好的效果。然而,當前自動駕駛仍然存在局限性,自動駕駛還沒有達到人類駕駛能力的水平。本將分享當前自動駕駛方法的限制和極限。一些方法(例如,Aoude等人,2010a,b;Bandyopadhayy等人,2012;Martin,2013)也假設障礙物的運動不存在不確定性;這種假設在實際情況下無效,特別是在有人駕駛的混合交通情況下。谷歌(Google)最近的實驗(2015年)證明了自動駕駛汽車和人類駕駛員之間缺乏理解。在這些實驗中,谷歌自動駕駛汽車無法確定附近人類司機的意圖,這種混亂導致了輕微的車禍。
  • 眾泰質量—眾泰汽車自動駕駛汽車在路上
    在集團領導、研究院領導的大力支持與推動下,經過眾多工程師不斷的努力與奮鬥,目前眾泰第一輛自動駕駛汽車已平穩著陸,並順利完成城郊道路標定及測試工作,累積行駛裡程已達5000公裡。慢慢耕耘路,今日喜豐收,這一萬眾期待的碩果是眾泰人嘔心瀝血、艱苦奮鬥所得,是眾泰人開拓進取、竭誠創新之路的又一個裡程碑。眾泰自動駕駛汽車研發項目成立之初就受到集團及研究院領導高度重視和深切關懷。
  • 自動駕駛仿真平臺VISTA推出,大幅優化自動駕駛汽車測試和部署時間
    研究人員稱,VISTA是一款數字驅動型平臺,其所用的數據與真實的路況、駕駛情境內所涉及的目標物無論在距離還是行為動作上都保持一致。這防止了自動駕駛汽車在仿真軟體裡所學的駕駛技巧與真實環境下的車輛操控存在不匹配的情況。為了創建VISTA,人類駕駛員每行駛一段距離,研究人員就會採集相應的視頻數據,逐幀地提取分析。
  • 從控制系統的角度看自動駕駛及其安全設計
    智能駕駛汽車通過搭載先進的車載傳感器、控制器和數據處理器、執行機構等裝置,從而具備在複雜行駛環境下的傳感感知、決策規劃、控制執行等功能,以實現安全、高效、舒適和節能的智能行駛。那麼無論是物理意義上的傳感器,控制器和執行機構,還是算法層面的傳感感知,決策規劃和控制執行,其實都是一種控制系統。本文就從控制理論與控制工程的角度跟大家聊聊控制系統與自動駕駛安全設計的關係。
  • PNNL研發出全新機器學習算法 可幫助自動駕駛汽車規劃路線
    此外,該算法還可用於自動駕駛汽車。 目前,街道級公開的交通信息是稀疏和不完整的,交通工程師通常依靠孤立的交通計數、碰撞和速度數據來確定道路狀況。TranSEC使用從UBER駕駛員處收集的交通數據集和其他公開的交通傳感器數據,繪製一段時間內的街道交通流量圖。它利用機器學習工具和國家實驗室可用的計算資源,繪製出一幅城市交通的大圖。
  • 上海臨港出臺新規劃 允許L3級自動駕駛上高速
    雖然當前各大車企相繼宣稱,都掌握開發除了L2級別以上的自動駕駛或者輔助自動駕駛技術。但是當前,國內國內大部分地區,都施行下發自動駕駛測試牌照,劃定有限範圍,同時車內配備有安全員的情況下,開展自動駕駛測試。
  • 自動駕駛的現狀、案例與趨勢
    根據歐盟的自動駕駛規劃,2020年部分L3或者L4級別的自動駕駛汽車有望投放市場,2020年所有新車都實現聯網,2030年有望步入全自動駕駛社會。中國出臺自動駕駛分級標準,為後續法律法規出臺和智能網聯汽車發展提供支撐。
  • 自動駕駛初級階段 體驗小鵬P7的NGP功能
    1、什麼是NGP高速自主導航駕駛?在2019年年中,特斯拉推出了NOA(Navigate on Autopilot)自動輔助導航駕駛,可以讓車輛在高速公路上按照導航規劃的路逕行駛,自動駛入和駛出高速公路匝道或立交橋岔路口,超過行駛緩慢的車輛。
  • 【關注】自動駕駛技術與實例最全解析
    用於高精度定位、輔助環境感知、規劃與決策,包含詳細道路模型,包括車道模型、道路部件、道路屬性和其他的定位圖層。具備輔助完成實現高精度的定位位置功能、道路級和車道級的規劃能力、以及車道級的引導能力。
  • 不僅要聰明的車,還要聰明的路,真正的自動駕駛還有多遠?-自動駕駛...
    晨報記者 潘 文遇到行人、車輛自動避讓,到站後緩緩停靠……昨日,在2020世界人工智慧大會自動駕駛論壇的外場連線環節,一輛自動駕駛公交車在臨港進行了遠程演示。論壇上,「信息飛魚」規劃中的第一項重大產業專項行動——智能網聯汽車專項行動正式發布。
  • 福特和大眾結盟,自動駕駛進入聯盟競爭時代?
    在電動汽車和自動駕駛汽車領域中,隨著眾多聯盟的建立,車企之間的競爭,已經從單個公司之間的角力,演變為聯盟之間的實力較量。繼寶馬與戴姆勒、通用和本田之後,新能源和自動駕駛領域又一聯盟誕生。福特汽車和大眾汽車近日共同宣布,將擴大今年1月宣布的全球聯盟,雙方將在電動汽車和自動駕駛汽車領域展開合作。
  • 揭秘特斯拉自動駕駛背後技術
    馬斯克曾說會在2019年年底推出功能齊全的自動駕駛(Full Self Driving,簡稱 FSD),但現在已經到了2020年,特斯拉升級系統後除增加了「車輛召喚」功能,也並沒有完全開放自動駕駛權限。
  • 2020自動駕駛:L4技術降維應用,自動駕駛由布道走向趕考
    2020年,美國發布了《確保美國自動駕駛汽車技術的領導地位:自動駕駛汽車4.0》和《ITS 2020-2025規劃》,日本發布了《實現自動駕駛的行動報告與方針4.0版》,歐盟戰略運輸研究和創新議程開展了包括自動駕駛在內的多個領域路線圖研究。國內中央和地方也充分規劃布局,完善自動駕駛汽車發展的頂層設計。