一種基於A*算法的用於道路場景的軌跡規劃方法

2020-12-05 電子發燒友

一種基於A*算法的用於道路場景的軌跡規劃方法

李倩 發表於 2018-10-19 11:17:54

本文提出了一種基於A*算法的用於道路場景的軌跡規劃方法,該方法中,使用了圖形搜索近似,並且通過一種新的推理技術來考慮其他車輛的不確定預測,這種新的推理技術允許高效計算一組模擬場景類型的危險結果的概率。研究者相信本文提出的幾何推斷方法可以很好地適應模型傳感器範圍和遮擋限制。

什麼是路徑規劃和軌跡規劃?

車輛自主駕駛系統從本質上講是一個智能控制機器,其研究內容大致可分為信息感知、行為決策及操縱控制三個子系統。

路徑規劃是智能車輛導航和控制的基礎,是從軌跡決策的角度考慮的,可分為局部路徑規劃和全局路徑規劃。全局路徑規劃的任務是根據全局地圖資料庫信息規劃出自起始點至目標點的一條無碰撞、可通過的路徑。由於全局路徑規劃所生成的路徑只能是從起始點到目標點的粗略路徑,並沒有考慮路徑的方向、寬度、曲率、道路交叉以及路障等細節信息,加之智能車輛在行駛過程中受局部環境和自身狀態的不確定性的影響,會遇到各種不可測的情況。

因此,在智能車輛的行駛過程中,必須以局部環境信息和自身狀態信息為基礎,規劃出一段無碰撞的理想局部路徑,這就是局部路徑規劃。通常路徑規劃的方法有:空間搜索法、層次法、動作行為法、勢場域法、柵格法、模糊邏輯法和神經網絡法等。

汽車自動駕駛任務可以分為三層,如圖所示,每層執行不同任務,包括上層路徑規劃,中層行駛行為規劃和下層軌跡規劃。

上層路徑規劃在已知電子地圖、路網以及宏觀交通信息等先驗信息下,根據某優化目標得到兩點之間的最優路徑,完成路徑規劃的傳感信息主要來自於GPS定位信息以及電子地圖。

中層行駛行為規劃是指根據主車感興趣區域內道路、交通車等環境信息,決策出當前時刻滿足交通法規、結構化道路約束的最優行駛行為,動態規劃的行駛行為序列組成宏觀路徑。行為規劃的傳感信息主要來自車載傳感器如雷達、照相機等,用以識別道路障礙、車道線、道路標識信息和交通信號燈信息等。

下層軌跡規劃是指在當前時刻,以完成當前行車行為為目標,考慮周圍交通環境並滿足不同約束條件,根據最優目標動態規劃決策出的最優軌跡。同時,車輛的動力學約束也會在下層得到體現,下層軌跡規劃除了必要的外部環境信息外,還需要對主車狀態信息進行測量或估計。

車輛路徑規劃問題中的幾個關鍵點:路網模型、路徑規划算法和交通信息的智能預測,涉及的方面較多。本文主要探討軌跡規劃。

用於道路場景的軌跡規劃方法

A概述

本文提出了一種基於A*算法的用於道路場景的軌跡規劃方法,該方法中,使用了圖形搜索近似,並且通過一種新的推理技術來考慮其他車輛的不確定預測,這種新的推理技術允許高效計算一組模擬場景類型的危險結果的概率。同時研究者還將這種軌跡規劃方法與基於蒙特卡羅方法的POMDP求解器進行了比較,發現雖然POMDP求解器可以規劃比該研究的方法更保守更複雜的行為,但是它遭受粒子剝奪,這可能會導致危險的行為。這是因為蒙特卡羅方法有時不會有足夠多的樣本用於罕見但危險的未來情況。相反,我們的方法使用了對未來信念狀態的參數化描述,並且沒有遭受這個問題的困擾,並且運行時間明顯更長。

圖1:道路行駛功能系統架構

圖1顯示了用於自主道路操作的模塊的高級視圖。全局規劃模塊處理任務,為軌跡規劃模塊提供路線,這也需要定位、附近車道模型和描述附近物體狀態和行為的模型。軌跡規劃模塊應該為自主車輛(稱為ego車輛)找到合適的軌跡,以便遵循公式:

其中xe是自我車輛的狀態,Th是預測範圍的長度。這是通過優化成本函數來實現的,其中高風險的軌跡具有高成本。通過分析由 i 指數的附近其他車輛的不確定預測來估計風險。在不確定性下的這種計劃將在該方法中以固定間隔重複,而當前最佳計劃由下級控制模塊執行。

這裡,我們通過借用[13]中的符號和定義簡要概述不確定條件下的軌跡規劃問題。我們假設環境狀態x =(xe,xi),i = 0,..,K在計劃範圍的離散時間步長中演變:

其中xik是車輛 i 在時刻tnow +kΔtp的狀態,uk是對於自我車輛的控制動作,ωk是擾動,並且N = Th /Δtp其中Δtp是時間離散化。我們每次都會對環境進行嘈雜的測量:

其中νk模擬測量噪聲。一般來說,我們不能直接觀察xk,而是總結信息狀態Ik中的所有可用信息。目標是為計劃範圍找到最優策略Π* = {π*0(I0),...,π*N-1(IN-1)},給出我們的控制動作,在給定信息狀態的情況下最小化未來預期成本,對於附加成本函數:

為了找到最優政策,我們計劃在信念空間中,並對未來的測量做出不同的假設,以獲得易處理的問題。在信念狀態bk被定義為bk = p(xk | Ik)並且Ik是歷史I狀態的情況下:Ik =(I0,u0:k-1,y0:k-1)。這個問題可以重新表述為隨機動態規劃(SDP)問題。

我們可以使用部分可觀察的決策過程(POMDP)方法來逼近SDP問題的解決方案,或者我們可以以後退的方式解決一系列控制動作,忽略未來的測量。我們在本文中使用的後一種方法稱為開環後退水平控制(OLRHC),這裡信念狀態是「對象的開環預測分布」[13],反饋是通過重新規劃實現的。

如[5] [14]中所述,我們的軌跡規划算法描述了自主車輛的狀態,在道路對齊的坐標系中,橫坐標對應於沿參考路徑的弧長s,縱坐標表示有符號的橫向距離。路徑d。我們假設我們可以精確地測量與參考路徑(se0,de0)相關的當前狀態,並且可以獲得其他車輛的開環預測列表。設xik是慣性參考系中車輛 i 的姿態和速度,xik =(x,y,θ,v),xik是與參考路徑 r 相關的狀態,xik,r =(sik,r , dik,r , sik,r)和g(xik,r)= xik是在它們之間進行映射的函數。 對每個其他車輛的預測表示為高斯混合序列,其中每個高斯模型表示車輛狀態相對於特定路線的分布:

其中αj是高斯prj(xik,r(j))=N(μir(j),k ,Σir(j),k)的混合分量權重,描述了假設 j 的路徑 r(j)的車輛 i 的狀態分布。該表示允許我們表達單個車輛的多個運動假設,例如,我們模擬車輛是否將使用不同的αj值轉向兩個假設的不確定性,每個假設屬於不同的路線。分布N(μir(j),k ,Σir(j),k)可以用不同的方法估計,例如[15],或者諸如執行卡爾曼濾波器的預測步驟的簡單方法。我們還假設我們知道每條車輛沿其路線的縱向範圍。

軌跡規划算法可以訪問道路模型,在該道路模型中,軌道規划算法可以快速確定兩條路線是否相鄰,例如,檢查車輛是否在我們的左側或右側,如果一輛車與另一輛車合併或者路線是否交叉。本文描述風險評估方法主要基於兩條車輛在路線上佔據相同縱向位置的距離和車輛的相對速度。

B圖形搜索近似

決定什麼時候改變車道,或者當駕駛到兩個車道合併的道路的一部分時是一個非凸的問題,特別是我們經常可以選擇在另一輛車前面或後面,每個車輛都有一個局部最佳值選擇。 通過允許為我們的解決方案用一組採樣狀態值,我們將軌跡優化轉換為圖搜索問題:從有限集中找出狀態值的序列,其具有最低成本,滿足我們的約束並達到狀態預測範圍的結束。我們通過對和時間進行採樣來構造一個格子超過允許狀態,並定義模擬我們的控制動作的運動原語u從時間k的狀態(s,d,v)轉換到時間k的另一個狀態 k+1,k後的Δtp秒,從而形成可能的狀態序列的圖形表示。我們使用了一個簡化的模型來說明車輛在道路對齊坐標系中的移動方式:

其中運動原語由不同的預定義加速度和橫向速度組成。速度v被限制為在上面被vmax限制為非負,並且d被縮放到1和1之間,其中1是參考路徑右邊的一個車道寬度和左邊一個車道寬度。允許速度的集合是從v = 0開始可達到的任何速度,其是非負的並且在規劃步驟的整個時間期間使用A中的任何加速度小於vmax,假設步驟之間的加速度瞬時變化。允許縱向位置的集合是時間步長k = 0,...,N 從 s = 0 開始以初始速度進入並且使用A中的加速度行進的距離的集合。在我們的簡化模型中,我們允許加速度的瞬時變化這個誤差假設最多是dmin的縱向位置誤差,它是從執行模塊轉換為非完整運動的距離中減去的。

對於我們在A *算法中的啟發式,我們使用進入結束狀態(k = N)的最優成本,假設如果dk不在車道的中心並且在時間步長k,k + 1之間將發生橫向移動,並且沒有其他車輛。 這些成本是針對每個s,v,k組合離線計算的並存儲在查找表中。 這低估了達到目標狀態的成本,因為cl和cd總是大於或等於零,啟發式是可以接受的。

總結

自動駕駛車輛的軌跡規劃應試圖在傳感器數據噪聲和不確定預測的情況下最小化預期風險。本文提出了一種基於圖搜索近似的道路場景軌跡規劃方法。其他車輛的不確定預測是由一種新的推理技術來解釋的,這種推理技術可以有效地計算建模情況類型集的危險結果的概率。對於高速公路合併場景,這裡使用簡單的恆速預測,研究者並不考慮傳感器範圍和遮擋。未來的工作將考慮更複雜的預測模型,研究者相信本文提出的幾何推斷方法可以很好地適應模型傳感器範圍和遮擋限制。例如,為了對超出傳感器範圍的可能車輛所構成的風險進行建模,研究者可以在給定未知車輛速度和位置的統一概率的情況下,整合約束違反概率。

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 美團技術解析:自動駕駛中的決策規划算法概述
    該類算法適用於在未知環境中的導航以及路徑規劃,廣泛用於目前各種移動機器人和自主車輛載具,例如「機遇號」和「勇氣號」火星車。 2. 基於採樣的規划算法 通過對連續的狀態空間進行採樣,從而將原問題近似成一個離散序列的優化問題,這一思路也是在計算機科學中應用最為廣泛的算法。
  • 幾種常見的車輛路徑規划算法
    Lee 算法 Lee 算法最早用於印刷電路和集成電路的路徑追蹤,與 Dijkstra 算法相比更適合用於數據隨時變化的道路路徑規劃,而且其運行代價要小於 Dijkstra 算法。只要最佳路徑存在,該算法就能夠找到最佳優化路徑。Lee 算法的複雜度很難表示,而且對於多圖層的路徑規劃則需要很大的空間。 3.
  • Applied Soft Computing:河北農業大學馬建斌副教授、滕桂法教授提出一種基於遺傳規划算法的混合多特徵構造方法
    5月10日,我校信息科學與技術學院馬建斌副教授、滕桂法教授在國際學術期刊Applied Soft Computing在線發表了題為「Ahybrid multiple feature construction approach for classification using Genetic Programming」的研究論文,提出一種基於遺傳規划算法的混合多特徵構造方法
  • 一種從空中角度測量車輛數據的新方法
    對於高度自動化的交通工具來說,基於場景的安全驗證在學界和業界都受到廣泛的重視。但這一任務卻極為依賴於真實場景的數據來獲取用於測試的必要場景信息。質量足夠好的數據集中應該包含道路使用者的自然行為以及與所識別的場景的描述相關的所有數據。然而,目前的測量方法並不能滿足要求。 德國亞琛工業大學汽車工程研究所新近發布的HighD數據集,提出了一種從空中角度測量車輛數據的新方法,用於滿足上述要求的基於場景的驗證。
  • 人群移動軌跡可視化新論文,入選IEEE TVCG及VIS
    本研究基於脫敏後的京津冀城市群超過120億條移動終端位置記錄,對城市人群移動模式進行了挖掘和分析,創新性地提出了針對時間稀疏軌跡的分類、聚合和可視化方法以往類似研究基於的數據通常規模較小且來源單一,而本次研究使用的數據集來自超過10萬種行動應用程式,不僅規模龐大,而且具有整合多數據來源的優勢,可以覆蓋更多類型的移動軌跡、具有更小的誤差。但同時,這些軌跡數據也具有採樣隨機且時間稀疏的特點,為數據挖掘和分析帶來了一定難度。
  • 一種快速運動規劃晶片,讓無人車決策速度提升三個數量級
    是否能夠提高運動規劃系統的速度?自DARPA挑戰賽以來,自動駕駛的規划算法大量湧現,但目前還沒有一種算法能夠覆蓋所有的場景,在面對高速場景,低速場景,自動泊車場景,複雜動態的非結構化道路場景,交通參與者密集場景等場景時,大多數自動駕駛系統會根據其模型最可能的場景來規劃運動,以確定周圍物體的作用。
  • 基於機動LSTM的周圍車輛多模態軌跡預測
    這可以在現有的戰術路徑規划算法[30]-[32]中看到,所有這些算法都依賴於對周圍車輛未來軌跡的可靠估計。許多方法使用運動模型來預測車輛軌跡[26]-[29]。然而,對於更長的預測範圍,運動模型可能是不可靠的,因為由於駕駛員所作的決定,車輛的軌跡往往是高度非線性的。這可以通過數據驅動的軌道預測方法[5]、[10]-[12]來解決。
  • 無人機集群——航跡規劃你不知道的各種算法優缺點
    此外,按照實現功能可以劃分為離線靜態航跡預規劃及在線動態實時航跡規劃。其算法可分可行性方向算法、通用動態算法及實時優化算法。根據規劃範圍可分為全局規划算法及局部尋優算法。如Dynapath算法是一種前向鏈動態規劃技術,在大的任務區域內進行航線規劃是典型的大範圍優化問題,Dynapath 算法可以得到問題的全局最優解。但該算法具有維數爆炸特性的缺陷。
  • 一種基於深度卷積神經網絡(DCNN)用于于頭髮和面部皮膚實時分割方法
    為了解決這個問題,作者提出了一種基於深度卷積神經網絡(DCNN)的高效分割方法,用於頭髮和面部皮膚分割任務,該方法在三個基準數據集上實現了速度和性能之間的顯著權衡。據我們所知,由於外界環境因素(例如照明和背景噪聲)的影響,膚色分類的準確性通常不令人滿意。因此,使用分割後的人臉來獲得特定的人臉區域,並進一步利用色矩算法提取其色彩特徵。
  • 軌跡分析,如何解決車輛定位與道路的偏差?| 斑馬數智技術內參
    試想一下,一輛汽車行駛在道路上,1、2、3這三個點是汽車的GPS定位結果,我們可以看到三個點的定位、形成的軌跡和實際道路有非常明顯的偏差。主要的原因可能是因為在外賣和送貨上門的場景下,不太需要做精準的軌跡與道路匹配。
  • 機器人任意曲線軌跡規劃基礎——樣條曲線
    機器人的軌跡規劃有很多種方式,比如三次五次多項式軌跡規劃,S型軌跡規劃等。這些類型的速度規劃簡單實用,已知開始結束狀態和速度加速度限制,就可以規劃出一條速度曲線。但正因為簡單,所以經常只能應用於規則路徑的規劃。而對於任意曲線的軌跡規劃,只有起點終點狀態的規劃就顯得力不從心了,這時候就要用到基於樣條曲線的軌跡規劃。最早的樣條曲線都是通過物理方法得到的,把一根有彈性的木條,用工具將特定的一些點固定,樣條自然彎曲形成的曲線就是樣條曲線。
  • 水下機器人a_水下機器人a星算法路徑規劃 - CSDN
    基於確定性策略梯度定理和神經網絡逼近,提出了一種無模型強化學習算法,該算法從水下機器人的採樣軌跡中學習狀態反饋控制器。為了提高反向學習算法的性能,我們進一步提出了一種通過重放先前的優先軌跡的批量學習方案。我們通過仿真說明,我們的無模型方法甚至可以與基於模型的控制器相媲美。此外,在中國南海採集的海底數據集上驗證了該算法的有效性。
  • ICLR 2018最佳論文:基於梯度的元學習算法
    最後 Maruan Al-Shedivat 等研究者提出一種基於梯度的簡單元學習算法,該算法適用於動態變化和對抗性的場景,並獲得顯著高效的適應性智能體。接下來,是機器之心對第三篇論文主要內容的編譯介紹:摘要在非平穩環境中根據有限的經驗連續地學習和適應對於發展通用人工智慧而言至關重要。
  • 基於機器視覺的典型多目標追蹤算法應用實踐
    視頻目標追蹤算法是機器視覺中一項很實用重要的算法,視頻目標追蹤算法應用場景很廣,比如智能監控、機器人視覺系統、虛擬實境(人體跟蹤)、醫學診斷(細胞狀態跟蹤)等。本文由滴普科技2048團隊AI產品部算法工程師朱曉麗介紹基於機器視覺的典型多目標追蹤算法應用實踐。
  • TPAMI | 從虛擬到現實,一種基於強化學習的端到端主動目標跟蹤方法
    該論文主要提出了一種基於強化學習的端到端主動目標跟蹤方法,通過自定義獎賞函數和環境增強技術在虛擬環境中訓練得到魯棒的主動跟蹤器,並在真實場景中對模型的泛化能力進行了進一步的驗證。簡介主動目標跟蹤是指智能體根據視覺觀測信息主動控制相機的移動,從而實現對目標物體的跟蹤(與目標保持特定距離)。
  • Apollo自動駕駛入門課程丨第⑦講—規劃(上)
    本期我們將介紹路徑規劃。在規劃中我們將結合高精度地圖、定位和預測的相關知識,從路線導航和軌跡生成兩方面來構建車輛軌跡。通過軌跡規劃,我們可以做出微妙的決策,以避開障礙物,並為乘客創造平穩的乘車體驗。在Apollo中,我們通過規劃模塊處理該任務。路線規劃的目標是,找到從地圖上的A前往B的最佳路徑。軌跡規劃的目標是找到避免碰撞和保持舒適度的可執行軌跡。路徑規劃使用三個輸入,第一個輸入為地圖,Apollo提供的地圖數據包括公路網和實時交通信息。第二個輸入為我們當前在地圖上的位置。
  • RRT路徑規划算法
    (RRT / rapidly exploring random tree)的路徑規划算法,通過對狀態空間中的採樣點進行碰撞檢測,避免了對空間的建模,能夠有效地解決高維空間和複雜約束的路徑規劃問題。 " RRT方法的特點是能夠快速有效地搜索高維空間,通過狀態空間的隨機採樣點,把搜索導向空白區域,從而尋找到一條從起始點到目標點的規劃路徑,適合解決多自由度機器人在複雜環境下和動態環境中的路徑規劃。
  • 滴普技術薈:基於機器視覺的典型多目標追蹤算法應用實踐
    視頻目標追蹤算法是機器視覺中一項很實用重要的算法,視頻目標追蹤算法應用場景很廣,比如智能監控、機器人視覺系統、虛擬實境(人體跟蹤)、醫學診斷(細胞狀態跟蹤)等。本文由滴普科技2048團隊AI產品部算法工程師朱曉麗介紹基於機器視覺的典型多目標追蹤算法應用實踐。
  • 多目標進化算法|基於網格約束分解方法
    基於分解的多目標進化算法(MOEA/D)將一個多目標優化問題分解為一組單目標優化的子問題,並以相互協作的多點搜索方式同時求解它們。然而,常用的分解方法,如加權和(WS)切比雪夫(TCH)和懲罰值邊界交叉法(PBI)來源於基於單點搜索的數學規劃,它們可能不太適合基於種群的多目標進化算法。
  • 自動駕駛運動規劃-Hybird A×算法
    和Smoothness Term四個部分的加權平均:第一個部分引導車輛儘可能的避開障礙物區域;第二個部分懲罰車輛與障礙物的碰撞行為;第三部分約束規劃的每個點的最大曲率,並提供車輛非完整約束的保證;第四個部分是軌跡的平滑性約束。