清華大學研究成果:如何用博弈論解決自動駕駛路口的會車決策問題?

2021-01-21 雷鋒網

雷鋒網新智駕按:4月24日,雷鋒網(公眾號:雷鋒網)新智駕聯合MMC在2017年上海車展舉辦「構建智能駕駛的關鍵」主題沙龍,本文來自清華大學自動化系統工程研究所教授姚丹亞的分享。本文講述了V2X技術在自動駕駛中的一個重要應用場景,即自動駕駛汽車在路口會車時的通行決策問題。

*清華大學自動化系統工程研究所教授姚丹亞在上海車展新智駕&MMC沙龍現場

有一篇來自清華大學的論文名叫《基於完全信息動態博弈的無燈控交叉口的車輛協同駕駛模型》(作者:楊卓,姚丹亞),它試著解決了一個可能很多人都想過但還沒有解決的問題,那就是使自動駕駛汽車在路口會車時相互協調,最終彼此配合完成通行決策。

你可以將它看作V2X助力自動駕駛決策的應用之一。對於V2X對自動駕駛的作用,人們談得更多的是V2X在環境感知中的作用,即除汽車自身的傳感器感知外,藉助V2X完成更大範圍的環境感知。

但V2X還有一個重要作用,就是協同決策。目前我們能做到在自主感知的基礎上決策,但V2X環境使「群決策」成為可能,在可能在未來會是自動駕駛中的一個重要應用。

如何基於V2X實現群決策?

以一個具體的場景為例,即無信號交叉路口的車車協同。兩輛車抵達路口,在沒有控制中心的情況下,聽誰的?它們之間是一個博弈的關係,要通過博弈,保證雙方安全又順利地通過交叉路口。

首先,做一個簡單的場景描述。

1、存在參與車輛,左邊駛來一輛車,下方駛來一輛車,已知彼此的速度、加速度和位置,以及達到路口會車點的距離。

2、路口為無信號交叉路口,即在沒有信號燈控制。

3、存在V2X環境,車車間可以進行交互。

以上是前提假設。接下來將問題拆分。

第一,判斷車輛間是否存在衝突。我們選擇一個指標來描述這個衝突,這個指標就叫作「衝突時間差」,即兩輛車到達衝突點的時間差值。該差值越小,就越有可能相撞,如為零則相撞,如差值很大,則代表在完全不同的時刻通過交叉點,定不會相撞。

第二,如果存在衝突,如何提前避免。在這個部分要考慮的因素很多,為了保證安全,當兩輛車存在衝突時,需要用一個算法保證它們最後不相撞。因此,二者通過路口可以看成一個博弈問題。博弈包括三個要素。

以上就是一些決策的基本場景假設。

基於此,兩輛車的路口博弈在數學上可以看作一個有約束的多目標規劃問題。即,將不同加速度組合的情況下,使獲得的收益「Ω」達到最大。其中涉及一些數學問題,如多重納什均衡、求最優解等,我們在這個模型中是用遺傳算法求取最優解。

下面就具體地來計算這個問題。

對於兩輛車,首先要判斷其是否進入衝突區。博弈系統的實例模型如下所示,紅點表示衝突點(碰撞的點),通過車輛到達衝突點的時間差判斷是否進入衝突區域。

*出自該模型作者曾發表的論文

若兩輛車並未進入衝突區,則不需要博弈,正常行駛即可。一旦進入衝突區,博弈即開始,通過博弈使得收益最大。前面講到三個收益指標(安全、快速、舒適),此時就要具體定義這三個指標。

1、安全性指標。安全性指標指已到達衝突點的時間差,在這個模型中,該差值一定要大於某個給定的閾值,才能確保安全。這個公式比較簡單,基本是中學時候關於距離、速度、時間的簡單公式。

2、快速性指標。指的是兩個周期內速度的變化,是當前時刻加速度值的直接反應。

3、舒適性指標。舒適性指標其實可以直接用加速度的絕對值來表示,絕對值越大,舒適型越差,在這個模型中我們基本選擇0.25g加速度指標來進行博弈。當然,前提還是要安全,如果要發生碰撞了,那麼舒適性指標是可以犧牲的。此外,舒適性指標也定義了一些不良加速度行為,如加速度增幅達到200%,或是該加速時變成反向加速度等。

對於以上三個收益值,需要做一個標準化的工作。三種數據的量綱不同,有的是時間,有的是加速度,如何求和呢?這其中就涉及到標準化問題。這裡不具體解釋,基本的計算方法是將當前值減去期望值除以標準差。最後,需要用到遺傳算法,儘可能得到全局最優解。

仿真實驗

對於這套理論,我們還沒有用在實車控制中,只是進行了仿真實驗。這是個具體的仿真例子。兩輛車初始速度分別為60km/h和50km/h,距離衝突點的距離分別為250米和150米,設定約束條件:最大速度不能超過70km/h,最小速度是零(即停車),加速度值控制在±0.3g之間。用於求解的遺傳算法在此不贅述,它主要用於獲得最優解的。下圖,是兩車路口會車的仿真實驗結合曲線圖。

*出自該模型作者曾發表的論文

從上圖可以看出,這次仿真實驗得到了蠻有意思的結果。在這個場景下,兩輛車出現了兩次博弈的過程。第一次,計算得出到衝突點的時間差小於給定閾值,進行了一輪博弈後,衝突危險解除,判斷安全後又開始自由駕駛;自由駕駛一段時間以後又進入了一次博弈過程,最後直到車輛安全通過路口。

上面的圖給出了許多博弈曲線。第一排曲線是收益曲線,紅色、藍色代表兩輛車分別的收益,綠色表示兩輛車的總收益。第二排是加速度曲線,拿加速度曲線來說,博弈的效果不是特別好,因為跳動很大,博弈算法還有些需要完善的地方。第三排是速度曲線。

最後一排的碰撞時間差(TDTC)。我們為TDTC設置一個閾值,當TDTC小於閾值的時候,就會告知存在碰撞風險,開始博弈。而這個過程是變化的,一旦TDTC超出閾值,就證明沒有風險,雙方就可以自由駕駛。最後車輛安全駛離交通路口,這是一個完整的博弈過程。

在一些具體參數上,主要考慮三點。

總結

該模型的研究,考慮到了駕駛安全、舒適等指標之間的博弈和決策,避免碰撞是最重要的部分,同時也要儘可能避免那些降低舒適性的操作。未來,通過豐富策略集,可以在模型的基礎上,有更多方向、更多方式的相關研究。

同時,群決策算法是一個亮點。剛才只是兩輛車的模型,我們的博士生還在研究路口多車博弈的通用模型。

當然,我們現在的實驗還在仿真基礎上,不過也在做一些實用的產品。我們課題組和一個叫作星雲互聯的公司合作,開發了一些V2X的產品,如智能車載終端、路側通信機、路側主機等,其中內置了多種通信模塊,支持多種通信方式接入,完成車車、車路之間的數據交互。目前我們的產品,主要應用在各種自動駕駛和智能駕駛測試場,同時,還推出了了一些實際應用。例如我們在校園公交系統中裝入了路側系統、校園公交車上安裝了車載裝置,用以測試和積累數據。此外,我們還在蕪湖交警支隊的支持下,在中心城區路口建設了V2X基礎設施。之後,我們還和很多的企業和測試場開展更多的合作,在實際的項目中進行測試。

雷鋒網推薦閱讀:讓汽車與萬物連接起來的V2X技術,將如何改變自動駕駛行業?

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 地平線與清華大學-豐田自動駕駛汽車人工智慧研究中心開展合作
    近日,地平線與清華大學-豐田自動駕駛汽車人工智慧技術聯合研究中心開展合作,充分發揮地平線在自動駕駛晶片方面的領先優勢,賦能前瞻性產研項目,推動自動駕駛研發與成果轉化。該自動駕駛汽車人工智慧技術聯合研究中心於2018年4月由清華大學與豐田公司聯合成立。
  • 漫談博弈論
    而臺灣地區譯成「賽局理論」,聽起來跟遊戲更接近了,但是容易讓人聯想到「田忌賽馬」,我覺得是一個比較糟糕的譯名。至於為什麼說「容易讓人聯想到『田忌賽馬』的譯名就不太合適」,後面我們還會說到。此外,「對策論」這個譯名,也在內地大量使用。比如,國內博弈論研究的一個重要學術組織就叫「中國運籌學會對策論分會」。
  • 美團技術解析:自動駕駛中的決策規划算法概述
    行為決策(Behavioral Layer) 在確定全局路徑之後,自動駕駛車輛需要根據具體的道路狀況、交通規則、其他車輛與行人等情況作出合適的行為決策。 這一過程面臨三個主要問題: 首先,真實的駕駛場景千變萬化,如何覆蓋?
  • Mobileye CEO Amnon Shashua撰文:數學模型如何規範自動駕駛困境?
    據雷鋒網(公眾號:雷鋒網)了解,這篇論文引起的爭論核心問題是: Mobileye 斷言自動駕駛行業需要一個數學模型,只要自動駕駛汽車能遵守事先定好的清晰規則,就能一勞永逸的解決與自動駕駛汽車相關的交通事故問題。但是,這個方法真的有效嗎?
  • 博弈AI大時代崛起 AI是如何戰勝人類世界冠軍的?
    德州撲克,其實是一種非完全信息的博弈,它的難度顯著高於完全信息博弈。Tuomas Sandholm教授團隊研發的Libratus在一個完全有利於人類棋手的場景設計下,依然以壓倒性的優勢,戰勝了人類最頂尖的選手。Tuomas Sandholm教授將海量的博弈場景簡化、抽象,尋找一個近似的納什均衡最終來實現一個基於博弈論的決策。
  • 李昭宏:高精度地圖決定自動駕駛決策平臺
    至於自動駕駛層面,自動駕駛擁有感知平臺和決策平臺,而高精度地圖決定了自動駕駛的決策平臺。 版權聲明:本文版權為網易汽車所有,轉載請註明出處。
  • 今日Paper|虛假新聞檢測;馬爾可夫決策過程;場景文本識別;博弈論...
    為了幫助各位學術青年更好地學習前沿研究成果和技術,AI科技評論聯合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關於人工智慧的前沿學術論文供你學習參考。
  • 自動駕駛汽車利用卷積神經網絡學習人類決策
    對於自動駕駛汽車而言,也許有一種更好的學習駕駛的方法——觀察人類。據外媒報導,澳大利亞迪肯大學的研究人員發現,藉助改進的視覺校正系統,自動駕駛汽車可以通過觀察人類操作員來學習。
  • 博弈蘊涵合作--如何運用博弈論解析中美關係
    其實,博弈本身就蘊涵合作,將「博弈」和「博弈論」簡單地等同於「衝突」和「衝突論」,這恰恰是對「博弈」和「博弈論」的極大誤解。諾貝爾經濟學獎得主納什曾經來華演講,其題目即為「通過代理來研究博弈中合作」。事實上,正視和研究國家間的利益博弈,不僅可以更好地透視國家間的衝突,也為我們更深刻地理解國家間合作提供了一把「智慧之鑰」。
  • 從空城計到阿爾法狗,博弈論如何滲透我們的生活?
    橫跨數學、經濟學和人工智慧等諸多領域的博弈論,是一門極富挑戰性而又美輪美奐的交叉科學。物理學家朗道曾感嘆自己生不逢時,包括他在內的一流科學家,在當時都只能研究二三流的問題。如今耕耘在博弈論領域的學者則幸運許多,這裡不僅有一堆一流的問題有待研究,而且還有許多重要問題尚未被發現。
  • 解決自動駕駛系統中定位問題的幾種相關思路
    解決自動駕駛系統中定位問題的幾種相關思路 智車科技IV 發表於 2020-04-10 09:39:20 (文章來源:智車科技IV) 在自動駕駛技術問題中
  • [趣味數學]從日常生活中看「博弈論」
    」原本是數學的一個分支,但由於它較好地解決了對競爭等問題的可操作性分析,成為經濟學中激蕩人心的一個研究領域。如此眾多的「博弈論」研究專家的頻頻獲獎,凸現了「博弈論」在主流經濟學中日益重要的地位。  「博弈論」原本是數學的一個分支,但由於它較好地解決了對競爭等問題的可操作性分析,成為經濟學中激蕩人心的一個研究領域。可以說,「博弈論」已經改變了經濟學的傳統輪廓線。  「博弈論」的英語原文是Game Theory,直譯過來就是遊戲論、運動論或競賽論。
  • 如何運用博弈論解析中美關係
    其實,博弈本身就蘊涵合作,將「博弈」和「博弈論」簡單地等同於「衝突」和「衝突論」,這恰恰是對「博弈」和「博弈論」的極大誤解。諾貝爾經濟學獎得主納什曾經來華演講,其題目即為「通過代理來研究博弈中合作」。事實上,正視和研究國家間的利益博弈,不僅可以更好地透視國家間的衝突,也為我們更深刻地理解國家間合作提供了一把「智慧之鑰」。
  • 博弈論速成指南:那些融入深度學習的經典想法和新思路
    本文作者就這些問題一一展開了分析。通過此文,相信讀者會對博弈論的概念和分類有更清晰的理解。從撲克等紙牌遊戲到自動駕駛汽車,不完美遊戲博弈就在我們身邊。合作 vs 非合作在合作博弈環境中,不同的參與者可以通過結盟來最大化最終結果。合同談判通常被認為是合作博弈。在非合作博弈環境中,參與者禁止結盟。戰爭是非合作博弈的終極案例。
  • 李呈赫教你了解博弈論的詭計
    博弈,就是用遊戲思維來突破看似無法改變的局面,解決現實的嚴肅問題的策略我們在日常生活中經常需要先分析他人的意圖從而做出合理的行為選擇,而所謂博弈就是行為者在一定環境條件和規則下,選擇一定的行為或策略加以實施並取得相應結果的過程。 博弈論用途很廣。但正如上文所講,博弈論原是數學運籌中的一個支系,其研究運用了種種的數學工具,一般讀者如何能掌握呢? 這裡存在著一個矛盾。
  • 當三維圖像認知發揮到極致,如何助力自動駕駛的高性能環境感知?
    在以《三維圖像認知與多模態學習》為主題的深度報告中,馬惠敏系統講解了團隊在三維圖像認知領域的解決方案探索,以及這些研究成果在自動駕駛領域的應用。以下為馬惠敏分享的精華內容,雷鋒網·新智駕進行了不改變原意的整理編輯。
  • 博弈論大師約翰·納什領獎返家途中遇車禍身亡
    什麼是博弈論與納什均衡 博弈論 :亦名「對策論」、「賽局理論」,屬應用數學的一個分支,主要研究公式化了的激勵結構間的相互作用。是研究決策主體的行為發生直接相互作用時候的決策以及 這種決策的均衡問題,具有鬥爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優 化策略。
  • 美國研發快速法評估神經網絡的不確定性 改進自動駕駛車決策能力
    蓋世汽車訊 現在,深度學習神經網絡等人工智慧系統越來越多地用於為對人類健康和安全至關重要的決策提供信息,如自動駕駛或醫療診斷等。此類網絡善於識別大型複雜數據集,以幫助做決策。但是,怎麼才知道此類網絡是正確的呢?據外媒報導,美國麻省理工學院(MIT)和哈佛大學(Harvard University)的研究人員決心找出答案。
  • 美國工程院院士深度解析:博弈論與控制面臨哪些挑戰和機遇?
    ),談到了最近博弈論在控制和網絡研究中的新興角色、它如何將控制領域的邊界拓展到工程以外的學科,以及未來的機遇和挑戰。控制,特別是最優控制,可以看作是單個參與者的動態(或微分)博弈。進一步,由於納什均衡的表徵和計算涉及到每個參與者個體優化問題的解,因此給最優控制開發的工具,如動態規劃或極大值原理,在動態博弈中肯定是有用的。
  • 普通人研究方法,而聰明人研究規則,聰明人用的博弈論是什麼樣?
    聽起來好像很高級一樣,今晚堂主就給你扒扒高大上的博弈論,落地之後是什麼樣? 要說不一樣的知識,據說是聰明人才用的東西叫「博弈論」。 簡單講就是一群聰明人,在一定規則之下,如何選取最有利自己的策略進行競爭。 平時之所以覺得博弈論高深,是因為傳統博弈論都是研究什麼策略最高明。 實際上日常的博弈論並沒有那麼遙遠,我們平時遵守的規則,已經是相互競爭和妥協的產物。