沒有地圖也能導航:DeepMind展示全新AI導航技術

2020-12-06 機器之心Pro

當前的無人駕駛汽車高度依賴於精確的地圖進行導航,儘管各家科技公司已經構建了接近完美的 3D 地圖,但這種方式仍然存在一些弊端(巨大的容量、需要不斷更新等)。近日,DeepMind 提出了一種端到端深度強化學習尋路方法,其訓練的神經網絡可以幫助汽車在沒有地圖的情況下正確前往目的地,這一研究或許可以幫助自動駕駛汽車技術向前邁進一大步。

論文連結:https://arxiv.org/abs/1804.00168

小時候,你是如何熟悉周圍環境路線的?例如怎麼去朋友家、去學校或者去雜貨鋪?可能沒有地圖,只是簡單地記住街道的外觀、沿路的變向。隨著在附近街區的探索逐漸增多,你變得更加自信,開始學習新的、更複雜的路。有時你可能會迷路,但是在路標或者太陽(指南針)的幫助下你可以重新找到正確的路。

導航是一項重要的認知任務,幫助人類和動物在沒有地圖的情況下穿過複雜世界中長長的路途。此類長距離導航可同時支持自我定位(「我在這裡」)和目標表徵(「我要去那兒」)。

在論文《Learning to Navigate in Cities Without a Map》中,DeepMind 展示了一種交互式導航環境,該環境使用來自谷歌街景的第一人稱視角圖像,並遊戲化該環境來訓練 AI。儘管谷歌街景圖像已經很標準了,但是人臉和汽車牌照比較模糊、無法辨認。DeepMind 構建了一個基於神經網絡的人工智慧體,可使用視覺信息(來自谷歌街景圖像的像素)學會在多個城市之間導航。注意該研究是關於通常意義上的導航,並非駕駛。DeepMind 未使用交通信息,也沒有嘗試建模車輛控制。

在沒有環境地圖的情況下,DeepMind 智能體在視覺多樣化環境中導航。

當智能體到達目標地點時會得到獎勵(目標地點是指定的,如經緯度坐標),就像一個沒有地圖、帶著大量貨物的快遞員。隨著時間的推移,該人工智慧體學會用這種方式穿越整個城市。DeepMind 還展示了其智能體可在多個城市中學習執行該任務,然後穩定地泛化至新的城市。

智能體在巴黎訓練時的定格動畫。圖像右上方是城市地圖,顯示目的地(紅色)和智能體位置和視野(綠色)。注意該智能體無法看到地圖,只能看到目的地的經緯度坐標。

不通過地圖構建來學習導航

DeepMind 背離了傳統的依賴於地圖繪製和探索的方法(例如製圖員給自己定位同時繪製地圖)。相反,他們的方法是讓系統像人類一樣導航,不需要地圖、GPS 定位或其它幫助,只需要使用視覺觀測。他們構建了神經網絡智能體,它以對環境的視覺觀測圖像為輸入,並預測自己的下一個動作。他們使用了深度強化學習來端對端地訓練智能體,這和最近的兩項研究《LEARNING TO NAVIGATE IN COMPLEX ENVIRONMENTS》以及《REINFORCEMENT LEARNING WITH UNSUPERVISED AUXILIARY TASKS》相似。但和這些研究所不同的是,他們沒有使用小規模的虛擬環境,而使用了城市規模的真實世界數據,包括倫敦、巴黎和紐約中複雜的交匯道路、人行道、隧道以及各種拓撲結構。此外,他們的方法支持特定城市的學習和優化,以及通用的可遷移的導航行為。

模塊化的神經網絡架構,可遷移至新城市的導航

智能體的神經網絡由三部分構成:(1)可處理圖像和提取視覺特徵的卷積神經網絡;(2)地區特定的循環神經網絡,可記憶環境,以及學習當前位置和目標位置的表徵;(3)區域不變(locale-invariant)的循環網絡,可以生成對智能體動作的導航策略。地區特定的模塊被設計成可替換的,並且對於其導航的城市是唯一的,而視覺模塊和策略模塊則是區域不變的。

(a)CityNav 架構的對比;(b)MultiCityNav 架構,為每個城市提供地區特定的路徑;(c)訓練過程和將智能體適應到新城市的遷移過程。

正如谷歌街景中的界面一樣,智能體可以在其位置旋轉或走向下一個全景圖。但和谷歌地圖以及街景環境不同的是,智能體沒有小箭頭提示、局域或全局地圖,也沒有著名的 Pegman(學習區分公路和人行道)。智能體的目的地可能位於現實世界的數公裡之外,它需要逐步利用數百個全景圖才能到達目的地。

DeepMind 表示其方法提供了一種將知識遷移至新城市的機制。當智能體訪問新城市時,人類當然希望它學習一系列新地標,但是沒必要重新學習視覺表徵或行為(如沿街道推進或在路口轉彎)。因此,DeepMind 使用 MultiCity 架構,首先在多個城市中進行訓練,然後凍結策略網絡、視覺卷積網絡和多個新城市特定路徑。該方法使智能體在不遺忘之前所學知識的前提下獲取新知識,與《Progressive Neural Networks》中的架構類似。

該研究中使用的曼哈頓五個區域地圖

導航是人工智慧研究和發展中的基礎研究,嘗試在人工智慧體中復現人類導航也可以幫助科學家理解其生物性基礎。

相關焦點

  • 百度地圖導航
    百度地圖導航是百度旗下的一款非常精準的城市電子地圖軟體。百度地圖導航app提供免費瀏覽地圖、搜索地點、線路一鍵查詢!百度地圖導航下載2020新版覆蓋行業最全最準的地點信息,是您的智能出行指南!科技讓出行更簡單,人工智慧地圖全新升級,立即開啟你的簡單出行吧!
  • 百度地圖揭曉年度成績單 導航、智能首頁、熟路導航一圖搞定
    當導航已成為生活出行的日常操作,你是否期待地圖APP帶來更多驚喜和可能?12月29日,2020百度地圖生態大會順利舉辦,對外展示了全新升級的生態全景2.0,分享一年來功能創新與行業賦能的成果。憑藉業內首創的智能定位、精準規劃功能,百度地圖得以領跑於「精準導航」賽道,並依託AI化數據生產優勢持續保持領先身位,打造車道級導航功能。與只會提示轉向的傳統道路級導航相比,車道級導航採用「一圖到底」的界面形式,能在複雜路口、分叉口給予清晰的變道提示。當車輛接近路口時,百度地圖車道級導航便會自動觸發路口放大圖,並發出貼心語音導航播報,精細引導用戶駛入最佳車道。
  • 百度地圖智能化蛻變:AI技術如何讓導航更加準確、易用?
    當然,百度地圖也沒有把自己局限在導航指路等基礎功能上,而是要成為一個綜合性的「智能化位置服務平臺」。今年的新冠疫情來勢洶洶,在這場抗疫戰中,百度地圖作為「智能化位置服務平臺」,也發揮了重要作用。疫情期間,基於時空大數據及人工智慧技術,百度地圖推出了遷徙大數據平臺和實時路況平臺,為民眾日常出行、物資運送以及疫情防控決策提供重要的參考。
  • 誰說導航一定要用地圖?谷歌DeepMind的強化學習模型靠街景認路
    那會兒你可能還不知道什麼是地圖,也沒有導航軟體。但那條路的畫面都在腦子裡刻著。茂密的竹林,很多蛇出沒的小山丘,還有泥鰍抓不完的池塘。這就是我們從小對空間世界感知的途徑,通過路的特徵畫面構建地理認知。用戶只要給定起點終點的地理坐標,DeepMind就能結合谷歌地圖裡真實採集的街景數據,訓練出能根據地標畫面信息規劃出行路線的街景導航模型。出於保護隱私的考慮,街景中所有的人臉和車牌都會作打碼處理。
  • 用航拍和地面觀測數據,谷歌DeepMind AI可在陌生區域導航
    這就是谷歌母公司Alphabet旗下DeepMind的科學家們在預印本伺服器Arxiv.org上發表的一篇新論文《街道導航的跨視圖策略學習》中所做的研究。在論文中,他們描述了一個過程:藉助自上向下的視覺信息,將一個經過地面視圖語料庫訓練的人工智慧策略轉移到城市的目標區域。他們表示,這種方法可以產生更好的泛化效果。
  • 百度地圖創新打造「AI室內通」,逛商場也能精準定位導航
    VPAS技術通過基於圖像的大尺度SFM技術構建商場的高精幾何地圖,然後利用場景理解算法、3D視覺定位算法實時計算用戶的準確位置,在實際複雜環境的實測定位精度可達1米。用戶僅需進入AR實景導航,抬起手機掃描周圍實景即可快速獲得自己的精準定位,跟著穩定、流暢的導航到達目的地。(用戶點擊實景導航後,掃描實景可獲得定位)據了解,這一功能已率先在北京華潤五彩城上線。
  • 「中國北鬥+AI地圖」融合樣板:中國衛星導航年會舉行 百度地圖展現...
    伴隨著5G時代的到來和北鬥全球衛星導航系統星座部署的全面完成,地圖導航的位置精準度也得到了大幅提升。(百度地圖總經理季永志)依託以北鬥為代表的衛星定位能力,百度地圖將自身AI能力與大數據等技術優勢充分融合,以用戶體驗為中心,提供貫穿行前、行中、行後的全場景全流程精準導航服務
  • DeepMind新GNN模型,將谷歌地圖預估到達準確率提升50%!
    【新智元導讀】Google Maps是使用最廣泛的地圖app之一,其能預測交通情況的能力使其成為許多司機不可或缺的工具。近日,DeepMind宣布與其合作,幫助Google Maps變得更準確。你是不是也經歷過這樣的故事?
  • 「無衛星信號」也能導航?百度地圖智能定位給你「上才藝,展示」
    >無衛星信號或弱衛星信號環境下依然可以連貫導航,保證導航體驗及準確到達目的地。如何更智能率先支持並開放隧道內定位,提供自然連貫的導航體驗在用車場景中,例如網約車、物流運輸等行業,司機常會在駕車過程中遇到衛星信號弱,甚至沒有的情況,導致導航體驗不佳甚至無法導航,而這個問題一直是業內比較頭疼的事情。
  • 衛星導航年會舉行 百度地圖展示北鬥支撐下的服務新勢能
    伴隨著5G時代的到來和北鬥全球衛星導航系統星座部署的全面完成,地圖導航的位置精準度也得到了大幅提升。11月23日,以"衛星導航,全球新時代"為主題的第十一屆中國衛星導航年會(CSNC2020)在成都召開。
  • GPS技術及其在導航電子地圖中的應用
    GPS技術及其在導航電子地圖中的應用 南京師範大學地理科學 發表於 2009-11-23 10:02:23 GPS技術及其在導航電子地圖中的應用
  • 地圖導航領域大事件!百度地圖+北鬥打造極致精準導航體驗
    近日,北鬥全球衛星導航系統星座部署全面完成。7月1日,百度地圖App上線開屏祝賀海報,意味著「百度地圖+北鬥系統」將為用戶打造更加優質的精準導航體驗。依託北鬥衛星全球組網,百度地圖將充分發揮自身AI與大數據等技術優勢,以業界領先的精準導航技術服務更多領域,提升用戶的出行體驗。
  • 3D地圖導航:衛星地圖定位
    2020年全面建設完成,讓北鬥衛星地圖成為了一個熱門關鍵詞,越來越多的人在找北鬥實時高清衛星地圖,筆者想在這裡告訴大家,「北鬥衛星」只提供導航功能,沒有提供地圖功能!並且衛星地圖實時是不可能的,至於為什麼請見後文,另外附上獲得高清衛星地圖的方法:【http://www.bigemap.com/source/clause.html】本文概要:北鬥衛星導航系統提供衛星地圖嗎?如何通過免費途徑獲得超清衛星地圖?北鬥衛星導航系統提供衛星地圖嗎?答案是沒有!
  • 谷歌地圖開啟AR實景導航內測,落後百度地圖兩年
    在2018年的谷歌I/O開發者大會上,谷歌地圖曾經展示了AR實景導航功能。近日,該功能終於開始面向小範圍用戶內測。《華爾街日報》的大衛·皮爾斯參與了該功能的測試,他表示:「這是谷歌地圖朝著正確方向邁出的一大步。」
  • AR 實景導航+SLAM 技術,高德地圖新技術讓路痴不再迷路
    雙方合作的 AR 步行導航,將地圖、手機攝像頭與 AR 技術深度結合,由虛擬模型在真實世界中為用戶指引方向,何處直行何處轉彎,都非常直觀呈現,使用戶不再迷路。高德地圖相關產品負責人表示,「雙方合作推出的 AR 步行導航,通過開創性的技術創新,可幫助廣大用戶解決陌生環境下不辨東西南北、不清楚何時何處轉向、不確定是否到達目的地等問題,讓 『路痴』用戶不再迷路。」
  • 盯盯拍聯合高德、搜狗地圖,開啟AR導航新時代
    近日,盯盯拍聯合高德地圖、搜狗地圖發布全新AR導航解決方案,通過盯盯拍行車記錄儀與高德地圖、搜狗地圖進行互聯,可以為車主提供還原真實道路場景的AR實景導航服務,升級智慧出行新體驗!實景導航可以很好地解決這些問題,AR導航能夠直接將導航指引與現實道路場景結合,在過複雜路口時提供直觀3D導航指引,大幅降低用戶對傳統2D電子地圖的讀圖時間,更快更準確地做出判斷,避免走錯路的同時,也可提升駕駛安全。
  • 華為自研地圖App上線 未來或將登錄車載導航
    據悉目前華為已經在140多個國家和地區正式推送自家的Petal Map地圖,華為國外手機用戶也可以在AppGallery商店下載使用。華為自研地圖App上線據悉,Petal Maps 為用戶提供地圖定位、地圖展示、駕車導航、實時路況等服務,還首創全新的地圖交互方式,將 Mate 40 系列隔空操作功能運用到導航中,用戶駕車時手掌向屏幕方向按壓,導航路線視圖和地圖全覽界面就能自由切換。
  • 高德地圖手機AR導航再升級 用行車記錄儀當「眼鏡」
    但在9月初,奔馳全新S級發布後,其所搭載的抬頭顯示實景AR導航功能,憑藉著極佳的科技智能感受與實用性,驚豔了不少車迷朋友。事實上,對於高德這樣的專業地圖廠商來說,技術上實現AR實景導航功能並不難,但問題是,你與這項功能之間,還相差了一輛奔馳車的硬體設施。
  • 國內首個手機AR實景駕駛導航上線,能識別車輛行人,搜狗地圖出品
    視覺感知技術+導航傳統導航定位,是以GPS為主,並使用陀螺儀、加速度計等傳感器來提升精度。但在這種精度下,車道級定位目前在技術上是比較難以實現的。這也就是實際使用地圖軟體導航過程中,常常遇見的主輔路不分、轉彎路口指示不清晰等問題出現的原因。
  • 高德推出AR導航行業解決方案,讓行車記錄儀秒變「AR導航神器」
    8月14日,高德地圖宣布,推出AR導航行業解決方案,通過技術賦能,讓行車記錄儀秒變AR導航神器,為用戶帶來部分高端豪車才有的AR實景導航、碰撞預警等安全輔助、精細化導航等功能。   該解決方案讓行車記錄儀的攝像頭在駕駛場景中充當「眼睛」,記錄儀通過Wi-Fi與導航應用聯通,汽車中控屏作為視覺展示的終端。未來,不需要專門購買一輛支持AR導航的汽車,只需要有一款行車記錄儀,就能低成本地體驗AR導航帶來的駕駛樂趣。