誰說導航一定要用地圖?谷歌DeepMind的強化學習模型靠街景認路

2020-12-13 量子位

Root 編譯自 DeepMind量子位 出品 | 公眾號 QbitAI

還記得小時候從家到學校的那段路怎麼走嗎?

那會兒你可能還不知道什麼是地圖,也沒有導航軟體。但那條路的畫面都在腦子裡刻著。茂密的竹林,很多蛇出沒的小山丘,還有泥鰍抓不完的池塘。

這就是我們從小對空間世界感知的途徑,通過路的特徵畫面構建地理認知。

等到慢慢長大了,需要去更遙遠的地方,路上可參考的熟悉的地標越來少,尤其是新的城市時,才開始用起了地圖。

DeepMind團隊希望,造出一個深度強化學習模型,用符合我們直覺的空間認知方式——串聯所有街景畫面,重塑出行導航方式。

用戶只要給定起點終點的地理坐標,DeepMind就能結合谷歌地圖裡真實採集的街景數據,訓練出能根據地標畫面信息規劃出行路線的街景導航模型。

出於保護隱私的考慮,街景中所有的人臉和車牌都會作打碼處理。

比起現有的地圖導航,街景導航的最大優點是非常適合步行,這是因為步行對地理信息的精度要求更高。

像我們平時去一個地方,大方向上靠高德或百度地圖導航過去沒問題,但最後一公裡總是會被帶到各種溝裡去:不是此路不通,就是繞了一大圈。

街景導航的工作原理

傳統的地圖繪製,是讓人繪出路段的二維俯視圖,定位只能參考GPS信息。而街景的信息含量更大,更符合我們人置身環境所看到的視覺畫面。

基於這點,DeepMind構建了一個神經網絡,把倫敦、巴黎、紐約這些城市的谷歌街景數據,這些依託真實環境的信息作為輸入源,然後讓模型自行預測每一個可能的前行方向。採樣顆粒度可以達到每一個小道,十字路口,隧道,以及複雜的岔路。

當街景導航模型能順利規劃出前往目的地的路徑時,DeepMind會給予一定的獎勵。然後經過訓練之後,這個街景導航模型能夠逐漸熟悉整個城市的所有路段。

可遷移的模塊化的神經網絡架構

DeepMind所造的這個街景導航模型包含三個部分:

視覺處理網絡:一個可以處理圖像和提取視覺特徵的卷積神經網絡;視覺信息網絡:一個專門記憶特定城市街景的循環神經網絡,可以快速鎖定代表起點終點的實景環境;路線規劃網絡:與特定城市無關的循環神經網絡,專門負責制定出行路線。其中,第二個視覺信息循環神經網絡是可以替換的,不同的城市可以用不同的網絡。而視覺處理網絡和路線規劃網絡可適用於所有城市。

和城市導航CityNav模型(a)相比,多城市導航MultiCityNav模型是需要有一個針對特定城市路段信息的視覺信息模塊的,如圖(b)所示。多城市導航MultiCityNav架構的訓練過程可以從(c)看出,模型是怎麼適配其他城市信息以及遷移相應的路線規劃能力。

和谷歌街景交互界面相似,街景導航模型可以旋轉輸入信息的觀察視角,或選擇跳到下一個全景鏡頭。

不同的地方在於,街景模型看不到指示方向的箭頭,它需要自己根據畫面中的路徑延伸方向判斷出前行的幾種可能。

如果說目的地是在幾公裡以外的地方,那麼街景模型要自己把所有的全景鏡頭採下來的畫面信息裡的可能走法跑一遍,才能得出結論。

現在DeepMind已經證明了這種多城市街景模型可學習其他新城市的可行性。

作為人類來說,我們不希望這個AI拿到新城市的數據時又要再學一遍怎麼處理街景信息,比如放大某個可能的岔路口或者在十字路口轉彎等行為。不過花時間在提取新的地表特徵上是可以接受的。

這種方法,獲得新知識的同時也還記得之前所學過的東西,和DeepMind之前連續學習網絡Progressive neural network非常相似。

也許等到這個算法上線應用的時候,我們再也不會遇到跟著地圖導航走卻根本到不了地兒的囧事了。

— 完 —

相關焦點

  • DeepMind新GNN模型,將谷歌地圖預估到達準確率提升50%!
    例如,儘管上下班尖峰時間都會發生在早上、晚上,但具體的確切時間可能每天、每月都有很大差異;一條小巷的擁堵,就會蔓延到下一個大路——這一點,地圖往往無法實時監控;另外,道路質量、限速、事故和封路等因素,都會給預測模型帶來麻煩。
  • 沒有地圖也能導航:DeepMind展示全新AI導航技術
    近日,DeepMind 提出了一種端到端深度強化學習尋路方法,其訓練的神經網絡可以幫助汽車在沒有地圖的情況下正確前往目的地,這一研究或許可以幫助自動駕駛汽車技術向前邁進一大步。可能沒有地圖,只是簡單地記住街道的外觀、沿路的變向。隨著在附近街區的探索逐漸增多,你變得更加自信,開始學習新的、更複雜的路。有時你可能會迷路,但是在路標或者太陽(指南針)的幫助下你可以重新找到正確的路。導航是一項重要的認知任務,幫助人類和動物在沒有地圖的情況下穿過複雜世界中長長的路途。
  • 谷歌地圖重大升級 用深度學習實時更新街景
    每天,谷歌地圖都為成千上百萬的人們提供方位指示,實時路況信息以及商業信息。為了提供最佳的用戶體驗,地圖信息需要不斷的根據現實世界的變化做出調整。街景車每天收集數百萬張圖片,如果用人工分析每天超過800億張高清晰圖片來找出其中的新變化或者更新地圖信息,顯然是不可能的。
  • 谷歌地圖重大升級 街景居然能實時更新
    每天,谷歌地圖都為成千上百萬的人們提供方位指示,實時路況信息以及商業信息。為了提供最佳的用戶體驗,地圖信息需要不斷的根據現實世界的變化做出調整。街景車每天收集數百萬張圖片,如果用人工分析每天超過800億張高清晰圖片來找出其中的新變化或者更新地圖信息,顯然是不可能的。
  • 用航拍和地面觀測數據,谷歌DeepMind AI可在陌生區域導航
    這就是谷歌母公司Alphabet旗下DeepMind的科學家們在預印本伺服器Arxiv.org上發表的一篇新論文《街道導航的跨視圖策略學習》中所做的研究。在論文中,他們描述了一個過程:藉助自上向下的視覺信息,將一個經過地面視圖語料庫訓練的人工智慧策略轉移到城市的目標區域。他們表示,這種方法可以產生更好的泛化效果。
  • 史上最強VR應用《谷歌地球VR》加入街景導航,優化快速加載
    谷歌《地球VR》一如其名,能夠讓用戶在Oculus Rift和HTC Vive等VR頭顯上欣賞《谷歌地球》。通過谷歌拍攝的整個地球,3D渲染模型和海量360°場景,讓你沉浸在廣袤無垠的世界中。如今,谷歌升級了《地球VR》,加入了街景導航圖層,讓用戶像在電腦上使用平面谷歌地圖一樣輕易地從360°衛星視圖切換至360°地面全景。早在今年九月,谷歌就在《地球VR》中加入了街景圖層,用戶可以選擇並進入谷歌拍攝的全景街景。不過,之前的街景更像是街景瀏覽而不能實際操作。如今的升級版可以讓用戶真正在VR城市中任意切換位置。
  • SOSO街景地圖 實景地圖新體驗
    2007年,谷歌街景推出之後,其帶來了網際網路一種全新的地理位置搜索體驗。但是遺憾的是,谷歌街景卻沒有能夠支持中國大陸境內的街景,讓中國的街景迷們大失所望。12月26日,騰訊公司旗下SOSO地圖街景服務正式上線。這是中國第一家面向大眾的,同時提供國內地圖服務的街景地圖。SOSO街景地圖將為用戶提供城市街道的360度全景圖像,用戶可以通過該服務獲得如臨其境的地圖瀏覽體驗。
  • 谷歌地圖街景拍到的靈異圖片
    有年代的老房子裡,經常會發生一些恐怖的靈異現象,相信各位即便是沒有親身經歷過,也一定曾聽身邊朋友提到過,這種現象到底是心理作祟,還是真的有靈異現象發生呢
  • 彌補iOS不足 谷歌地圖網頁新增街景功能
    自從蘋果iOS「拋棄」了谷歌地圖後,谷歌與蘋果沒有硝煙的戰爭已經正式打響,當然目前用戶強力吐槽蘋果自家的地圖,而用戶對於谷歌地圖的擁護,谷歌暗自偷笑,看似是為了彌補iOS中地圖應用的不足,谷歌近期也宣布網頁版谷歌地圖將會在未來兩周內新增街景模式,如果用不慣蘋果地圖的iPhone用戶可以登錄網頁版的谷歌地圖查看所在地形。
  • 同屏競技誰更強 iOS谷歌地圖PK蘋果地圖
    因為不管是谷歌地圖,還是蘋果地圖,都沒有在中國進行測繪的資質,因此要想進入中國,必須購買中國本土圖商的地圖數據。也就是說你在蘋果和谷歌地圖上看到的數據都是來自國內廠商繪製。蘋果與本土地圖繪製廠商高德進行合作,在iOS6版的中國區地圖上採用了高德的地圖服務。同時谷歌地圖的底層地圖資料也是從高德獲取,而定位導航以及相關搜索服務則是由谷歌自己來完成。
  • 谷歌地圖獲得新的AR功能:將更好指出正確導航方向
    谷歌地圖獲得新的AR功能:將更好指出正確導航方向2019-05-09 09:56出處/作者:PConline 編譯整合編輯:慄子責任編輯:liwenjing1 [PConline 資訊]谷歌地圖正在研發一種新的增強現實功能,可以完全改變您使用該應用程式的導航方式。
  • 谷歌地圖開啟AR實景導航內測,落後百度地圖兩年
    在2018年的谷歌I/O開發者大會上,谷歌地圖曾經展示了AR實景導航功能。近日,該功能終於開始面向小範圍用戶內測。《華爾街日報》的大衛·皮爾斯參與了該功能的測試,他表示:「這是谷歌地圖朝著正確方向邁出的一大步。」
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    Deepmind最初由三名科學家聯合創辦,就像其創始人兼CEO哈薩比斯(Demis Hassabis)所說的,它的性質更像一個科技研究院而不是創業公司,因為公司一開始並沒有任何產品,而是一直在通過遊戲來研究人工智慧算法。在被谷歌收購前,Deepmind通過人工智慧的無監督學習算法打爆了57個atari遊戲,即八九十年代國內也很流行的小霸王卡帶遊戲。
  • DeepMind綜述深度強化學習中的快與慢,智能體應該像人一樣學習
    不過雖然它們很強大,但學習效率的低下讓它們很難推廣到更普遍的任務,也許結合「快」與「慢」的學習才是強化學習應該走的路。DeepMind 研究者近期在 Trends In Cognitive Sciences 期刊上發表文章,概覽了深度強化學習中的一些新技術,這些技術旨在彌補強化學習智能體與人類之間的學習速度鴻溝。
  • 過度依賴智能地圖導航 大腦可能會退化
    有的人可能更關注地標,有的人更注重腦海中的整體鳥瞰圖,但一般來說,當我們需要從一個地方到另一個地方的時候,我們都會依靠這三類信息來認路。   但谷歌地圖、Waze和其他類似的虛擬導航工具改變了這一切。   哈佛大學醫學院博士後Louisa Dahmani研究過GPS如何影響人類的導航技能,他表示:「有了GPS,我們不再需要關注周圍的環境了。
  • 谷歌街景地圖上線 逛Moto X美國工廠
    如果你是一個手機控,那你一定想看看生產手機的工廠是什麼樣子。日前,谷歌在街景地圖中,就將Moto X的美國工廠收錄了進去。谷歌街景地圖上線 逛Moto X美國工廠(圖片來自谷歌街景地圖截圖)    在谷歌街景頁面上,我們可以對工廠車間有一個全面的了解
  • 有多少人被谷歌街景地圖「偷拍」過?
    當他正使用谷歌街景地圖瀏覽利馬的街景時,看著眼前的圖片,一股悲傷忽然湧上心頭,兩眼逐漸泛著淚光,透過屏幕的反射,他似乎看到了一定碩大綠色帽子正漂浮在自己的頭頂。地圖中,妻子正在和另一位男士愜意的享受著下午茶時光。平時脾氣暴躁的妻子,在這個男人的面前,看著卻是近乎極致的溫柔,互相撫摸著對方,這叫曼裡克怎能不氣。
  • 谷歌DeepMind 的可微分神經計算機 DNC 怎麼樣?看 Facebook AI...
    近日,谷歌的 AI 部門 DeepMind 開發了一種叫做可微分神經計算機(DNC)的神經網絡模型,相關論文發表於 10 月 12 日在線出版的《自然》雜誌上,題為《 利用神經網絡與外部動態存儲器進行混合計算》。這種新模型將神經網絡與可讀寫的外部存儲器結合,既能像神經網絡那樣通過試錯和樣本訓練進行深度學習,又能像傳統計算機一樣處理數據。
  • 被「街景地圖」綠了?男子查看街景地圖,發現妻子多出軌線索
    | 01現在生活中,我們越來越離不開一項科技,那就是衛星地圖,而衛星地圖用處最大的自然就是導航了。然而,今天衛星地圖被人們玩出了新技巧。這其中最引人關注的自然是對馬航MH370的搜尋工作了。然而,今日有一名男子在利用谷歌地圖規劃出行路線時,打開了街景地圖模式,而正是這一操作,讓他發現了妻子隱藏多年的秘密——妻子早在5年前就出軌他人,而地圖上的照片就是鐵證。
  • 過度依賴智能地圖導航,大腦可能會退化
    你越使用數字設備導航,你自己辨認方向和認路的能力就越差。 注意力減弱的最典型案例也許就體現在我們的導航技能上。GPS和谷歌地圖正在削弱人類自身的導航能力,而原本我們可以自己使用紙質地圖,或者通過其他人的指示來完成出行。