重慶大學研發定位與建圖技術,可讓機器人視覺更智能

2021-01-07 DeepTech深科技

將一個機器人隨機放入未知環境中,是否有辦法讓機器人一邊移動一邊確定自己的位置並構建該環境的地圖?近日,由重慶大學王科副教授帶領的團隊的論文 SBAS:Salient Bundle Adjustment for Visual SLAM,將顯著性預測模型應用於 SLAM 框架中去,模擬人類執行這一任務的過程,有效提升了機器人定位及建圖的準確性和魯棒性。

1. 什麼是 SLAM?

SLAM 的全稱是 Simultaneous Localization And Mapping,即同時定位與建圖。

通俗來說,該技術希望搭載特定傳感器的機器人在未知的環境中,通過不斷的運動提取環境中的特徵如牆角、柱子等來估計自身的位置,並同時根據傳感器觀測到的數據建立環境的地圖,從而達到同時定位和地圖構建的目的。

通常情況下,基於幾何的方法的 SLAM 技術可以分為兩類:特徵法和直接法。

特徵法通過提取和匹配圖像中的關鍵點通過最小化重投影誤差來估計相機的姿態,而直接法則直接利用圖像中的像素強度通過最小化光度誤差來估計相機的姿態。目前,該領域已經有了一些較為出色的算法模型。

MonoSLAM 是第一個使用擴展卡爾曼濾波(EKF)和 Shi-Tomasi 角點的實時視覺 SLAM 系統。該方法簡化了 SLAM 對硬體的要求,並可以被應用於仿人機器人實時 3D 定位和建圖以及手持相機的在線增強現實。

PTAM 是最早提出將 Track 和 Map 分開作為兩個線程的一種 SLAM 算法,也是一種基於關鍵幀的單目視覺 SLAM 算法。採用非線性優化方法代替基於濾波器的方法作為後端優化方法,PTAM 提出並實現了跟蹤映射過程的並行化。

直接法不提取特徵點,而是利用像素強度通過最小化光度誤差來估計攝像機的姿態。基於直接法的 SLAM 模型如下:

DTAM 是第一個使用直接方法生成密集三維地圖的系統。然而,它需要商用 GPU 來執行複雜的計算。為了提高效率,SVO 提取 FAST 特徵,然後利用直接法的方式來估計攝像機的姿態和三維結構。

LSD-SLAM 擴展了這項工作,並且可以在大比例尺環境下生成半密集地圖。同時能夠將三維環境地圖實時重構為關鍵幀的姿態圖和對應的半稠密的深度圖。

除了基於幾何的方法的 SLAM 外,基於深度學習的 SLAM 憑藉神經網絡強大的學習能力也取得了很大的進步。PoseNet 是最早使用 CNN 端到端估計相機姿態的方法之一。Deep VO 使用 RNN 來建模運動動力學和圖像序列之間的關係,ESP-VO 在此基礎上增加了位姿估計的不確定性估計。

2. 基於顯著性模型的 SLAM 框架

圖 | 框架總覽

為更好地解決現有 SLAM 框架的問題,作者提出了一個適用於室內和室外環境的 SLAM 框架,它可以應用於各種場景,具有較好的魯棒性和準確性。

上圖為整體框架的簡化說明,它包括兩個組件:基於幾何法的 SLAM 管道和基於深度學習的顯著性預測模塊。顯著性預測模塊生成與 SLAM 數據集相對應的顯著性圖。然後,將顯著性圖作為輸入,幫助 SLAM 選擇顯著的特徵點,以提高定位的準確性和魯棒性。

視覺顯著性是指模仿人類視覺系統,從自然場景中選擇出最顯著、最感興趣的區域或點,以便在不同的任務下進行進一步的處理。近年來,有許多基於深度學習的方法來預測自然場景中的顯著性區域,並取得了很好的效果。然而,這些顯著性預測方法並不能完全描述 SLAM 系統應該關注的特徵,原因是這些方法只使用原始的人類注視信息,例如,在駕駛車輛行駛的過程中,人類的注視通常停留在車輛前方的道路上,因為這是車輛行駛的地方。但是,這還不夠,因為 SLAM/VO 還需要聚焦在遠離圖像中心的區域,所以僅僅依靠人眼眼動跟蹤器獲得的凝視數據,並不能幫助 SLAM 系統捕捉所有這些重要線索。

為解決這一問題,作者通過結合幾何信息和語義信息,在 KITTI 數據集的基礎上,構造一個顯著性數據集 Salient-KITTI 來訓練顯著性模型,用語義注視代替人類注視。具體來說,作者首先提取圖像幾何信息如特徵點、線和平面等。然後使用語義分割網絡 SDC Net 在感興趣對象周圍生成分割掩碼。

然後,作者選取了 13 個類別作為 SLAM 應該重點關注的對象(紅綠燈、交通標誌、道路、建築物、人行道、停車場、軌道、圍欄、橋梁、電線桿、杆群、植被、地形)來過濾幾何信息,因為這些類別中的區域通常包含顯著的、穩定和魯棒的特徵。如下圖,其顯示了語義注視和人類注視地面真值的比較。

最後,基於該顯著性數據集,作者使用 DI-Net 獲得顯著性模型,並用它來預測初始顯著性圖,隨後根據圖像的深度信息得到最終的顯著性圖。

為了驗證顯著性模型的可行性,作者做了三個實驗:

a) 1、顯著性模型的有效性驗證。使用分別在 Saleint-KITTI 數據集和 SALICON 數據集上訓練的顯著性模型,驗證所提出的顯著性模型相對於其它顯著性模型的有效性。

圖 | SALICON 和 KITTI 數據集訓練的顯著性模型的比較

結果顯示,對於基於 SALICON 數據集訓練的模型,當圖像中沒有顯著對象時,注意力集中在圖像的中心,從而忽略了其他重要信息,即我們所說的存在中心偏差。相反,在 Salient-KITTI 數據集上訓練的模型可成功地捕捉到這些重要信息。此外,該模型還可以減少動態對象的影響,因此具有顯著性值高的點通常是更穩定和魯棒的點。

2、基於 KITTI 數據集的室外場景驗證。在單目和立體視覺配置中,作者提出的系統比 ORB-SLAM3 更精確,因為 SBA 使顯著特徵點充分發揮其作用。同時,本實驗也證明利用顯著圖可以使算法在姿態估計方面有更多的優勢,具體效果如下圖所示。

3、基於 EuRoc 數據集的室內場景驗證。在第三個實驗中,作者將算法與其他最先進的算法進行了比較,如 ORB-SLAM、DSM、DSO、突出 DSO 和 ORB-SLAM3。

結果顯示,在大多數序列中,作者提出的模型在室內和室外環境下都能很好地工作,同時也比文獻中的最新技術獲得更精確的結果。

王科表示,該研究不僅僅針對自動駕駛,基於圖像處理的都可以用,它是一個基礎的算法,而非純應用的提升,只不過最初是在自動駕駛平臺做起來的。

而隨著 SLAM 技術的不斷發展,它們將被應用到越來越多的領域中,小到掃地機器人,大到無人駕駛技術、AR、VR 等,未來將為人類生活帶來極大的便利。

相關焦點

  • 即時定位與地圖構建技術讓機器人也能認路
    SLAM (simultaneous localization and mapping),也稱為CML (Concurrent Mapping and Localization), 即時定位與地圖構建,或並發建圖與定位。問題可以描述為:將一個機器人放入未知環境中的未知位置,是否有辦法讓機器人一邊逐步描繪出此環境完全的地圖,同時一邊決定機器人應該往哪個方向行進。
  • 移動機器人的幾種視覺算法 | 雷鋒網公開課
    它們能和人一樣能夠在特定的環境下自由行走/飛行,都依賴於各自的定位導航、路徑規劃以及避障等功能,而視覺算法則是實現這些功能關鍵技術。雷鋒網雷鋒網(公眾號:雷鋒網)雷鋒網如果對移動機器人視覺算法進行拆解,你就會發現獲取物體深度信息、定位導航以及壁障等都是基於不同的視覺算法,本期硬創公開就帶大家聊一聊幾種不同但又必不可少的視覺算法組成。
  • 掃地機器人哪個牌子好?五款高端智能掃地機推薦
    Uoni由利掃地機器人日本Uoni由利在智能清潔機器人領域已經深耕已久,它擁有一定的技術積澱,今年11月獲得了梅花創投數千萬投資,有充足的研發經費在背後做支撐,旗下的清潔家電性能在不斷進行技術升級後表現出色,在家電市場已經佔有一定的份額。
  • 上海交大研發超視覺垃圾分揀機器人—新聞—科學網
    這裡沒有身穿厚重工作服帶著手套、口罩,埋頭分垃圾的工人,取而代之的是不停往返的機械手以及穿插有序的輸送軌道——上海交大中英國際低碳學院固體廢棄物資源化技術與智能裝備團隊研發的超視覺垃圾分揀機器人正在工作。
  • 3D雙目立體視覺在機器人視覺的應用
    隨著自動化程度越來越高,機器視覺扮演著越來越重要的角色,傳統的2D定位無法解決產品的空間坐標信息,而3D雙目立體視覺可提供較高精度的定位。在汽車行業,汽車後底板的抓取搬運主要交給工業機器人完成,這面臨一大難題:每一塊後底板的平面坐標XYR和空間坐標ZWP都相差較大,而機器人夾具的兩個尖削必須精確的插入後底板兩孔位,才能進行搬運。
  • 曠視談移動機器人的未來:單體智能+群體智能,助力企業降本增效
    2020年初,機器人產品部獨立成為曠視的產品中臺之一,專注於機器人產品和關鍵物流裝備的研發。在2021年到來之際,曠視高級副總裁兼機器人產品部總經理王宏玉、曠視機器人產品部研發總監陶濤發表署名文章,分享了他們對移動機器人技術趨勢的觀點。
  • 曠視談移動機器人未來技術趨勢——單體智能與群體智能
    作為全球領先的人工智慧產品和解決方案公司,曠視進入供應鏈物聯網領域後便聚焦智慧物流及工業機器人業務,2020年初,機器人產品部更是獨立成為曠視的產品中臺之一,專注於機器人產品和關鍵物流設備的研發。進入智能製造、智慧物流的新時代,未來的移動機器人又有哪些發展趨勢?
  • 最強戰隊 | 三維視覺、SLAM方向全球頂尖實驗室匯總
    實驗室致力於定位和建圖,可穿戴和輔助計算,語義視覺,增強現實,人體運動分析和導航的應用程式。實驗室旨在創造能夠在複雜多樣的環境中自主運行的機器人和智能系統。設計機電和控制系統,使機器人可以自主適應不同的情況,並應對不確定和動態的日常環境。機器人可以在地面,空中和水中運動,同時具備在複雜環境下自主導航的功能,研究出了包括用於感知,抽象,建圖和路徑規劃的方法和工具。他們還在tango項目上與谷歌合作,負責視覺慣導的裡程計,基於視覺的定位和深度重建算法。
  • 五款智能水平較高的掃地機器人,哪一款性能最好?
    智能時代的到來,催生了很多智能產品,包括很多智能家電,最受到人們歡迎的當然就是智能掃地機器人了,市面上的智能掃地機器人品牌越來越多,那麼掃地機器人什麼牌子最好呢?下面要跟大家推薦一下五個掃地機器人智能水平較高的品牌,方便大家選購。Uoni由利掃地機器人
  • 移動機器人AGV的5種定位技術,你都知道嗎?
    一大批世界著名的公司開始研製移動機器人平臺,這些移動機器人主要作為大學實驗室及研究機構的移動機器人實驗平臺,從而促進了移動機器人學多種研究方向的出現。   移動機器人目前已經遍布軍事、工業、民用等各大領域,並還在不斷的發展中,目前移動機器人技術已獲得了可喜的進展,研究成果令人鼓舞,但對於實際中的應用需求還需要長時間的發展,相信隨著傳感技術、智能技術和計算技術等的不斷提高,智能移動機器人一定能夠在生產和生活中扮演人的角色。那麼移動機器人定位技術主要涉及到哪些呢?經總結目前移動機器人主要有這5大定位技術。
  • 視覺導航+TOF技術才是未來全球掃地機器人...
    ,作為目前比較主流的兩種導航方式到底哪一種與之結合才能夠實現更加智能的清潔方式等問題不絕於耳,其實,米家掃拖機器人1T的上市就已經給出了答案,TOF技術應用於視覺導航版的掃地機上才是未來智能掃地機的新趨勢,接下來就針對此問題和大家一探究竟。
  • 智能時代來臨,重慶躍動網絡8圈智慧機器人正式發布
    以網際網路、大數據、人工智慧等為代表的現代信息技術日新月異,「高大上」的智能技術,運用到社會生活各個領域,智能化時代已經開啟……2019年9月27日,重慶躍動網絡技術有限公司在重慶萬豪酒店隆重舉行——「躍新越異·智慧場所」8圈機器人發布會。
  • 建圖更精 掃拖隨心 科沃斯DG3掃地機器人評測
    科沃斯地寶DG3掃地機器人  而今天筆者為大家帶來的是科沃斯地寶DG3掃地機器人,這是科沃斯2017年推出的高端地寶產品,智能程度更高、清潔實力更強。通過APP可實現①想掃哪間掃哪間②想掃哪裡掃哪裡③哪裡不掃也由你的智能清潔,具體使用如何,讓我們拭目以待。
  • ...機器人產業發展報告權威發布,智能技術比肩歐美(2萬字,57PDF)
    隨著標準化結構、集成一體化關節、靈活人機互動等技術的完善,工業機器人的易用性與穩定性不斷提升,與人協同工作愈發受到重視,成為重點研發和突破的領域,人機融合成為工業機器人研發過程中的核心理念。目前推出的部分人機互動機器人已能夠像人類一樣主動適應現實環境的不斷變化,並快速改變應用,以更安全、更精準、更靈活的方式工作。  競爭力大幅提升助力應用領域快速拓展。
  • 自主研發高精度定位視覺傳感器,「Camsense歡創科技」獲灃揚資本及...
    本輪資金將主要投入產品研發與產線建設,加速海外戰略布局。歡創科技成立於2014年,是一家視覺空間定位技術方案的研發和生產商,通過自主研發核心算法和晶片,為客戶提供高精度定位傳感器產品。應用場景在消費級機器人、工業檢測、醫療手術等領域。雷射雷達,也就是傳感器,是機器人感知系統的核心技術之一,在定位、導航、測距等方面發揮重要作用。
  • 樂聚機器人、獵戶星空、擎朗智能、高仙機器人獲2019 AI+機器人...
    在成立不到3年的時間裡,已經搭建起了行業領先的全鏈條AI技術體系,集合了晶片+算法(腦)、全感知視覺識別(眼)、語音全鏈條技術(口)、麥克風陣列(耳)、七軸消費級機械臂(手)和室內自主導航平臺(腿)。公司的室內無人配送機器人採用自主研發的「複合型定位導航技術」,融合深度視覺、有陀螺儀、加速度傳感器、編碼器、超聲、紅外等一系列傳感器。在自主導航方案,能實現複雜環境下穩定可靠的運行;避障方案上,可以智能判斷是靜態障礙物,還是來回走動的行人,並實現毫秒級的響應。
  • 倍加福推出了最新一代VOS智能視覺傳感器
    定位、導航、分揀……移動機器人各項功能的實現可以說都離不開傳感器的作用,而伴隨著移動機器人應用領域的不斷擴展,其面臨的環境也更加複雜多樣,與此同時對於傳感器的要求也在不斷提高。在導航領域,倍加福的R2000系列雷射傳感器一直保持著較高的市場佔有率,倍加福R2000系列雷射掃描儀,可自行360度全方位探測現場地形,從而自動識別定位建圖,避障,規劃運行路線,幫助用戶企業提升自動化水平,減輕人的勞動強度,提高生產效率,縮短物流周期。
  • 火眼金睛識別垃圾,交大團隊研發超視覺垃圾分揀機器人
    打破了國外技術壟斷,每小時分揀垃圾5400次。上海交大中英國際低碳學院固體廢棄物資源化技術與智能裝備團隊研發了一款超視覺垃圾分揀機器人,可以快速在大量垃圾中精準識別可回收物,大大節約人力成本,讓垃圾分類工作變得輕鬆。
  • 一文看懂SLAM導航技術分類、典型應用及國內發展現狀
    SLAM是Simultaneous localization and mapping縮寫,意為「同步定位與建圖」,主要用於解決機器人在未知環境運動時的定位與地圖構建問題。例如,應用了基於雷射雷達技術Google無人駕駛車以及牛津大學MobileRoboticsGroup11年改裝的無人駕駛汽車野貓(Wildcat)均已成功路測。SLAM系統構成SLAM系統一般分為五個模塊,包括傳感器數據、視覺裡程計、後端、建圖及迴環檢測。
  • 視覺SLAM技術以及其應用詳解
    智慧機器人技術在世界範圍內得到了大力發展。在SLAM中的Bundle Adjustment常常以圖的形式給出,所以研究者亦稱之為圖優化方法(Graph Optimization)。圖優化可以直觀地表示優化問題,可利用稀疏代數進行快速的求解,表達迴環也十分的方便,因而成為現今視覺SLAM中主流的優化方法。