一種通過分析圖像來估計物體表面觸覺特性的模型

2020-12-20 AI工程學習
物質示例和推理框架

對機器人來說,估算物體物理屬性的能力至關重要,因為這能讓它們更有效地與周圍環境互動。近年來,許多機器人研究人員一直在努力開發技術,使機器人能夠評估物體或表面的觸覺屬性,這最終可能為它們提供類似於人類觸覺的技能。

羅格斯大學(Rutgers University)專攻計算機視覺和人工智慧的博士生馬修·普裡(Matthew Purri)在之前研究的基礎上,最近開發了一種基於卷積神經網絡(convolutional neural network, CNN)的模型,可以通過分析物體表面的圖像來估計物體表面的觸覺屬性。普裡的新論文在arXiv上預先發表,由羅格斯大學電氣工程教授克裡斯汀·達納(Kristin Dana)指導。

Purri告訴TechXplore:「我之前的研究是關於從衛星圖像中分割細粒物質。」「衛星圖像序列以不同的視角、光照角度和多光譜信息的形式提供了關於場景的豐富物質信息。我們從之前的工作中了解到多視圖信息對於識別材料是多麼有價值,我們相信這些信息可以作為物理表面屬性估計問題的線索。」達娜和羅格斯大學的其他研究人員此前曾試圖開發一種技術,通過反射盤圖像來估計表面的摩擦係數;一種特定類型的圖像,顯示有多少表面或材料能夠反射輻射能。在他的論文中,Purri著手進一步開發這種方法,以便從RGB圖像中估計更多的物理特性。

「這個新項目的目標是僅從視覺信息來估計表面的許多物理屬性,如摩擦力和順應性,」Purri解釋說。「我們與SynTouch公司合作,該公司開發了一種名為Toccare的觸覺傳感器,可以測量表面的各種觸覺物理特性。」在我們的arXiv論文中,我們探索了從一幅圖像和多幅圖像中估計這些屬性的可能性。」

Purri和Dana在他們的研究中探索的另一個問題是,不同輸入圖像拍攝的角度是否會影響他們的神經網絡對地表物理性質的評估。然而,研究人員沒有手動選擇不同的觀察角度,而是設計了一個可以自動學習最佳觀察角度組合以及理想的神經網絡參數的模型。研究人員提出的跨模態框架綜述。資料來源:Purri & Dana公司。「我們的模型的一個目標是學習一個函數,該函數將一個表面的圖像(視覺信息)和觸覺的物理屬性信息分別投射到一個共享的子空間中,在這個子空間中,視覺-觸覺信息的對是接近的,而不同的視覺-觸覺對則相距很遠,」Purri說。「為了實現這個目標,如果單獨投射的視覺-觸覺對在子空間中相距很遠,那麼模型就會受到懲罰。」

達娜和羅格斯大學的其他研究人員此前曾試圖開發一種技術,通過反射盤圖像來估計表面的摩擦係數;一種特定類型的圖像,顯示有多少表面或材料能夠反射輻射能。在他的論文中,Purri著手進一步開發這種方法,以便從RGB圖像中估計更多的物理特性。「這個新項目的目標是僅從視覺信息來估計表面的許多物理屬性,如摩擦力和順應性,」Purri解釋說。「我們與SynTouch公司合作,該公司開發了一種名為Toccare的觸覺傳感器,可以測量表面的各種觸覺物理特性。」在我們的arXiv論文中,我們探索了從一幅圖像和多幅圖像中估計這些屬性的可能性。」Purri和Dana在他們的研究中探索的另一個問題是,不同輸入圖像拍攝的角度是否會影響他們的神經網絡對地表物理性質的評估。然而,研究人員沒有手動選擇不同的觀察角度,而是設計了一個可以自動學習最佳觀察角度組合以及理想的神經網絡參數的模型。

研究人員提出的跨模態框架綜述。

「我們的模型的一個目標是學習一個函數,該函數將一個表面的圖像(視覺信息)和觸覺的物理屬性信息分別投射到一個共享的子空間中,在這個子空間中,視覺-觸覺信息的對是接近的,而不同的視覺-觸覺對則相距很遠,」Purri說。「為了實現這個目標,如果單獨投射的視覺-觸覺對在子空間中相距很遠,那麼模型就會受到懲罰。」

這項由Purri和Dana設計的技術還試圖根據一個輔助分類目標,識別與其他對具有相似視覺和觸覺屬性的視覺-觸覺對。然後通過一個稱為視覺-觸覺特徵聚類的過程生成新的分類標籤。

「我們的模型的另一個目標是通過視覺信息來估計物理特性,」Purri說。聯合學習函數接收投影的視覺信息,並估計一個或多個物理特性。我們通過在模型的這一部分中加入一個對抗性目標來提高估計性能。物理屬性估計值結合輸入的視覺信息本質上欺騙了判別函數,使其認為這是一個真實的物理屬性值。」

Purri和Dana在一系列實驗中評估了他們基於cnn的模型,用於估計表面的物理屬性,並發現該模型表現得非常好。事實上,僅僅通過分析物體表面的圖像,他們的模型就能夠識別出物體的許多物理特性。

研究人員設計的新模型可能會有許多有趣的應用。首先,它可以讓機器人系統更好地理解物體和物體表面在其周圍環境中的關鍵特徵,讓它們更有效地與物體和物體表面互動,更輕鬆地在新環境中導航。

此外,研究人員還介紹了一種自動計算最佳圖像角度組合的方法,用於訓練模型來估計物體的物理屬性。在未來,他們所確定的最佳組合可以為傳感器的設計提供信息,這些傳感器是為特定的任務量身定做的,比如工廠的質量控制。

「在我們研究的第一階段,我們已經展示了如何從視覺信息中很好地學習物理特性,」Purri補充說。「我們的下一個目標將是利用我們獲得的洞察力來提高模型在涉及精確對象操作的任務中的性能。」

相關焦點

  • MIT新研究:機器人可以通過視覺和觸覺感知物體
    6月18日消息,日前,麻省理工學院計算機科學與人工智慧實驗室(CSAIL)的研究人員提出了一種預測性人工智慧,它可以通過視覺和觸覺來感知物體。該團隊的系統可以從視覺輸入創建逼真的觸覺信號,並從這些觸覺輸入中預測哪些物體和哪些部分被觸摸。
  • 一種基於深度學習的視覺觸覺感知方法
    圖為研究人員介紹的基於視覺的觸覺感知策略為了有效地與周圍環境互動,機器人應該能夠像人類一樣,通過觸摸來識別不同物體的特徵。這將使他們能夠更有效地抓住和管理物體,利用傳感器收集的反饋來調整他們的抓取和操作策略。考慮到這一點,世界各地的研究小組一直在努力開發技術,通過分析傳感器收集的數據,賦予機器人觸覺,其中許多數據是基於深度學習架構的使用。雖然其中一些方法很有前途,但它們通常需要大量的訓練數據,而且並不總是能夠很好地泛化以前不可見的對象。
  • 不再只靠視覺和觸覺,機器人用「耳朵」聽來區分不同物體
    人們很少只用一種感覺來理解世界,但機器人通常只依靠視覺,並且越來越多地依靠觸覺。近年來,研究人員開發了越來越多的計算技術,使機器人具有類似人類的能力。然而,到目前為止發展起來的大多數技術僅僅注重於人為地再現視覺和觸覺,而忽略了其它的感覺,如聽覺。現在,卡耐基梅隆大學的研究人員發現,機器人的感知能力可以通過增加另一種感官來顯著提高:聽覺。卡內基梅隆大學(CMU)的一個研究小組最近進行了一項研究,探索利用聲音開發具有更先進傳感能力的機器人的可能性。
  • 機器人也能「甩筆」,擁有觸覺分析能力!
    下圖為機器人觸覺分析的流程通過握著物體旋轉一定角度和抖動物體來感知物理特性,從而推斷出最佳的控制策略實現甩筆。 基於多種觸覺探索動作的物理特性分析能力 人類可以通過多種觸覺探索動作(觸摸、甩、掂量)來概括手上物體的物理特性
  • 機器人也將擁有和人類一樣的觸覺分析能力?
    來源 iros2020.org (http://iros2020.org/)   下圖為機器人觸覺分析的流程通過握著物體旋轉一定角度和抖動物體來感知物理特性,從而推斷出最佳的控制策略實現甩筆。   區別於傳統觸覺傳感器依賴於稀疏的電極陣列(基於電阻 / 電容 ),GelSight 是一個基於光學的觸覺傳感器,通過一個微型相機來拍攝接觸面的三維幾何形變,可以返回高精度的觸覺信息(見下圖是 GelSight 重建的奧利奧餅乾表面)。
  • MIT最新AI研究,讓機器人利用觸覺感知物體
    【獵雲網(微信號:)】6月17日報導(編譯:胖虎)麻省理工學院計算機科學及人工智慧實驗室(CSAIL)的研究人員表示,在不久的將來,機器人將能夠通過觸覺來感知物體。一篇最新的相關論文將於下周在加利福尼亞長灘市的計算機視覺與模式識別會議上公開,這篇論文描述了一種人工智慧系統,它可以通過觸覺信號生成觸摸物的視覺形象,還能根據視覺數據來預測物體的觸感。「通過觀察物體的表面,我們的模型可以預測某個平面或稜角的觸感。通過觸摸物體,我們的人工智慧模型可以根據觸感來構建感知到的環境。
  • 機器人與觸覺傳感技術的碰撞,一文初探人類與機器人的觸覺傳感
    目前針對觸覺感知的研究主要包括物體識別、形狀識別、姿態識別、感知融合等。[物體識別]物體表面的材料特性是機器人與周圍環境進行有效交互所需要的最重要的信息之一。視覺(Vision)一直是識別物體材料最常用的方法。然而,光憑視覺只能識別出一種已知的表面材料,而不能估計其物理參數。在這方面,必須引入觸覺來判斷材料特性。
  • 機器人也能「甩筆」,擁有觸覺分析能力,上交&MIT獲IROS 2020最佳...
    機器之心發布機器之心編輯部人類善於利用手指觸覺來感知物體的物理特性(包括質量、重心、轉動慣量、表面摩擦等),從而完成高難度的控制任務。在不遠的將來,機器人也會擁有觸覺分析能力。
  • 機器人也能甩筆,擁有觸覺分析能力,上交獲IROS 最佳論文獎
    機器之心發布機器之心編輯部人類善於利用手指觸覺來感知物體的物理特性(包括質量、重心、轉動慣量、表面摩擦等),從而完成高難度的控制任務。在不遠的將來,機器人也會擁有觸覺分析能力。來源 iros2020.org (http://iros2020.org/)下圖為機器人觸覺分析的流程通過握著物體旋轉一定角度和抖動物體來感知物理特性,從而推斷出最佳的控制策略實現甩筆。該項目通過對多種觸覺探索動作的信息融合,讓機器人端到端的去學習概括手中物體的物理特性,並依靠這個物理特徵來實現高難度的手上控制任務(in-hand swing-up)。
  • 圖像的本徵分解模型簡介
    公元10世紀,光學領域著名學者埃及物理學家阿爾哈曾(Alhazen)曾指出:「人的眼睛能夠感知到的只是光的強度和顏色,其他信息都是通過洞察、推理、識別等方法來獲取的」(Nothing of what is visible,apart from light and color,can be perceived
  • 機器人有「觸覺」了!上交&MIT發明一款機器人,拿起筆就能甩
    它將這根筆由下到上翻轉了 180 度,這真的不是研究人員給它 「餵」 了大量的數據才建立的模型,這是它通過自我採集觸覺數據並學習分析後的結果。「我們在思考怎樣才能讓機器人通過簡單的動作去感知手上握有物體的物理特性,比如物體的質量、重心,物體表面的摩擦力等,」 王辰告訴 DeepTech。
  • 機器人有 「觸覺」 了!上交&MIT發明一款機器人,自己拿起筆就能甩|...
    它將這根筆由下到上翻轉了 180 度,這真的不是研究人員給它 「餵」 了大量的數據才建立的模型,這是它通過自我採集觸覺數據並學習分析後的結果。    「我們在思考怎樣才能讓機器人通過簡單的動作去感知手上握有物體的物理特性,比如物體的質量、重心,物體表面的摩擦力等,」 王辰告訴 DeepTech。
  • 一個算法讓機器人依靠觸覺實現多個控制任務
    傳感器由一種可變形的彈性體凝膠組成,有三個彩色 LED 背光,並在凝膠表面提供高解析度 RGB 接觸圖像。與其他傳感器相比,這種觸覺傳感器以豐富的視覺信息的形式自然地提供幾何信息,從而可以推斷出力等屬性。使用類似傳感器的先前工作已經利用這種觸覺傳感器來完成諸如學習如何抓取的任務,提高了抓取各種物品的成功率。
  • 用層進表面預測來重建三維物體 | 2分鐘讀論文
    雷鋒網(公眾號:雷鋒網)AI研習社【本期論文】Hierarchical Surface Prediction for 3D Object Reconstruction用層進表面預測來重建三維物體伯克利人工智慧研究中心的Christian Häne等人發表一篇論文 Hierarchical Surface Prediction for 3D Object Reconstruction,論文中他們討論如何從單張色彩圖像重建出高質量的3D幾何結構,就像下面這幅圖所顯示的。
  • 論文推薦 | 如何通過2D圖像或視頻,推出三維模型?
    她的論文《獅子、老虎、熊:從圖像中捕捉非剛性的3D立體形狀》、《SfSNet :「在自然情況下」學習臉部形狀、反射比、照明度》都被收錄在CVPR 2018。一直以來,Angjoo的研究重點都是包括人類在內的動物單視圖三維重建。比如,我們如何能夠通過觀察2D圖像或視頻,來推出三維模型?
  • DIGIT:一種高解析度的觸覺傳感器,用於提高機器人手部操作技能
    高解析度傳感器可以通過收集有價值的觸覺信息來實現更高級的機器人操縱能力,這些信息可以用來確定操縱特定物體的最佳策略。許多現有的觸覺傳感器效率很高,但生產成本很高,這使得它們很難或不可能大規模實施;其他的傳感器價格低廉,但解析度和性能有限。
  • 從圖像識別到物體識別
    為了解釋得清楚些,我們不妨先看一下用於圖像分類的二維CNN。這個思路是,機器學習研究者會構建數個隱層形成的模型,每一層與前一層都以不同的形式連接。在第一層,你會擁有一個在二維圖像上滑動的一塊窗口區域作為輸入。因為這個區域執行了卷積操作——在窗口滑動時它交疊其上,因此它被稱為卷積層。其後還有幾層不同形式的隱層,最後一層用於預測潛在的輸出;每一種輸出對應著圖像標註中的某種分類。
  • 識音辨物-通過聲音來預測物體的外觀及運動
    研究人員首先通過建立一個機器人 Til-Bot來創建聲音動作視覺數據集,該機器人將包括螺絲起子,剪刀,網球,立方體和夾子在內的物體沿任意方向傾斜放在託盤上。物體撞擊石膏託盤的薄壁並產生聲音,這些聲音將被逐一添加到語料庫中。安裝在30×30釐米託盤上的四個麥克風(每側各一個)記錄音頻,而高架攝像機則捕獲RGB和深度信息。
  • 性能SOTA、適用多種類型物體,國防科技大學單張RGB-D圖像預測物體...
    機器之心發布機器之心編輯部在這篇論文中,來自國防科技大學和普林斯頓大學的研究者提出了一種面向單張 RGB-D 圖像的對稱檢測網絡 SymmetryNet。因此,對稱性檢測在圖像分割、物體檢測以及機械臂抓取等任務中有著廣泛的應用前景。三維物體對稱性檢測是經典的幾何問題,由於對稱性具有明確的數學定義(即物體在進行對稱變換後具有幾何不變性),傳統的三維對稱檢測方法往往首先檢測對稱對應點(symmetric counterpart),再通過聚類或投票算法得到物體的對稱面 / 軸。
  • 觸覺,或許是目前機器人最難以實現的一種功能
    目前我們已知的機器人可以走路,看,說,聽,並操縱機器人手中的物體。甚至還有一個又嗅覺的機器人。但是觸覺卻說起來容易做起來難以理解,目前正在研究的一些方法存在局限性,但科研人員正在開發一種可以克服其中一些問題的新技術。