Form2Fit:讓機器人通過自監督拆卸學習組裝

2021-02-13 TensorFlow
文/ Kevin Zakka 研究實習生和 Andy Zeng 研究員

在我們生活的世界中,有多種形狀的物體,人們會本能地去學習了解物體是如何連接的。因此,我們學會了將衣架掛在晾衣杆上,將電源插頭插入牆上的插座,以及將 USB 插頭插進對應的接口 。

這種基於形狀「將物品組合在一起」的模式源於我們多年的生活經驗,如進行 DIY 家居組裝或將禮品包裝好,這類經驗有助於提高執行任務的效率。

如果機器人能學會這種「將物品依形狀組合在一起」,那麼它們在面對從未見過的事物時或許能更好地適應並完成操作任務,如將斷裂的管道或線路重新連接好,或在災難應急響應時利用斷壁殘垣搭建臨時避難所。

為探究此想法的可行性,我們與史丹福大學和哥倫比亞大學的研究員一起開發了 Form2Fit,這是一種機器人操作算法,通過深度神經網絡學習識別物體彼此的對應關係(或者說「組合關係」)。

我們通過交給機器人一項組裝任務來測試算法,在任務中:機器人需將多個物體正確組裝到塑料包裝中或擺放在貨架中,形成一個整體。

在此之前,完成此類任務需要專門為任務創建一個系統,並且每次都需要大量的人工微調。但當我們從如何讓機器人學習「將物品組裝在一起」這個角度來嘗試時,任務成功率高達 94%。不僅如此,Form2Fit 還是首個實現泛化能力的系統,能夠舉一反三完成訓練時未見過的新任務。 

Form2Fit 通過尋找物體外觀與擺放位置間的幾何對應關係來學習組裝。再將訓練時學習到的多套件中的幾何信息,泛化到新物體和新套件上

形狀分析在操作中(尤其是套件組裝類任務中)發揮著重要作用,雖然這經常被忽略。日常生活中 ,物體外觀形狀通常與包裝內對應空間的形狀相一致,理解這一關係後,人們在完成此類任務時可最大限度地減少無意義的猜測。

Form2Fit 的核心目的是,從多項物體和對應擺放位置的系列任務的訓練中學習這種關係,以便更好地了解形狀與外觀如何組合。通過收集自己的訓練數據,Form2Fit 不斷自我完善,並最大限度地減少人工監督,在訓練中反覆試錯,重複拆卸組裝完的套件,然後顛倒拆卸順序以提供組裝步驟。

在 12 小時的訓練後,機器人掌握了各種套件的高效選取和擺放策略,而且不同組合的對象和套件的組裝成功率達 94%,在處理全新的物體和套件時,組裝成功率超過 86%。

Form2Fit 的核心是一個雙流匹配網絡,通過圖像數據生成 可區分方向的 像素級形狀描述符 (Descriptors),從而推斷物體與其對應的擺放位置。這些描述符可視物體的壓縮 3D 點表徵,其中編碼了幾何形狀、紋理和任務的上下文信息。Form2Fit 使用這些描述符在物體及其對應目標位置(即物體應當擺放的位置)建立對應關係。描述符可區分方向,因此 Form2Fit 在擺放物體到目標位置之前會先推斷應如何旋轉物體。

Form2Fit 使用另外兩個網絡生成 選取 和 放置 的有效候選。將物體的 3D 圖像輸入給選取網絡,並生成選取成功率的逐像素預測。選取的成功概率顯示為熱力圖,其中亮色表示在像素對應的 3D 位置具有更高的選取成功率。與此對應的,放置網絡得到目標套件的 3D 圖像,以熱力圖輸出放置成功率的逐像素預測,其中置信度較高的像素是更適合機械臂垂直下放物體的位置。最終規劃器 (Planner) 會整合這三個模塊的輸出,以生成最終的選取位置、擺放位置和旋轉角度。

Form2Fit 概覽:選取網絡和放置網絡可分別推斷場景中的選取和擺放候選位置。匹配網絡通過生成區分方向的逐像素描述符來匹配選取位置及其對應的擺放位置。規劃器整合輸出後控制機器人執行下一個最佳選取和擺放操作

神經網絡需要大量訓練數據,對於組裝類任務而言,很難收集足夠的數據。由於隨機探索的成功率很低,通過試錯法很難學會以正確的方向將物體準確插入狹窄的空間中(如套件中)。

相比之下,通過試錯法學習拆卸組裝完的套件通常要容易一些,因為拆東西要比組裝更簡單。我們利用這種方法來積累 Form2Fit 的訓練數據。

通過時間反轉法進行自監督學習的示例:倒放除臭劑套裝的拆卸順序,生成有效的組裝順序

我們觀察到的一個心得是:在多類組裝套件中,反轉拆卸順序即為有效的組裝順序。這個被稱為 時間反向拆卸 (Time-Reversed Disassembly) 的概念可幫助 Form2Fit 完全通過自監督進行訓練,這需要通過對完整組裝的套件進行反覆試錯隨機選取的組件進行拆卸,然後反轉該拆卸順序,以學習如何將套件組裝到一起。

我們的實驗結果顯示出學習組裝泛化策略的巨大潛力。例如,在訓練僅在一個特定位置和方向組裝套件的策略時,測試時隨機旋轉組件或調換為相似套件,仍能保持 90% 的正確率。

Form2Fit 訓練出的策略具有很好的穩定性,可適應套件的各種旋轉變換和相似替換

我們還發現 Form2Fit 能夠處理訓練時未接觸過的新組合。例如,在針對兩種單一物體套件(將牙線放入盒)訓練策略時,我們發現此算法可以成功組裝這些套件的新組合和混合搭配,即使以前從未見過這樣的組合。

Form2Fit 策略可泛化到新套件組合,比如相同套件的多種版本以及不同套件的混合組合

此外,在遇到未經訓練的全新套件時,Form2Fit 還可以使用學到的形狀進行歸納,然後再組裝這些套件,並且組裝正確率超過 86%。

Form2Fit 策略可以泛化到未曾見過的單個和多個物體套件

為研究 Form2Fit 匹配網絡的描述符如何學習與編碼,我們使用了一種稱為 t-SNE 的嵌入技術以 RGB 顯示各種對象的逐像素描述符。

嵌入 t-SNE 的物體描述符。相同類別相似朝向的物體顯示相同顏色(例如 A、B 或 F、G),而不同物體(例如 C、H)以及不同朝向的相同物體(例如A、C、D 或 H、F)則顯示不同顏色

旋轉 — 朝向不同的物體使用不同的描述符(A、C、D、E)和(H、F);空間對應關係 — 相同朝向物體對應的點共用相似的描述符(A、B)和(F、G);

物體識別 — 外形相似卻是不同種類的動物和水果顯示的是不同的描述符(第 3 列和第 4 列)。

雖然 Form2Fit 的結果令人鼓舞,但此算法也存在一定的局限性,這將是今後研究人員工作的重點。在實驗中,我們假設僅使用 2D 平面工作區以限制套件組裝任務,因此僅需要上下操作進行選取和擺放便可解決問題。此策略顯然並不適用於所有組裝情況,例如,將釘子以 45 度角精確釘入平面。將 Form2Fit 拓展到更複雜的 3D 組裝操作中將會非常有趣。

您可以了解更多相關研究成果,也可以從我們的 GitHub 倉庫 (https://form2fit.github.io/)下載代碼。

這項研究由 Kevin Zakka、Andy Zeng、Johnny Lee 和 Shuran Song(哥倫比亞大學教職員)共同完成,在此特別感謝 Nick Hynes、Alex Nichol 和 Ivan Krasin 開展的卓有成效的技術討論;Adrian Wong、Brandon Hurd、Julian Salazar 和 Sean Snyder 提供的硬體支持;Ryan Hickman 提供的妥善管理支持;以及 Chad Richards 提供的寫作的建議。

相關焦點

  • BYOL:輕鬆進行自監督學習
    經過谷歌這樣的諸多先驅者若干年的研究,子監督學習如今已取得一系列的進步與發展。在BYOL之前,多數自我監督學習都可分為對比學習或生成學習,其中,生成學習一般GAN建模完整的數據分布,計算成本較高,相比之下,對比學習方法就很少面臨這樣的問題。
  • 三葉羅茨鼓風機拆卸和組裝以及維護和保養
    三葉羅茨鼓風機拆卸和組裝以及維護和保養三葉羅茨鼓風機特點:1.雙油箱設計,結構簡單,維修方便,高速高效率。三葉羅茨鼓風機拆卸和組裝方法:拆卸方法:1.拆卸三葉羅茨鼓風機時,應標記所有接頭和配合零件。2.注意,拆下壞密封墊及調整墊片時不會損壞墊片,並測量其厚度。
  • 液壓雙人床拆卸組裝步驟
    接下來原本同城家居服務平臺給大家介紹一下怎麼拆卸液壓床吧。需要準備的工具:扳手、十字螺絲刀、鉗子、小密封袋等(為什麼要用小密封袋?)當然,把類似零件的螺旋蓋放好,並且每一個不同零件的小零件都要分類,不要弄亂,以後重新組裝就會簡單了)。1. 第一步是了解床的結構,無論它是拆卸任何家具。
  • 宜家組裝容易把人逼瘋?機器人可以幫忙組裝椅子了
    不是人人可以享受組裝家具的樂趣,當你被宜家的圖紙折磨瘋了,可以考慮一下找機器人幫忙。研究人員用代碼給這對機器人手臂基本的說明圖像,然後把木塊放在機器人前,接到任務清單後,它們會使用 3D 照相機進行觀察。在組裝過程中,機器人會自動計算兩臂的運動進行組裝。因 3D 相機只有幾毫米的精度,如果它沒有精確地掃描孔,機器人則會計算出錯,不能及時改變力量模式,損壞木塊。力傳感器可以解決這個問題。
  • fit的意思是適合,fit like a glove是什麼意思?
    2、The children seem to think I'm only fit for cooking and washing!孩子們似乎以為我只配做飯洗衣!這句話中fit的意思是合適的、恰當的、合格的,通常指質量、素質或技能。
  • 人工智慧的下半場,一定少不了自監督學習
    然而,當前主流的監督式學習任務往往過度依賴於人工標註,即所謂「有多少人工就有多少智能」。因此,通過自監督的方式自動生成監督信號成為了越來越多人工智慧從業者的選擇。本文從圖像、視頻、控制三個角度分別介紹了自監督表徵學習的最新進展,值得一讀!對於給定的任務,在擁有足夠的標籤的情況下,監督式學習可以很好地解決該問題。
  • 如何拆卸和組裝牆壁開關?
    如何拆卸牆壁開關? 2.用平頭螺絲刀將開關蓋固定在接線盒的壁上,然後擰下螺釘。取下蓋子,將電路測試儀的探針放在每個開關的螺釘端子上,以確保沒有力量去開關。 3.開關和接線盒,使用十字螺絲刀鬆開兩個螺絲,使您可以訪問電線端子螺絲在側面的開關。
  • 卡內基梅隆大學機器人學院博士後王晨:無監督在線學習在機器人場景...
    針對場景預測問題的研究,目前多為基於有監督的學習方法,其數據也需要有對應的標籤信息。但移動機器人的實際操作環境往往是未知的,數據的標籤信息很難獲取,因此基於有監督的學習方法並不適用於移動機器人的場景預測問題。
  • 七年 拆卸和組裝:學好英文句子的第一步
    我二外學的是日語,雖然現在忘得差不多了,但始終記得,日語的結構是主+賓+謂,後置的謂語要根據文句的意思、語氣進行變化。日語中雖然有大量的漢字,但其語言結構跟中文迥異,因此,我認為學習日語的難度遠遠大過屬於日耳曼語族的英文。
  • 機器人組裝遊戲《組裝車間》曝新PV!
    近日,由Bad Yolk製作的機器人題材搭建遊戲《組裝車間(Main Assembly)》公布了一段新宣傳片,該遊戲由曾推出過《胡鬧廚房》《優酷的小島之旅》《波西亞時光》等作品Team17發行,計劃今年登錄PC。
  • 缺氧引發的超小氧化鐵納米粒子自組裝可放大腫瘤成像信號
    缺氧引發的超小氧化鐵納米粒子自組裝可放大腫瘤成像信號 作者:小柯機器人 發布時間:2021/1/7 13:51:30 國家納米中心陳春英課題組發現,缺氧觸發的超小氧化鐵納米粒子自組裝可放大腫瘤的成像信號。
  • 從頭到尾組裝一個宜家椅子,機器人花了不到21分鐘
    例如,要組裝一個椅子,機器人的3D鏡頭會先拍攝椅子的零部件,通過算法將照片與3D零部件資料庫中的物體進行比對,確認零件的部位後,由AI系統安排組裝的步驟和如何移動機器手臂等等,然後實際完成組裝一張宜家的Stefan椅子,整個過程只花了20分19秒。
  • 樂高提供EV3機器人3D交互式組裝指南
    LEGO MINDSTORMS EV3機器人套裝,包括3D組裝指南(移動版和網頁版)將於2013年下半年正式上市。據了解,新的交互式組裝指南基於Autodesk Inventor Publisher技術,可在搭載iOS或安卓系統的行動裝置上運行,也可以通過MINDSTORMS.COM網站進行頁面操作。
  • 教程|如何拆卸、組裝一部對講機?以摩託羅拉C1200為例演示給你看
    如何拆卸一部對講機,曾經是無數對講機用戶夢寐以求的事情。如今,小編親自教你拆機,讓拆機再也不是發燒友的專利!現在,馬上變身對講機「發燒超人」吧!目錄:一,如何拆卸?二,如何組裝?一,如何拆卸對講機?2、將專用的十字扳手,套入天線頭的凹槽內,逆時針方向旋開。3、用內六角螺絲刀,逆時針方向旋擰,卸下鋁板的兩個螺絲。4、用十字螺絲刀,按逆時針方向,旋開防水蓋的螺絲。5、捏緊電池扣,向上拉45度角。6、握住機器鋁板兩側,向後輕輕拉,打開機器。7、手握面殼,找到送話器的線,用電鉻鐵焊開,可避免拉斷或拉壞送話器。
  • 清華CVer 對自監督學習的一些思考
    自監督學習是指用於機器學習的標註(ground truth)源於數據本身,而非來自人工標註。如下圖,自監督學習首先屬於無監督學習,因此其學習的目標無需人工標註。其次,目前的自監督學習領域可大致分為兩個分支。
  • 寫字機器人好用嗎?組裝就花了5個小時 還要學習軟體、錄入字體
    前不久,一條「孩子購買代寫作業機器人,被家長發現」的新聞,引發了強烈爭議。這種可以寫字的機器人到底是什麼?又是怎樣來模仿不同人的字體呢?【記者網購機器人 組裝花了5小時】記者在網購平臺搜索「寫字機器人」發現,彈出的200多個相關商品中,很多都標註了「仿生」、「仿手寫」等關鍵詞,價格從300元到2000元不等,大部分產品銷量都沒有超過100件。
  • 俄羅斯中小學將開設「AK-47步槍組裝和拆卸」課程
    俄羅斯教育部近日發布了一份新的課程教育計劃,呼籲全國中小學於11月10日起開設一門主題教育課,課上老師將教學生如何組裝和拆卸AK-47(卡拉什尼科夫自動步槍)。「俄羅斯老師教孩子們組裝AK-47,美國德克薩斯州老師教孩子們如何使用保險套性交。
  • 這些美國製造的沙發容易組裝和拆卸,而且久用不壞
    本住在城市裡的人都知道,搬家最耗費腦子的環節並非只是打包幾個紙盒這麼簡單;你總是要留下一些完好的家具——可是要麼太麻煩,要麼搬運費太貴,要麼家具本身禁不起再次拆卸和安裝。越來越多的人在為過渡性住所挑選新家具的時候,總是發現在質量、價格或者交貨期方面沒有什麼選擇。
  • 監督學習、非監督學習、強化學習都是什麼?終於有人講明白了
    ▲圖1.2 使用非監督學習根據購買數據對客戶分組的示例使用非監督學習進行分組將有助於了解每個客戶所屬的組,並針對每個組實施最佳銷售策略(儘管部分業務還需要更詳細的分析)。除了本例中提到的分組(聚類)以外,非監督學習也用於降維和推薦系統。最後,我們討論強化學習。
  • 實測「寫作業神器」寫字機器人 組裝難字還醜
    本次開學季,以「幫完成作業」為名的「寫字機器人」在各類熱搜榜佔據一席之地,引發爭議不斷。2月21日,記者從某網購平臺以440元訂購的「寫字機器人」到貨,但其不僅程序繁瑣,且書寫尚達不到「代寫」標準。記者實測:僅組裝就耗時6小時有些字打不出,字還很醜18日,記者通過一網購平臺訂購「寫字機器人」。若在搜索框輸入「寫作業機器人」無法搜出該產品,只有搜索「寫字機器人」才能搜出。