ICRA 2020最佳論文授予加州理工和清華:首個自適應外骨骼步態AI算法

2020-12-05 澎湃新聞

選自arXiv

作者:Maegan Tucker 等人

機器之心編譯

機器之心編輯部

上周末,機器人領域頂級會議 ICRA 2020 放出了所有獎項的結果,來自加州理工和清華大學的 Maegan Tucker 等人的工作獲得了本屆大會最佳論文獎。本論文還同時獲得最佳人機互動論文獎(Best Paper Award on Human-Robot Interaction)。

論文連結:https://arxiv.org/abs/1909.12316

這項研究展示了如何利用「個人偏好」,來定製化提升人類使用下肢外骨骼的舒適感。以往,機械外骨骼一直被美國軍隊視為提升士兵作戰能力的工具,但加州理工和清華大學的這項研究在未來或許可為數千萬殘障人士帶來幫助。

該研究提出了一種叫做 COSPAR 的算法,它可以將合作學習應用於下肢外骨骼操作時對人類偏好的適應,並在模擬和真人實驗中進行了測試。

論文參與方有Caltech的Aaron Ames組、Joel Burdick組和Yisong Yue組,以及清華大學的Yanan Sui組。

研究者表示,未來計劃將 COSPAR 用於優化規模更大的步態參數,但可能需要集成該算法與更多可用於高維特徵空間學習的技術。這一方法還可以擴展到預計算步態庫以外的數據,進而生成全新的步態或者控制器設計。

從輔助移動到自動駕駛,從教育到對話系統,人機互動在多個應用領域得到了越來越多的關注。在這些領域中,為了使機器人系統和人類用戶的交互效果最優化,機器人系統必須根據用戶的反饋做出適應性調整。具體而言,機器人系統從用戶反饋中學習有助於改進機器人輔助設備。

這項研究致力於優化下肢外骨骼 Atalante 的步態,以最大程度地提升用戶舒適度。

Atalante 是法國初創公司 Wandercraft 開發的第四代下肢外骨骼設備,它使用 12 個驅動關節(actuated joint),來幫助下肢運動障礙的人恢復移動能力。利用 Atalante 進行的現有工作證明了,利用局部混合零動態(partial hybrid zero dynamics,PHZD)方法可以實現動態穩定地行走,該方法最初是為雙足機器人設計的。

儘管 PHZD 方法能夠生成穩定的雙足移動,但目前仍沒有能夠提升舒適度的框架。然而,用戶舒適度應該是優化外骨骼行走步態的關鍵目標。現有方法能夠讓雙足機器人擁有和人類類似的行走步態,但它們無法滿足用戶的個人偏好。

就像涉及人類的很多現實世界設置一樣,對於外骨骼步態生成而言,可靠地指出數值分數或者提供 demo 都是有挑戰性的。在這樣的情況下,用戶的相關偏好(relative preferences)能夠更可靠地度量他們的舒適度。之前的研究已經發現,在信息檢索和自動駕駛等多個領域中,用戶偏好比數值分數更可靠。

基於決鬥賭博機(dueling bandits)和合作學習(coactive learning),該研究提出了 COSPAR 算法來學習用戶偏好的外骨骼步態。COSPAR 是一種混合驅動(mixed-initiative)方法,既可以查詢用戶的偏好,也允許用戶提出改進意見。研究者在模擬和真人實驗中進行了驗證。實驗表明,COSPAR 能夠在步態庫中找到用戶偏愛的步態。此過程不僅可以識別用戶偏好的行走軌跡,還可以洞悉用戶對某些步態的偏好。

基於用戶偏好的學習算法

從人的主觀反應中學習時,偏好反饋比絕對反饋更加可靠,因此該研究利用「基於偏好的學習」(如用戶喜歡步態 A 還是步態 B?),來確定用戶最喜歡的步態參數。因此,該研究個性化外骨骼步態的目標可以被定義為決鬥賭博機和合作學習問題。

該研究基於 Self-Sparring 算法構建。這是一種貝葉斯決鬥賭博機方法,既具備有競爭力的理論收斂保證,又擁有實證性能。Self-Sparring 算法基於每個動作對用戶的效用來學習貝葉斯後驗,並通過偏好誘導從模型的後驗中抽取多個樣本進行決鬥。

Self-Sparring 算法可以迭代地執行以下操作:a)從動作效用的後驗模型中提取多個樣本;b)對於每個樣本模型,用最高的採樣效用執行動作;c)在已執行動作之間查找偏好反饋;d)根據獲取的偏好數據更新後驗。

為了收集更多的反饋信息,研究者允許用戶在試用期間提出改進建議。這種方法類似於合作學習框架,即用戶將改進的動作作為對每個動作的反饋。

合作學習已經應用於機器人軌跡規劃,但尚未用於機器人步態生成或與偏好學習相結合。

COSPAR 算法

為了優化步態庫內的外骨骼步態,研究者提出了一種混合驅動學習方法 COSPAR 算法,該算法擴展了 Self-Sparring 算法,將主動反饋融入其中。

和 Self-Sparring 類似,COSPAR 維護基於可能動作的貝葉斯偏好關係函數,該函數用於觀察到的偏好反饋。COSPAR 基於用戶反饋更新模型,並用它來選擇新試驗的動作,並誘導反饋。

該研究首先定義了貝葉斯偏好模型,然後細化了算法 1 的步驟。

COSPAR 算法。

模擬實驗

研究者在兩種模擬環境中對 COSPAR 的性能進行評估。

首先,利用兩足動物模擬 CG 來評估 COSPAR 的性能,並通過偏好反饋基於步長優化 COT(cost of transport),如下圖 2 所示:

圖2。

然後通過對比 COT 值來確定偏好。COT 值是通過模擬多個步長的步態來計算的,每個步長均保持固定 0.2 m/s 的髖關節速度。這些模擬步態是通過 single-point shooting 局部混合零動態方法合成的。

接下來,研究者在綜合 2D 效用函數上測試 COSPAR,如圖 3(a)所示。每個效用函數都是基於 30x30 網格上的高斯過程先驗生成的。這些實驗評估了將 COSPAR 擴展至更高維度時的性能,以及合作反饋的優勢。

圖 3:a)綜合 2D 目標函數示例。b)在模擬條件(n=1; b = 1; 主動反饋)下,COSPAR 經過 150 次迭代後學習到的效用模型後驗。COSPAR 會優先確定和探索最佳區域,而不是學習全局精確效用圖景(globally-accurate utility landscape)。

模擬結果如圖 4 所示。在每種情況下,涉及合作反饋的混合驅動模擬都比只接收偏好的模擬表現要好。

圖 4:在 2D 綜合目標函數上的 COSPAR 模擬結果,對比了 n、b 和有 / 無合作反饋三種不同參數設置情況下的 COSPAR 算法。從中可以看出,合作反饋總是能起到作用的,n = 2, b = 0 這種情況下的效果最差,因為接收到的偏好最少。

真人實驗

在模擬實驗之後,研究者將 COSPAR 部署在下肢外骨骼設備 Atalante 上,進行了兩項人類受試者的個性化步態優化實驗。這兩項實驗的目的是,確定使用戶舒適度最大化的步態參數值,比如偏好和合作反饋。

第一個實驗針對三個健康的受試者,用 COSPAR 來確定受試者的偏好步長,也就是在一維特徵空間中進行優化。

第二個實驗展示了 COSPAR 在二維空間中的有效性,並在兩個不同的步態特徵對上同時進行了優化。重要的是,COSPAR 不依賴於步態特徵的選擇。

從圖 1 中可以看到,研究者還通過直接測熱法記錄了受試者的代謝支出,但由於使用者沒有消耗太多的精力在步行動作上,這個數據並不能說明使用者偏好。

圖 6:二維特徵空間中的實驗結果(上一行:步長和持續時間;下一行:步長和寬度)。1 到 4 列展示了偏好模型的後驗均值變化。第四列還展示了受試者在 20 次試驗後採樣三次步態的盲測分數。第五行按照時間順序描繪實驗結果。COSPAR 從後驗偏好分數更高的區域抽取了更多樣本。

參考內容:

https://venturebeat.com/2020/06/03/caltech-ai-lab-optimizes-exoskeleton-gait-for-human-comfort/

原標題:《ICRA 2020最佳論文授予加州理工、清華大學:首個自適應外骨骼步態AI算法》

閱讀原文

相關焦點

  • 癱瘓父親穿機械骨骼接女兒放學引熱議!清華新研究助力無拐杖行走
    這款外骨骼機器人的原理是使用外骨骼支架來支持行走困難的人進行康復訓練,在康復訓練當中,會使原本萎縮無力的肌肉和神經得到激活,能使行走困難的人的運動神經和行走肌肉得到有效地鍛鍊。來源@艾上行走清華步態優化算法獲ICRA最佳論文:專注讓無拐杖外骨骼行走更穩 這些可落地的商業產品離不開相關科研成果的進展
  • 獲ICRA最佳學生論文,機器人控制雙獎,這個小哥機械手玩球技術嫻熟
    其中華人小哥 Shenli Yuan 等的研究《Design of a Roller-Based Dexterous Hand for Object Grasping and Within-Hand Manipulation》獲得了此次會議的最佳學生論文獎和最佳機器人控制論文獎。
  • 2020最佳AI論文,都在這裡了
    儘管2020年發生了很多事情,研究者們仍然為人工智慧技術的進步做出了大量重要的貢獻。位於蒙特婁的 AI 內容創作者 Louis Bouchard (他的 YouTube 帳號叫 What's AI) 匯總了一份2020年最值得關注的 AI 論文名單(https://github.com/louisfb01/Best_AI_paper_2020 )。
  • 2020 Frontiers in Neurorobotics丨一種康復機器人步態自適應識別方法
    一種康復機器人步態自適應識別方法張熹 供稿
  • CoRL2020獎項公布,斯坦福獲最佳論文獎,華為等摘得最佳系統論文獎
    來自史丹福大學和維吉尼亞理工的研究者摘得本屆 CoRL 會議的最佳論文獎,華為諾亞方舟實驗室和上海交大等機構學者榮獲最佳系統論文獎,南加州大學研究獲得最佳 Presentation 獎。昨日,第四屆機器人學習大會(CoRL)公布了最佳論文獎、最佳系統論文獎等獎項。
  • CoRL 2020獎項公布,斯坦福最佳論文,華為等獲得最佳系統論文獎
    來自史丹福大學和維吉尼亞理工的研究者摘得本屆 CoRL 會議的最佳論文獎,華為諾亞方舟實驗室和上海交大等機構學者榮獲最佳系統論文獎,南加州大學研究獲得最佳 Presentation 獎。昨日,第四屆機器人學習大會(CoRL)公布了最佳論文獎、最佳系統論文獎等獎項。
  • 世界名校、大廠人才匯聚,「馬欄山杯」算法大賽打造AI視頻競技場
    四大洲青年同臺PK,世界名校、業界巨頭齊聚賽場目前已經參賽的這些隊伍來自中國、美國、日本、英國、德國、印度、紐西蘭等十幾個國家和地區,橫跨亞洲、歐洲、北美洲、大洋洲幾大洲。他們的院校也大多擁有深厚的理工類背景或綜合背景,包括麻省理工學院、卡耐基梅隆大學、加州大學聖地牙哥分校、哥倫比亞大學等多所CS Ranking(全球計算機科學專業排名)上排名前20的海外高校。值得一提的是,麻省理工學院和卡耐基梅隆大學還是全球計算機實力最強的四大高校之一。
  • 最佳論文最佳學生論文一作均為華人,清華最高產機構
    大數據文摘出品史上最難的的CVPR2020終於來了!由於疫情影響,今年原定於6.14開始的線下討論會改成位於西雅圖的線上會議。在剛剛結束的CVPR 2020 開幕式上,悉數公布了本屆CVPR最佳論文、最佳學生論文等獎項。值得一提的是,兩個獎項的論文一作均為華人。
  • 浙大畢業,李飛飛高徒朱玉可加盟UTAustin,曾獲ICRA2019最佳論文
    此外,朱玉可還作為共同第一作者獲得了國際機器人頂會 ICRA 2019 的最佳論文獎。朱玉可在 Twitter 上發布的信息:本人已於 2019 年 8 月取得史丹福大學博士學位,並將於 2020 年秋季加入德克薩斯大學奧斯汀分校(UT-Austin)擔任計算機科學助理教授。我非常期待與那些對 AI+機器人學充滿熱情和積極性的優秀學生共同進步。
  • 7 Papers & Radios | EMNLP 2020最佳論文;新型優化器AdaBelief
    在多個模擬域和現實世界曲棍球遊戲中,該方法優於其他方法,並學會影響其他智能體。本研究中學習和利用潛在意圖的方法流程圖。學習和影響潛在意圖(LILI)算法。air hockey 實驗的學習結果。推薦:CoRL 2020 最佳論文。
  • 冒充北大生,被清華取消保研,搖身一變竟成加州理工高材生
    黃同學,申請到2020年加州理工大學EE系唯一一個大陸phd。這裡有兩個詞注意「加州理工大學」「唯一大陸」,要知道加州理工可是走出了74位諾貝爾獎,而電子工程更是它最強的專業之一,每年大陸能收到offer數一隻手都能數出來,更別說他是今年唯一。厲害啊!
  • 清華北大世界綜合排名下降 加州理工排名第一
    據英國廣播公司3月15日報導,英國《泰晤士高等教育》(Times Higher Education)周刊公布了最新的全球大學聲譽排名,哈佛大學蟬聯第一,麻省理工和劍橋大學則緊隨其後
  • 機器學習頂會ICML 2018:復旦大學副教授獲最佳論文亞軍 騰訊清華...
    ICML官網上提前公布了最佳論文名單,來自MIT和UC Berkeley的研究人員摘得最佳論文的桂冠。復旦大學大數據學院副教授黃增峰獨立署名的論文《Near Optimal Frequent Directions for Sketching Dense and Sparse Matrices》和來自DeepMind、史丹福大學的兩篇論文共同位居最佳論文亞軍行列。
  • GPT-3獲NeurIPS最佳論文獎,華人學者獲經典論文獎
    包括GPT-3在內的三篇獲得最佳論文獎,一篇2011年論文獲得時間檢驗獎。在普通形式的遊戲中,CE的一個令人驚訝的特徵是,可以通過簡單且分散的算法最小化後悔的特定概念(即所謂內部後悔)。本文推導了近似解的近似因子在最佳可能低秩近似上的新上界和下界,該上下界甚至可以獲得關於子集大小的多重下降行為。
  • AI創業黑幫:麻省理工走出的14張「中國面孔」
    對此,億歐盤點了一份關於人工智慧領域的創業校友集,匯集國外四大高校(CMU、MIT、Stanford、UC Berkeley)與國內四大高校(清華、北大、交大、浙大)——歡迎閱讀AI創業黑幫專題系列文章:卡耐基梅隆大學、麻省理工大學、史丹福大學、加州大學伯克利分校、清華大學、北京大學、上海交通大學、浙江大學由麻省理工學院教授Emery Berger發布,反映全球院校計算機科學領域實力的榜單
  • 畢業於清華的90後學霸,即將加入MIT任助理教授
    值得關注的是,除範楚楚外,2019年已有多位學霸宣布將任教美國頂尖學府,包括出身清華姚班的斯坦福博士畢業生陳丹琦,將前往普林斯頓大學計算機科學系擔任助理教授;華盛頓大學計算機系博士生陳天奇將在 2020 年秋季加入 CMU,擔任助理教授;加州大學伯克利分校的博士生朱俊彥將在 2020 年秋季加入 CMU,擔任助理教授;加州大學伯克利分校電氣工程與計算機科學
  • 全球三十大最佳 AI 創業公司公布
    2017 年 2 月,Drive.ai 在美國加利福尼亞州山景城街道完成雨夜無人駕駛測試。同年 9 月,Drive.ai 與 Lyft 達成合作協議,在加州推出試點計劃。2016 年 12 月,第四範式榮獲中國人工智慧界最高獎——「吳文俊人工智慧科學技術獎」創新獎一等獎,是首個獲得該獎項的企業。
  • 自適應濾波算法理解與應用
    價值函數是濾波器最佳性能的判斷準則,比如減小輸入信號中的噪聲成分的能力。   隨著數位訊號處理器性能的增強,自適應濾波器的應用越來越常見,時至今日它們已經廣泛地用於手機以及其它通信設備、數碼錄像機和數位照相機以及醫療監測設備中。
  • 解讀騰訊優圖ICCV2017 12篇論文:全球首個AI卸妝效果的算法等
    今年,即將於2017年11月8日在北京國家會議中心舉辦的AI World 2017世界人工智慧大會上,我們請到了騰訊優圖實驗室傑出科學家賈佳亞教授發表演講。 想了解更多關於騰訊優圖和計算機視覺的前沿動態?點擊文末閱讀原文,馬上參會!
  • 論文推薦 | 鄺英才,呂志平,王方超,李林陽,楊凱淳:GNSS/聲學聯合定位的自適應濾波算法
    結果表明:引入自適應濾波算法後,能有效改善狀態擾動對GNSS/聲學聯合定位的異常影響,提升其定位穩定性及定位精度;當分別對各類狀態參數的自適應因子進行合理構造後,濾波效果可達最佳。GNSS/聲學聯合定位的自適應濾波算法. 測繪學報,2020,49(7):854-864. DOI: 10.11947/j.AGCS.2020.20190393.