如何教機器人開車?研究人員有了新想法。
試想,如果機器人能夠通過觀看演示來學習新技能:在家,你可以教家庭機器人如何做家務;在辦公室,你可以像培訓新員工一樣訓練機器人完成工作任務;在路上,自動駕駛汽車也可以通過觀察你的駕駛方式學習如何安全駕駛。
據techxplore.com網站近日報導,美國南加州大學(USC)的研究人員在自動駕駛方面取得了新進展。他們設計的系統可以讓機器人從少量演示中自主學習複雜任務。
新系統通過評估演示過程的質量運行,因此,不論演示成功還是失敗,機器人都能從中獲益。相關論文在機器人學習大會(CoRL)中發布。
目前的學習方法至少需要上百次演示實驗才能使機器人完成特定任務,而新系統通過少量演示就能達到相同效果。在它的幫助下,機器人能像人類相互學習那樣,更自然地學習——觀摩他人完成任務,再自行嘗試,他人演示過程也不一定完美無誤。
論文作者、USC計算機科學博士生Aniruddh Puranic說:「大多數人不具備編程知識,無法明確告訴機器人需要做什麼。人類也不可能演示機器人需要了解的所有場景。」
研究人員在新系統中集成「信號時序邏輯」(STL),用以評估演示質量並自動對演示進行排名,產生內在激勵。換句話說,即使根據邏輯需求,演示的某些部分沒有任何意義,機器人仍可受益,因為該系統能夠對一次演示的準確性(或成功程度)做出自己的判斷。
「此前,如果機器人在學習過程中觀看了錯誤演示,機器人有可能完全無視它,也有可能直接進行錯誤學習,」論文作者、USC計算機科學助理教授Stefanos Nikolaidis說,「相比之下,新系統更加智能,它通過邏輯形式推理理解了演示的好壞之分。從本質上講,這和人類的做法一致。」
例如,在駕駛演示中,有人無視了停車標誌,這一演示將被系統放在靠後排位。但是,如果駕駛員選擇踩下剎車以避免碰撞,機器人則會學習這一相對明智的行為。
STL是一種具有表達能力的數學符號語言,它賦予系統自動推理結果(現在及未來)的能力。前豐田工程師、USC計算機科學助理教授Jyo Deshmukh表示,STL比此前使用的「線性時序邏輯」(LTL)更符合現代需求。他說:「當我們進入由自動駕駛汽車、機器人構建的新世界時,時間的重要性凸顯。LTL繁雜耗時,因為它需要推斷變量的真/假值序列,而STL允許對物理信號進行推理。」
系統的測試任務是在一款與《我的世界》風格類似的遊戲模擬器中完成的,不過,研究人員表示,系統也可以通過駕駛模擬器進行學習,甚至從視頻中學習。
Nikolaidis說:「如果我們想讓機器人成為人類的好幫手,首先需要讓它們進行有效學習,適應人類喜好。我們開發的系統正是以此為目標。」
科界原創
編譯:德克斯特
審稿:西莫
責編:陳之涵
來源:機器人學習大會(CoRL)
原文連結:
https://techxplore.com/news/2020-11-robots-car-easy-lessons.html
版權聲明:本文由科界平臺原創編譯,中文內容僅供參考,一切內容以英文原版為準。轉載請註明來源科技工作者之家—科界App。
—— 分享新聞,還能獲得積分兌換好禮哦 ——