雙手都無法還原的魔方?OpenAI的AI機器人單手就能做到!

2021-01-19 環球網

人工智慧(AI)研究組織OpenAI在製造具有通用性、能夠自我學習的機器人方面取得了新的裡程碑。該組織的機器人部門表示,其去年首次亮相的機器人手Dactyl已經學會了單手解魔方。OpenAI將這個壯舉視為一次飛躍,這既體現在機器人手的靈巧性上,也體現在其自主研發的AI軟體上。這種軟體允許Dactyl在面臨真正的物理挑戰之前,利用虛擬模擬來學習如何執行新任務。

在展示Dactyl新才藝的演示視頻中,我們可以看到機器人手以摸索的方式逐漸破解魔方,雖然其動作顯得有點兒笨拙,但卻十分精確。儘管破解的過程有點兒長,但Dactyl最終解決了這個難題。這個機器人手的動作看起來明顯不如真正的人手靈活,甚至有點兒脫節,更無法與那些能在短短幾秒鐘內破解魔方的人的驚人速度和敏捷相比。

但對於OpenAI而言,Dactyl的成就使其向更廣泛的AI和機器人行業令人嚮往的目標又邁進了一步。這個行業希望研發出能夠學習執行各種現實世界任務的機器人,它們無需培訓數月乃至數年時間,也無需專門進行編程。

OpenAI的研究科學家和機器人技術負責人彼得·韋林德(Peter Welinder)說:「很多機器人都可以非常快地破解魔方。但它們所做的事情和我們正在做的事情之間存在重要區別,那些機器人都有著特定任務目標。顯然,你不可能使用相同的機器人或相同的方法來執行另一項任務。OpenAI的機器人團隊有著截然不同的雄心壯志,我們正在嘗試建造通用機器人,比如像人手那樣可以做很多不同的事情,而不僅僅是執行特定的任務,我們正在試圖在一定範圍內能夠通用的東西。」

韋林德指的是過去幾年中出現的各種機器人,這些機器人已經將破解魔方的方法推向遠遠超越人類雙手和思維的極限。2016年,半導體製造商英飛凌(Infineon)開發了一款專門用於以超快速度破解魔方的機器人,該機器人成功地在一秒鐘內完成了這個任務。這打破了當時由人類保持的世界紀錄(不到5秒)。兩年後,麻省理工學院開發的一臺機器在不到0.4秒的時間破解了魔方。

換句話說,為某一特定任務而設計的機器人,並被編程為儘可能高效地執行該任務,通常最適合人類,而破解魔方是軟體很久以前就掌握的東西。因此,開發機器人來破解魔方,即使是與人手相似的機器人,本身也並不是那麼引人注目。Dactyl操作的速度十分緩慢,這讓其取得的成就更顯得不起眼兒。

但是OpenAI的Dactyl機器人和驅動它的軟體,在設計和用途上與專用的魔防破解及其有很大的不同。正如韋林德所說的那樣,OpenAI正在進行的機器人研發工作並不是為了在狹隘任務中獲得卓越的結果,因為這只需要你開發更好的機器人並相應地對它進行編程就可做到。這甚至可以在沒有現代AI支持的情況下完成。

取而代之的是,Dactyl是從頭開始、逐漸掌握自學能力的機器人手,它可以像人類那樣處理新的任務。Dactyl同樣需要接受軟體訓練,目前正試圖以一種初級方式複製數百萬年的進化經驗,這些經驗也曾幫助我們學習如何在孩提時代本能地使用自己的手。OpenAI希望將來能幫助人類發展出我們只能從科幻小說中看到的類人機器人,這些機器人可以在不危及我們安全的情況下融入社會中,並在城市街道和工廠車間這樣的混亂環境中執行各種各樣的任務。

為了學習如何單手破解魔方,OpenAI沒有對Dactyl進行顯式編程來幫助其破解魔方,網際網路上的免費軟體可以幫解決這一問題。OpenAI還選擇不為機器人手的個別動作進行編程,因為該組織想讓Dactyl自己識別這些動作。取而代之的是,機器人團隊給機器人手的底層軟體設定了破解魔方的最終目標,並使用現代AI(特別是名為強化學習的基於激勵的深度學習技術)來幫助它自學如何解決問題。利用同樣的AI訓練方法,OpenAI曾開發出世界上最先進的《DOTA 2》遊戲機器人。

但直到最近,訓練AI代理做些虛擬的事情(例如玩電腦遊戲)比訓練它執行現實世界任務要容易得多。這是因為,研究人員可以加快訓練軟體在虛擬世界中做某些事情的速度,這樣AI就可以在現實世界的短短幾個月時間內接受相當於數萬年的訓練,這得益於數千個高端CPU和超強大GPU並行工作的結果。

用物理機器人進行同樣水平的訓練並執行物理任務是不可行的。這就是為何OpenAI試圖用模擬環境代替現實世界來開創機器人訓練新方法的理由,這也是機器人行業幾乎沒有嘗試過的東西。在這種情況下,該軟體可以同時在許多不同的計算機上以加速方式進行廣泛的練習,並希望它在開始控制真正的機器人時保留這些知識。

由於訓練的局限性和存在明顯的安全問題,今天商業中使用的機器人不使用AI,而是用非常具體的指令進行編程。韋林德解釋稱:「過去的方法是,你需要使用非常專業的算法來解決特定任務,你可以對機器人模型和環境進行精確操控。對於工廠機器人來說,你有非常精確的模型,而且你也確切地知道自己所處的工作環境,因此你非常了解它將如何執行特定的任務。」

這也是為何當前機器人遠沒有人類那麼多才多藝的最重要原因。人們需要大量的時間、精力和金錢來重新給特定的機器人編程,比如組裝汽車特定部件或計算機組件的機器人。沒有經過適當訓練的機器人,即使是在執行人類看起來非常簡單的任務,它都會經歷慘敗。然而,有了現代AI技術,機器人可以模仿人類,這樣它們就可以使用對世界同樣直觀的理解來做從開門到煎蛋等各種事情。至少,這是我們的夢想。

我們距離機器人能夠執行這種複雜程度的任務仍然有幾十年的距離,AI社區在軟體方面所取得的飛躍,比如自動駕駛汽車、機器翻譯和圖像識別,還沒有完全轉化為下一代機器人身上。目前,OpenAI只是試圖模仿人體某一部位的複雜性,並讓機器人的模擬操作變得更自然。

這就是為何Dactyl會被模仿人手設計成擁有24個關節機械手的原因,它與我們在工廠裡看到的機械爪或機械鉗完全不同。對於支持Dactyl學習如何以人類的方式利用所有這些關節的軟體,OpenAI嘗試在現實世界中破解魔方之前,已經在模擬環境中對其進行了數千年的訓練。

韋林德指出:「如果你正在對現實世界的機器人進行某種訓練,很明顯,你所訓練的東西都是在你想要部署算法的領域發揮作用。這樣,事情就簡單多了。但是現在的算法需要大量數據訓練。要在真實世界中訓練機器人,做任何複雜的事情,你需要多年的經驗。即使對人來說,也需要幾年的時間才能掌握人類經過數百萬年進化來的經驗,進而學會如何操控手部。」

然而,韋林德稱,在模擬中,這種訓練可以加速,就像遊戲和完成其他廣受歡迎的AI基準任務一樣。他補充說:「通常情況下,往往需要幾千年的時間來訓練算法。但在虛擬環境中,這只需要現實世界幾天的時間,因為我們可以將訓練並行化。在你訓練這些算法時,你也不必擔心機器人會破壞或傷害別人。」然而,研究人員過去在試圖讓虛擬訓練在實體機器人上工作時遇到了相當大的麻煩。OpenAI表示,它是第一批在這方面真正看到取得進展的組織之一。

當被給予真正的魔方時,Dactyl利用了自己接受的訓練,並自己解決了這個問題,並且它是在各種從未明確接受過訓練的條件下做到的。這包括戴著手套單手破解魔方,兩根手指需要緊緊夾起來,而OpenAI成員不斷地用其他物體戳它,並用氣泡和像五彩紙屑一樣的紙片不斷幹擾它。

韋林德的同事、OpenAI機器人團隊負責人馬蒂亞斯·普拉佩特(Matthias Plappert)說:「我們發現,在所有這些擾動中,機器人仍然能夠成功地轉動魔方,儘管它在訓練中沒有經歷過這些。當我們在物理機器人上嘗試這種方法時,這些發現讓我們感到驚訝。」

這就是為何OpenAI認為Dactyl新獲得的技能對於機器人硬體的發展和AI培訓至關重要的原因。即使是世界上最先進的機器人,比如由行業領軍者波士頓動力公司(Boston Dynamics)開發的人形機器人和類狗機器人,也不能自主操作,它們需要廣泛的特定任務編程和頻繁的人工幹預才能執行最基本的操作。

OpenAI表示,Dactyl朝著未來機器人邁出了一小步,這種機器人可能將來會獨立執行體力勞動或家務活,甚至可以與人類一起工作,而不僅僅是待在封閉的環境中,也無需對它們進行任何編程。在未來的願景中,機器人學習新任務和適應不斷變化環境的能力,將與AI的靈活性以及物理機器的健壯性同樣重要。普拉佩特說:「這些方法真的開始證明,這是處理我們物理世界所有固有複雜性和混亂的最佳解決方案之一。」

相關焦點

  • OpenAI的AI機器人可用單手就能還原魔方
    打開APP OpenAI的AI機器人可用單手就能還原魔方 環球網 發表於 2019-10-17 09:45:34 (文章來源:環球網
  • 機器人手首次單手還原魔方 網友:我雙手都還原不了
    機器人手首次單手還原魔方 網友:我雙手都還原不了  Emma Chou • 2019-10-16 11:33:20 來源:前瞻網 E2119G0
  • OpenAI 的機器手學會單手解魔方了,完全自學無需編程
    ,而且還原一個三階魔方全程只花了4分鐘,其靈巧程度讓人自嘆不如。你對機器手解魔方怎麼看?來新智元 AI 朋友圈與AI大咖一起參與討論吧~ 給你一個魔方,只允許使用一隻手,還時不時有人給你搗亂,你能在4分鐘內還原它嗎?我不能,兩隻手都不行。 OpenAI的仿人機器手Dactyl做到了。現在它轉魔方的視頻被瘋狂刷屏,網友紛紛表示:人工智慧機器人的一個新裡程碑誕生了!
  • 倒掛,單手,22.423秒還原魔方!
    7 月 12 日廈門雙十中學初三學生楊陳雨在中考前以 22.423 秒的成績創造了全新的" 倒掛單手還原三階魔方 "金氏世界紀錄在初二以前,楊陳雨幾乎每天都會練習魔方一到兩個小時,在 2016 年 12 月,他獲得了世界魔方協會泉州魔方公開賽三階魔方少兒組冠軍。即使學業繁忙起來,他也見縫插針地在空閒時間練習魔方,保持熟練度。楊陳雨的爸爸楊玉輝是一名警察,他說:" 我本來有點擔心,玩魔方會不會影響孩子學習,但他成績一直挺穩定的。
  • 倒掛單手還原三階魔方!廈門男生破紀錄
    楊陳雨為記者現場演示倒掛單手還原三階魔方。雙腿勾在倒掛架的橫杆上,整個人倒吊著,右手背在身後,僅用左手飛速復原一個三階魔方……7月12日,廈門雙十中學初三學生楊陳雨在中考前,以22.423秒的成績創造了全新的「倒掛單手還原三階魔方」金氏世界紀錄。前日,本報記者找到楊陳雨,了解他創造這項新金氏世界紀錄背後的故事。
  • 倒掛單手還原三階魔方 廈門初三男生破金氏世界紀錄
    雙腿勾在倒掛架的橫杆上,整個人倒吊著,右手背在身後,僅用左手飛速復原一個三階魔方……本月12日,廈門雙十中學初三學生楊陳雨在中考前,以22.423秒的成績創造了全新的「倒掛單手還原三階魔方」金氏世界紀錄。前日,本報記者找到楊陳雨,了解他創造這項新金氏世界紀錄背後的故事。
  • 倒掛單手還原三階魔方 廈門初三男生破金氏世界紀錄
    楊陳雨為記者現場演示倒掛單手還原三階魔方。楊陳雨手持金氏世界紀錄證書,與父母合影。臺海網7月27日訊 據廈門日報報導 雙腿勾在倒掛架的橫杆上,整個人倒吊著,右手背在身後,僅用左手飛速復原一個三階魔方……本月12日,廈門雙十中學初三學生楊陳雨在中考前,以22.423秒的成績創造了全新的「倒掛單手還原三階魔方」金氏世界紀錄。前日,本報記者找到楊陳雨,了解他創造這項新金氏世界紀錄背後的故事。
  • AI 能還原一個三階魔方
    一眨眼的功夫,AI 就把魔方給還原了AI solves Rubik's cube in under a second——加州大學歐文分校的研究人員編寫了一種機器學習算法,讓 AI 可以在不到一秒的時間內還原一個被打亂的三階魔方。值得一提的是,目前三階魔方還原世界記錄是由中國的杜宇生所保持的單次 3.47 秒。
  • 玩轉魔方
    DNF(棄權):即Did Not Finish指魔方復原者感覺無法在自己滿意的時間內完成魔方而棄權的情況,在比賽中可以有一次DNF。SUB的原文是「Subtraction」,意思就是「減、少於」的意思,在這裡是「在XX秒以下」的意思。例:3x3方塊SUB-30,就是指平均速度在30秒以下。
  • 研究人員開發的AI成功在1.2秒內還原三階魔方
    據外媒報導,在2018年3月,麻省理工學院學生Ben Katz和軟體開發人員Jared Di Carlo曾共同創建了機器人裝置,以0.38秒解開三階魔方。儘管魔方解開技術的最新重大進展並沒有導致比Katz和Di Carlo更快的解開時間,但由於其他原因,這可能更有趣。
  • AI Dota2雖完虐人類卻弱點頻現 | OpenAI Five親測報告
    比賽中有很多亮眼和極限操作,比如死血冰女果斷開大反殺兩人,家常便飯一樣的吹風/BKB 躲先手,走走停停的暗影護符卡視野等等,頂級人類玩家都未必能保證 100% 做到。除了驚訝於 AI 的進步速度,Dota 社區有很多聲音認為 OG 只是「隨便玩玩,沒認真打」,而 OpenAI 隨後推出的競技場模式,就像是一封 AI 遞給人類的戰書,上書四個大字:You Can You Up。
  • 稱霸圍棋、單手解魔方,零數據的強化學習,還能走多遠?
    解決魔方問題:Dactyl的故事強化學習的主要應用領域之一是機器人技術:一個機器學習模型是需要學習在真實的物理環境中如何執行的領域。從自動駕駛汽車到工業機械臂,這些環境由兩個特性結合在一起。同時,像AlphaZero一樣直接使用強化學習是不可能的,因為機器人無法奢侈的花費數千年實際訓練。因此,需要將合成虛擬環境用於機器人技術,使得數百萬次訓練事實上成為可能。
  • 怎樣還原三階魔方
    大家好,在這裡和大家分享一下魔方還原的方法,時間關係就直接開門見山了。三階魔方入門玩法,又叫層先法或七步法。該方法只要7個大的步驟就可以還原。分別是:第一步:小花變十字第二步:白色一層第三步:兩層完成第四步:黃色十字第五步:黃色面完成第六步:四雙眼睛第七步:六面還原
  • 魔方還原不是事,計客魔方讓小白也能變高手
    之前我就對魔方著迷過,不過因為總是還原不了就放棄了。這次剛好疫情宅在家裡,孩子買了個GiiKER計客超級魔方i2,沒想到我一天不到就把這個二階魔方玩溜了。GiiKER計客超級魔方i2(以下簡稱計客魔方)是一款全新的智能魔方,通過APP可以自動識別魔方的狀態,並教你快速完成魔方的還原,下面我們就來認識一下這個計客魔方。
  • OpenAI追蹤AI模型效率:每16個月翻一番!超越摩爾定律
    OpenAI表示:「行業領袖、決策者、經濟學家和研究人員都在努力更好地了解AI的發展進步,並決定他們應該投入多少注意力,以及把注意力放在哪裡。測量工作可以幫助做出這樣的決定。」論文研究指出,研究者觀察到硬體和算法的效率在有意義的範圍內提高了一倍,這表明,一個好的AI進展模型應該整合兩者的度量。
  • 機器人猜拳打球玩魔方,樣樣精通,人類如何面對他們呢
    不管人手如何變化,機器總是快人一步魔方機器人這並不是一個長得像模仿的機器人,而且是一個會玩魔方的機器人。相信看過最強大腦的同學都被各種模仿達人震驚到了。這個魔方機器人也毫不遜色,魔方機器人首先用攝像頭錄入魔方色塊的方位信息,然後系統給出解法並指導機器手臂進行動作。人類破解魔方的世界最快紀錄是4.59秒,手指已經快到看不清了。而來自麻省理工的兩位研究生發明的魔方機器人,破解還原魔方僅需0.38秒,這也是得益於它所搭載的更高功率的馬達。
  • 金字塔魔方的還原方法
    金字塔魔方是一種四面體異形魔方,還原方法比起三階魔方要簡單許多,所以建議新手可以先從還原金字塔魔方開始學起。當然如果你已經掌握了三階魔方的還原要領,那麼金字塔魔方就更是不在話下了。金字塔魔方本身沒有什麼公式,純靠理解,為了方便初學者理解,硬給出了以下「公式」。
  • 輕鬆還原智能教學,小米智能魔方讓你秒變高手
    對於年紀偏小的孩子,或者是魔方初學者,想要完成複雜的變化無疑是非常困難的,別說是孩子不少成年人對於三階魔方的還原能力都非常有限。為了培養孩子的動手能力,也讓孩子在學習中能獲得更好的動手能力,我為孩子的選擇就是這樣一款趣味十足的小米智能魔方。產品的包裝簡簡單單透明的包裝塑封設計,可以一目了然地看到魔方產品。包裝上帶有簡單的說明以及小米品牌標示。
  • 三階魔方還原圖文教程-番茄魔方
    本課程為三階魔方最常用的初級解法,也就是大家所說的層先法。課程中詳細地講解了每一步所需要用到的公式和所遇到的各種情況,非常適合新手學習。註: 魔方不是一面一面去還原的,而是一層一層的去還原!!!!簡介下魔方的還原過程①建立底層十字②還原第一層③還原第二層稜塊④建立頂層十字⑤構建頂層完整頂層⑥還原頂層角塊⑦還原頂層稜塊(還原魔方)公式字母表示F- Front 前面,你正對的一面B- Back 後面,背對你,(你看不到)的那一面R- Right 左側面L- Left 右側面U- Up 頂面D -Down 底面魔方的稜塊、角塊和中心塊稜塊是帶有兩個顏色的角塊是帶有三個顏色的中心塊是面上最中心的塊
  • 真正的「魔方大師」來了!AI可以在20步內解開魔方
    (2018年4月10日星期二,在美國喬治亞州亞特蘭大市,魔方創作者埃爾諾·魯比克(Erno Rubik)正在籤名。出生於匈牙利的魯比克於1974年創造了這個五彩魔方,據估計,自此魔方在全世界已經售出了4億件。)