機器人在各種比賽中與人類競賽的新聞早已屢見不鮮,例如前幾年的AlphaGo,在圍棋人機大戰中戰勝了職業九段棋手。
最近,科學家們又把目光放在了「冰上圍棋」冰壺比賽上。Science的子刊《ScienceRobot》近日發表了一項研究,來自韓國和柏林的研究人員團隊開發了一個名叫Curly的AI機器人,專為冰壺運動而生。它剛剛學會了冰壺運動的技巧,就以3:1的成績打敗了兩個專業的韓國冰壺國家隊。
在冰壺比賽中,運動員需要把對方的壺擊走,並把自己隊的壺留在比賽場地的圓心中,即所謂的大本營中,最終大本營中哪一方的冰壺數量多,更靠近中心點,哪一方得分就高。冰壺表面上看起來很簡單,但其實它是一項頗具技巧性和策略性的運動,運動員需要通過估測角度和力度來讓重量達到38斤的冰壺經過重重阻撓移動到對方的指定區域內,在這個過程中,還需要不斷的刷冰,阻止冰壺減速或改變壺的行進方向,配合著貫穿場館的喊叫聲。總的來說,冰壺這項運動既需要腦力,又需要體力,但對於機器人Curly來說,這些都不成問題。
來看看AI人機大戰的精彩瞬間:
由Curly發球,它先伸長脖子觀察了下地形:
「智能大腦」默默計算最佳投擲路徑:
把脖子縮進去,進入投擲模式:
好球!精準的把對手的冰壺趕出了大本營:
另一方的專業運動員也不甘示弱,小姐姐以標準的姿勢投擲了黃色冰壺:
人機大戰非常激烈,最後,Curly還是以3:1的成績取得了勝利。有沒有發現比賽缺少了一個靈魂環節——刷冰。沒錯,Curly機器人的主要任務是投擲冰球,還未開發出與其配合的擦冰機器人,相信未來會有機器人充當該角色。
Curly實際上由兩個相同的機器人,以不同的模式操作,一個機器人觀察得分位置,另一個負責投擲冰壺。
每個機器人都配備了視頻分析,數據通信和包括牽引力控制的投擲控制模塊。投擲者Curly在冰蓋上實施基於AI的策略,握住並旋轉冰壺,使其加速,然後以適當的速度和角度將其從抓斗中釋放出來。觀察者Curly可以通過使用圖像處理技術來識別所有冰壺的坐標和軌跡。
機器人的整體結構有點像一隻鴕鳥,在身體和「脖子」上都安裝了攝像頭,通過昂起「脖子」將攝像頭抬起或放下。在觀察者模式下,機器人可以抬起頭部來識別冰壺。在投擲者模式下,脖子上的頭部攝像頭用於檢測機器人本身的位置(定位),而身體攝像頭則用於檢測投擲位置。
考慮到人類在冰上行走已經夠困難了,更不用說機器人了。研究人員給Curly添加了輪子。兩個前輪連接到兩個無刷直流電動機並用作驅動輪,而後輪是僅支撐車身的腳輪。Curly的抓取器由兩個電機組成:一個用於抓取和釋放冰壺,另一個通過皮帶旋轉冰壺,使冰壺轉著圈的被投擲出去,無需任何外部安裝或電纜即可執行冰壺運動。
研究人員在虛擬模擬器環境中對冰壺和冰面進行了模擬,基於這些數據訓練了Curly的人工智慧系統。但實際上,每次投擲冰壺時,冰的摩擦力都會發生變化,這使比賽時的外部因素變得不可預測。為了解決這個問題,研究人員考慮Curly必須具有在現實世界中實時的動態觀察和決策能力。
深度強化學習是達到該目的的有效方法,和有監督學習類似,強化學習也有訓練過程,需要不斷的執行動作,觀察執行動作後的效果,積累經驗形成一個模型。基於該模型, Curly在每局比賽開始前需要擲壺一次,來了解冰面光滑程度等的情況,然後在比賽過程中,利用冰壺目標和到達位置之間的過去距離差距來學習環境的潛在動態變化,一邊糾正自身錯誤一邊進行改進。
Curly的操作分為四個步驟:
基於深度強化學習, AlphaGo完勝人類;OpenAI開發的Dota Five在遊戲中達到了人類玩家的頂級水平。在過去的二十年中,AI一次又一次的趕超人類。通過不斷學習將它們未來也許會變得更加強大。