「冰上圍棋」機器人再次戰勝人類,冰壺AI人機大戰速來圍觀

2020-10-14 機器人大講堂

機器人在各種比賽中與人類競賽的新聞早已屢見不鮮,例如前幾年的AlphaGo,在圍棋人機大戰中戰勝了職業九段棋手。

最近,科學家們又把目光放在了「冰上圍棋」冰壺比賽上。Science的子刊《ScienceRobot》近日發表了一項研究,來自韓國和柏林的研究人員團隊開發了一個名叫Curly的AI機器人,專為冰壺運動而生。它剛剛學會了冰壺運動的技巧,就以3:1的成績打敗了兩個專業的韓國冰壺國家隊。

在冰壺比賽中,運動員需要把對方的壺擊走,並把自己隊的壺留在比賽場地的圓心中,即所謂的大本營中,最終大本營中哪一方的冰壺數量多,更靠近中心點,哪一方得分就高。冰壺表面上看起來很簡單,但其實它是一項頗具技巧性和策略性的運動,運動員需要通過估測角度和力度來讓重量達到38斤的冰壺經過重重阻撓移動到對方的指定區域內,在這個過程中,還需要不斷的刷冰,阻止冰壺減速或改變壺的行進方向,配合著貫穿場館的喊叫聲。總的來說,冰壺這項運動既需要腦力,又需要體力,但對於機器人Curly來說,這些都不成問題。

冰壺AI人機大戰

來看看AI人機大戰的精彩瞬間:

由Curly發球,它先伸長脖子觀察了下地形:

「智能大腦」默默計算最佳投擲路徑:

把脖子縮進去,進入投擲模式:

好球!精準的把對手的冰壺趕出了大本營:

另一方的專業運動員也不甘示弱,小姐姐以標準的姿勢投擲了黃色冰壺:

人機大戰非常激烈,最後,Curly還是以3:1的成績取得了勝利。有沒有發現比賽缺少了一個靈魂環節——刷冰。沒錯,Curly機器人的主要任務是投擲冰球,還未開發出與其配合的擦冰機器人,相信未來會有機器人充當該角色。

Curly機器人的組成結構

Curly實際上由兩個相同的機器人,以不同的模式操作,一個機器人觀察得分位置,另一個負責投擲冰壺。

每個機器人都配備了視頻分析,數據通信和包括牽引力控制的投擲控制模塊。投擲者Curly在冰蓋上實施基於AI的策略,握住並旋轉冰壺,使其加速,然後以適當的速度和角度將其從抓斗中釋放出來。觀察者Curly可以通過使用圖像處理技術來識別所有冰壺的坐標和軌跡。

機器人的整體結構有點像一隻鴕鳥,在身體和「脖子」上都安裝了攝像頭,通過昂起「脖子」將攝像頭抬起或放下。在觀察者模式下,機器人可以抬起頭部來識別冰壺。在投擲者模式下,脖子上的頭部攝像頭用於檢測機器人本身的位置(定位),而身體攝像頭則用於檢測投擲位置。

考慮到人類在冰上行走已經夠困難了,更不用說機器人了。研究人員給Curly添加了輪子。兩個前輪連接到兩個無刷直流電動機並用作驅動輪,而後輪是僅支撐車身的腳輪。Curly的抓取器由兩個電機組成:一個用於抓取和釋放冰壺,另一個通過皮帶旋轉冰壺,使冰壺轉著圈的被投擲出去,無需任何外部安裝或電纜即可執行冰壺運動。

Curly取勝的關鍵——深度強化學習

研究人員在虛擬模擬器環境中對冰壺和冰面進行了模擬,基於這些數據訓練了Curly的人工智慧系統。但實際上,每次投擲冰壺時,冰的摩擦力都會發生變化,這使比賽時的外部因素變得不可預測。為了解決這個問題,研究人員考慮Curly必須具有在現實世界中實時的動態觀察和決策能力。

深度強化學習是達到該目的的有效方法,和有監督學習類似,強化學習也有訓練過程,需要不斷的執行動作,觀察執行動作後的效果,積累經驗形成一個模型。基於該模型, Curly在每局比賽開始前需要擲壺一次,來了解冰面光滑程度等的情況,然後在比賽過程中,利用冰壺目標和到達位置之間的過去距離差距來學習環境的潛在動態變化,一邊糾正自身錯誤一邊進行改進。

Curly的操作分為四個步驟:

  1. 觀察者Curly通過主動視覺識別冰壺的坐標,並將其傳遞給AI Curly。
  2. 在收到具有坐標的冰壺當前狀態之後,AI Curly在包含不確定性的冰壺模擬器環境中計算最佳擲球策略,例如速度,角度和捲曲的方向等,並將其傳輸至深度強化學習模型。
  3. 深度強化學習模型將各種不確定性因素納入實際冰壺參數估計中,基於模型計算對AI Curly提供的坐標的適應性,將拋出參數發送給投擲者Curly。
  4. 投擲者Curly精確地將實際的冰壺與AI接收到的參數一起送出,在完成 一個回合之後,再次採取戰略行動。

基於深度強化學習, AlphaGo完勝人類;OpenAI開發的Dota Five在遊戲中達到了人類玩家的頂級水平。在過去的二十年中,AI一次又一次的趕超人類。通過不斷學習將它們未來也許會變得更加強大。

相關焦點

  • AI又一次戰勝了人類——這次是在冰壺上丨一周科技
    人工智慧機器人要進軍冰上運動了?來看看它們如何打冰壺吧。潛水記錄 同樣是哺乳動物,大部分人類屏氣堅持不過幾分鐘,而柯氏喙鯨則能一口氣潛水3小時42分鐘之久——這是海洋哺乳動物潛水時長的新紀錄。人機冰壺賽 人工智慧控制的機器人學會了玩冰壺,而且它們擲冰壺的水平達到了專業水準。機器人擲出冰壺 | Korea University這是冰壺機器人「Curly」,它其實是由兩個機器人與AI系統組成的團隊:一個機器人負責擲出冰壺,同時另一個則負責觀察賽場。控制機器人的人工智慧系統首先在虛擬模型中進行訓練,接下來再通過比賽前的實際測試進行修正。
  • 各方熱議"圍棋人機大戰" 柯潔:AlphaGo贏不了我
    各方熱議"圍棋人機大戰" 柯潔:AlphaGo贏不了我 2016-03-09 17:13:08  儘管李世石首戰告負,但是柯潔依舊信心滿滿,他微博中簡短的一句話充滿了霸氣,「就算阿法狗戰勝了李世石,但它贏不了我」。而足球評論員黃健翔也在微博中表示,「什麼時候機器人足球隊可以踢贏歐冠冠軍?」董路也在微博中「起鬨」道,「人機大戰,李世石第一盤輸了,我看了棋譜,個人覺得:李世石第48手『炮六進三』過於激進,而第64手炸彈沒有果斷炸掉對方軍長,失去了最後的機會…有點可惜!」
  • 圍棋人機大戰第二季4月烏鎮開打,中國柯潔將挑戰阿爾法狗
    圍棋人機大戰第二季4月烏鎮開打,中國柯潔將挑戰阿爾法狗 自去年李世石挑戰阿爾法狗失敗後,人類一直期待當今圍棋第一人柯潔與阿爾法狗進行一場終極較量。
  • 圍棋「人機大戰」李世石首次勝利
    圍棋「人機大戰」李世石首次勝利 2016-03-13 22:53:37來源:中國新聞網作者:${中新記者姓名}責任編輯:     3月13日,李世石與谷歌圍棋AlphaGo人機五局大戰第四局
  • 從Master到百度《最強大腦》人機大戰:AI成坊間話題意味著什麼?
    並且它還在夜以繼日的學習改進,而人類棋手則要吃飯、睡覺和過日子,再結合可無限擴展的計算集群,在圍棋這件事情上,人類再也不會有機會趕超Master了——今天如果有人要去跟Excel表比拼數據處理能力尤其是加減乘除這類函數計算,恐怕會被視作是大戰風車的堂吉訶德。在圍棋這件事情上的人機大戰已經結束。
  • 李世石VS谷歌阿爾法圍棋人機大戰第五場完整棋譜步驟分析(圖)
    這也很正常,此前,當人類認為谷歌(微博)AlphaGo不可能這麼快就戰勝人類頂尖棋手時,結局是3:0;當人類認為AlphaGo高維打低維,輕鬆碾壓人類時,李世石扳回一局1:3。  這場比賽無法再製造足夠的意外,也無關最終勝負,而在經歷前面四場考驗後,李世石逐漸也摸索出應對AlphaGo的一套思路,心裡壓力降低很多,能相對自如冷靜的應對比賽。
  • 阿爾法狗大勝「人機大戰」後,有圈內人士擔心圍棋會走下坡路
    一場「全球圍棋盛宴」 國人應珍視傳統文化多年後,當人類回憶「人機大戰」的歷史,「深藍」PK「西洋棋」將是開山鼻祖,「阿爾法圍棋」PK「圍棋」無疑是第一次高潮。一周以來,「人機大戰」吸引了全球範圍的網絡直播,數億人次關注,「人工智慧」和「圍棋話題」佔據各大媒體頭條。
  • 李世石阿爾法狗人機大戰正式收官 勝負卻已不再重要
    ,最終以李世石認輸告終,這場備受關注的人機大戰的最終比分就此定格在1:4,這個比分如果在賽前肯定是很多人都不敢想的,然而現在面對這個比分,我們也許多少會有些不服,但也會稍感慶幸。最早引起大家注意的事件應該就是阿爾法狗5:0橫掃歐洲圍棋冠軍樊輝了,該事件一經曝出立馬引起了社會各界的廣泛討論。在不少人眼裡人工智慧已經可以在圍棋方面戰勝人類高手的確是出乎不少人的意料,最起碼在1997年當深藍戰勝西洋棋大師之後,人們認為人工智慧想要戰勝算法已經超過全宇宙量子數量的圍棋是不可能的。
  • 「人機大戰」收官:「阿爾法圍棋」4勝李世石
    中新社首爾3月15日電 (記者 吳旭)「形勢很微妙,估計要到最後數目」、「李世石還是過於求穩」……15日下午,在首爾鍾路的「人機大戰」觀戰區,上百名來自世界各地的棋手、媒體和「圍棋迷」們聚集在一起討論棋局,分析局勢。「我嚇了一跳,走到哪裡都是和棋有關的人。」在觀戰區的中國棋手芮乃偉九段這樣形容自己的感受,「感到現場熱氣騰騰的。」
  • 圍棋人機大戰一周年:被AlphaGo改變的世界
    在圍棋的人機大戰中,頂級人類選手完敗給人工智慧。人工智慧一戰成名,李世乭留下落寞側影。為AlphaGo落子的黃士傑一年後回憶說:「當時我代表AlphaGo下棋,必須保持冷靜」。從那時起到現在,人類始終生活在一個被AlphaGo改變的世界。一年回望站在圍棋人機大戰一周年的節點上,該如何回顧過去、展望未來呢?
  • 從深藍到阿爾法狗 人機大戰進化了什麼?
    」 筆者不想求李世石現在的心理陰影面積,因為筆者很認同谷歌董事長施密特在賽前說過的一句話,「輸贏都是人類的勝利!因為正是人類的努力才讓人工智慧有了現在的突破。」  雖然2:0的結果會讓很多期待李世石扳回一城的人黯然神傷,更有可能會讓「機器人威脅論」再次甚囂塵上。
  • 最終一戰柯潔再負AlphaGo,此後再無圍棋人機大戰
    經過209手的博弈,主動要求執白的柯潔再次負於AlphaGo。在這場人機大戰中,世界圍棋第一人0:3完敗於圍棋人工智慧。全程回顧上午10:30,聶衛平宣布比賽正式開始。棋聖也略顯緊張,一開始忘了拿起麥克風,宣布規則時又說成黑棋貼2¾子。耗時1分05秒,執黑的AlphaGo第一手下在棋盤的右下角。又是一個不合「禮儀」的開頭。
  • 2016圍棋人機大戰第3局(第三場)比賽 騰訊視頻重播回放
    北京時間3月12日下午消息,谷歌人工智慧AlphaGo與韓國棋手李世石今日進行了第三場較量,最終AlphaGo戰勝李世石,連續取得三場勝利。接下來兩場將淪為李世石的「榮譽之戰」。  根據之前的約定,谷歌獲勝後將獲得「自己的」100萬獎金,這些獎金將捐贈給聯合國兒童基金會(UNICEF)、STEM教育以及圍棋慈善機構(Go Charity)。值得一提的是,李世石雖然以0:3宣告失敗,但仍需要和AlphaGo下完剩餘兩場。剩餘2場比賽將分別在13日(周日)、15日 (周二)的北京時間中午12點進行。
  • 圍棋人機大戰第二局:柯潔中盤失誤認輸
    今天,備受關注的「圍棋人機大戰」展開第二局圍棋對決。中國棋手柯潔與AlphaGo繼續交鋒,比賽從今天上午10:30開始,一直持續到1時許,最終比賽以柯潔中盤認輸而結束。此局比賽中,柯潔執白子,AlphaGo執黑子。
  • 圍棋人機大戰第二季柯潔VS阿爾法狗AlphaGo比賽時間地點
    柯潔是中國圍棋職業九段棋手,他也是圍棋等級分排名世界第一。  此次人機終極大戰中,代表人類出戰的是目前排名世界第一的職業圍棋九段選手柯潔,而代表機器一方的則是AlphaGo的2.0版本。區別於和李世石對戰的AlphaGo1.0,這次對戰柯潔的AlphaGo2.0採用了新的算法模型。此前,該版本曾化名Master,以在線對弈的形式擊敗了包括柯潔在內的所有選手,60戰而無一敗。
  • 境外媒體:人機大戰AlphaGO再勝李世石 連贏兩局
    參考消息網3月10日報導 韓聯社最新消息稱,圍棋人機大戰李世石連輸兩局。代表人類參加谷歌DeepMind圍棋挑戰賽的李世石九段在3月10日與人工智慧程序「阿爾法圍棋(AlphaGo)」的第二局對弈中執白211手認輸。
  • 圍棋:從「堯造」的遊戲到「人類的智力競技高地」
    中新網3月11日電(宋宇晟) 北京時間3月10日16時27分,谷歌旗下人工智慧公司DeepMind開發的智能系統AlphaGo(阿爾法圍棋)和韓國職業圍棋選手李世石九段的第二場比賽結束。擁有14個世界冠軍頭銜的李世石再次輸掉了比賽。  人類棋手兩次敗北,這讓不少人都開始重新審視人與機器的關係。
  • 人機大戰兩周年紀念:阿爾法狗揭開圍棋新時代序幕
    無論是對圍棋領域的影響,還是對人工智慧領域的影響,又或是論及廣泛的傳播性和帶給公眾的震撼,均是第一次人機大戰(即AlphaGo vs 李世石)的五番棋更大。   不知不覺中,第一次人機大戰已經過去兩年整了。
  • 人機大戰比賽規則+交手記錄資料
    人機大戰比賽規則+交手記錄資料。人腦VS電腦,大戰在即,作為人類的你,必須知道以下幾件事。  曾經,「深藍」與卡斯帕羅夫的西洋棋人機大戰令全球關注,人類在西洋棋領域被AI擊敗。在東方,圍棋這個古老的智力遊戲始終沒有被AI攻破,直到谷歌研發的新計算機圍棋軟體「阿爾法圍棋(AlphaGo)」在去年擊敗歐洲冠軍樊麾。
  • 圍棋人機大戰柯潔哭了 機器卻沒有笑
    新華社發  浙江在線5月28日訊(浙江在線記者 張峰)5月27日,人機大戰的最後一局在烏鎮開始,要求再次執白的柯潔沒有創造奇蹟,在行棋至209手時,柯潔將兩顆棋子擺上棋盤,向裁判表示投子認輸。至此,人機大戰第二季以柯潔0:3被人工智慧AlphaGo橫掃告終。