AlphaZero:棋類遊戲的「終結者」

2021-03-06 煎蛋

谷歌旗下AI開發部門DeepMind的作品登上了最新一期的《Science》雜誌的封面。AlphaZero在圍棋和日本將棋領域裡超越了人類之後,又從無到有地重新挖掘出了西洋棋的正確下法。研究人員公布了通用算法和測試數據。

2017年末,我們推出了AlphaZero,這是一個獨立的系統,從頭開始自行學習西洋棋、將棋(日本版的西洋棋)和圍棋,最終在每個領域內擊敗世界冠軍程序。我們對初步結果感到非常興奮,並很高興看到西洋棋界的回應,他們在AlphaZero的棋譜中看到了一種突破性的、高度動態的和「非傳統的」行棋風格,與之前的任何西洋棋遊戲引擎不同。

今天,我們非常開心能夠向公眾發布AlphaZero的完整評估。報告發表在Science(開放訪問版本)雜誌上。該期刊確認了這些初步結果。它描述了AlphaZero如何快速學習每個遊戲,成為歷史上最強大的玩家,從隨機遊戲開始自我訓練,沒有內置任何知識,唯一需要預先輸入的就是遊戲的基本規則。

西洋棋世界冠軍Garry Kasparov卡斯帕羅夫也在《科學》上撰文表示,「我無法掩飾自己的滿足感,它充滿了非常有活力的風格,就像我一樣!」。他指出,這種從頭開始每個遊戲的能力,不受人類遊戲規範的約束,產生了獨特的、非正統的、但具有創造性和動態的遊戲風格。AlphaZero的棋風可能更接近本源。「它以一種深刻而有用的方式超越了人類。」

西洋棋大師Matthew Sadle和女性國際大師Natasha Regan已經分析了AlphaZero數以千計的棋譜。Matthew指出,它的風格不同於任何傳統的西洋棋引擎。「這就像在翻閱過去一些偉大棋手的秘籍。」

傳統的西洋棋引擎——包括世界計算機西洋棋冠軍Stockfish和IBM突破性的Deep Blue——依賴於數千個由強大的人類玩家手工編制的規則和啟發式算法,試圖解讀遊戲中的每一種可能性。 Shogi程序也是針對於特定遊戲的,使用與西洋棋程序類似的搜尋引擎和算法。

AlphaZero採用了一種完全不同的方法,用深度神經網絡和通用算法取代了這些手工製作的規則,這些算法對基本遊戲規則之外的東西一無所知。


論文中舉例的決策樹

西洋棋:AlphaZero訓練4小時就超越了世界冠軍程序Stockfish;

日本將棋:AlphaZero訓練2小時就超越了世界冠軍程序Elmo;

圍棋:AlphaZero訓練30小時就超越了傳奇性的AlphaGo。

為了掌握每一種遊戲,未經訓練的神經網絡通過被稱為強化學習的試錯過程自我對弈數百萬盤。起初,它完全隨機落子,但隨著時間的推移,系統從每一盤的勝負得失中吸取經驗,調整神經網絡的參數,選擇出更加正確的一步。網絡需要的訓練量取決於遊戲的風格和複雜程度,西洋棋大約需要9個小時,將棋大約需要12個小時,圍棋則用了13天。

AlphaZero能夠掌握三種不同的複雜遊戲——或許應該說是,任何開放信息的遊戲——是走向最終實際應用的重要一步。它表明單個算法可以僅僅從最基本的規則中,發展出一整套超越人類千年積累的知識體系。而且,儘管還處於早期階段,AlphaZero的創意見解加上我們在AlphaFold等其他項目中看到的令人鼓舞的結果,讓我們對完成創建通用學習系統的使命充滿信心。我們可以用它來解決最重要和最複雜的科學問題。

本文譯自 deepmind,由譯者 majer 基於創作共用協議(BY-NC)發布。

相關焦點

  • AlphaZero登上Science封面:從小白開始制霸多個遊戲
    儘管 AlphaZero 是從隨機遊戲開始訓練,並且只知道基本的遊戲規則,沒有內置專業知識,這一份評估與論文描述了 AlphaZero 如何快速學習每種棋類遊戲並成為最強玩家。前西洋棋世界冠軍 Garry Kasparov 評價道:我無法掩飾對它的欣賞,它下棋的風格靈活多變,和我很像!
  • 【重磅】AlphaZero煉成最強通用棋類AI,DeepMind強化學習算法8小時完爆人類棋類遊戲
    其中,DeepMind團隊描述了一個通用棋類AI「AlphaZero」,在不同棋類遊戲中,戰勝了所有對手,而這些對手都是各自領域的頂級AI:其中,Stockfish是世界上最強的西洋棋引擎之一,它比最好的人類西洋棋大師還要強大得多。與大多數西洋棋引擎不同,Stockfish是開源的(GPL license)。
  • AlphaZero登上《科學》封面:一個算法「通殺」三大棋,完整論文首次發布
    論文描述了AlphaZero如何快速學習每個遊戲,如何從隨機對弈開始訓練,在沒有先驗知識、只知道基本規則的情況下,成為史上最強大的棋類人工智慧。《科學》雜誌評價稱,能夠解決多個複雜問題的單一算法,是創建通用機器學習系統,解決實際問題的重要一步。
  • 《騎馬與砍殺2》棋類遊戲怎麼玩 各國棋類遊戲玩法規則詳解
    導 讀 關於騎馬與砍殺2這款遊戲中有著很多的玩法,本期我們來介紹一下在遊戲中的各國棋類遊戲玩法介紹,下面我們來看看由
  • AlphaZero登上《科學》封面:一個算法通吃三大棋類
    彼時DeepMind表示,棋類AI的算法主要基於複雜的枚舉,同時需要人工進行評估,人們在過去幾十年內已經將這種方法做到極致了。而AlphaGo Zero在圍棋中的超人表現,則是通過與自己下棋練習出來的。
  • 【寶玩】親子時光——棋類遊戲
    五子棋,是一種兩人對弈的純策略型棋類遊戲。5子連線即可分勝負。作為是世界智力運動會競技項目之一,五子棋最早可追溯到中國上古時代的傳統黑白棋時期。圍棋和五子棋是棋具完全相同的另一種策略性的兩人棋類遊戲。起源於中國,傳為帝堯所作,春秋戰國時期即有記載。隋唐時經朝鮮傳入日本,流傳到歐美各國。是世界上最複雜的棋盤遊戲。
  • 岱嶽區實驗幼兒園開展多種棋類遊戲區域活動
    齊魯晚報齊魯壹點 記者 江煥冉 通訊員 李雲濤愛遊戲是幼兒的天性。兒童通過遊戲,非常簡單,非常容易的去認識周圍世界。為了深入貫徹《3-6歲兒童學習與發展指南》精神,岱嶽區實驗幼兒園大三班因地制宜的開展豐富多彩、形式多樣的棋類遊戲,包括兩子棋、四子棋、五子棋、六子棋、種種子。豐富多彩的棋類遊戲不僅培養了幼兒的邏輯思維能力和想像力,提高了思維的敏捷性、嚴密性,而且發展了幼兒的交往能力、培養了幼兒專注等良好品質。
  • 最強通用棋類AI,AlphaZero強化學習算法解讀
    本文將會帶你使用AlphaZero來解決一個益智小遊戲(Dots and Boxes)並將其部署成一個純JavaScript構建的Web應用。AlphaZero最關鍵也是最令人詫異的一點,就是其能夠在不依賴於外部先驗知識的情況下在棋盤類遊戲中獲得超越人類的表現。AlphaZero通過自我博弈汲取經驗知識來不斷精通遊戲。
  • 幼兒園益智棋類遊戲玩教具推薦
    購mai鏈jie 付致這行話 (SY4B1kilSus) 轉移至淘宀┡ē,【【布好玩_棋牌遊戲】幼兒園益智區黑白棋/動物棋/五子棋遊戲規則
  • 盤點|那些你不知道的VR棋類、球類遊戲大集合
    那麼,今天P君就給各位小夥伴們介紹一下VR遊戲圈都出了哪些有趣的VR棋類、球類遊戲吧~不知道各位小夥伴們有沒有關注前段時間爆火的網劇《棋魂》,反正那段時間P君是沒少被朋友圈的小夥伴們安利,就連P君老闆也被種草了這部劇。 雖然《棋魂》已結局,但是棋魂VR互動遊戲留住了劇中的美好片段。
  • 《紛爭終結者》遊戲背景是什麼 遊戲背景設定內...
    人們稱它們為紛爭終結者。故事從這個城市開始。 作為回合戰棋的 SRPG遊戲。紛爭終結者的所有角色都... 在沒有辦法擁有軍隊的自由貿易城市巴赫拉,為了控制日益增長的犯罪,允許民間解決人員進行調查和逮捕。人們稱它們為紛爭終結者。故事從這個城市開始。
  • 如何藉助棋類遊戲擴展人工智慧極限?
    樊麾在接受機器之心專訪時所言:「它(AlphaGo )就像一堵牆」在「這堵牆」面前,或許我們不應該再去糾結人類是否能夠在圍棋(或者棋類遊戲)上打敗機器。所以,在AlphaGo與李世石的對戰背後,有一個更深層次的問題值得我們思考:為什麼棋類遊戲對於人工智慧如此重要?
  • 阿諾主演《終結者》改編遊戲計劃曝光 忠於電影
    阿諾主演《終結者》改編遊戲計劃曝光 忠於電影  今年7月中旬,總部設在英國的遊戲開發商Reef Entertainment首次公布了基於《第一滴血1、2、3》電影劇情改編的同名視頻遊戲預告。
  • 史上最好的十大棋類遊戲
    儘管我們生活在一個注意力短暫、不斷變化的網路遊戲以迎合當今這代人的世界,但有一件事永遠不會變得無聊。這就是棋盤遊戲!我保證你們每個人都至少玩過這些最暢銷的桌面遊戲中的一款,其中一些已經賣出了數百萬份,在全世界有數十億人玩過。看看這十大棋盤遊戲。
  • 騎馬與砍殺2各國棋類遊戲怎麼玩 下棋怎麼玩
    關於騎馬與砍殺2這款遊戲中有著很多的玩法,本期我們來介紹一下在遊戲中的各國棋類遊戲玩法介紹,下面我們來看看由「斯瓦迪亞騎士
  • 中華傳統文化——棋類
    中華文化上下五千年歷史悠久底蘊深厚流傳下很多傳統文化,下面讓我們一起了解一下中華傳統文化之一的棋類。中國傳統棋類有:圍棋、象棋 、五子棋、六子衝、對角棋、八卦棋。圍棋也被認為是世界上最複雜的棋盤遊戲。象棋中國象棋起源於戰國時期。《楚辭·招魂》中 就對其形制以及玩樂方法作過專門記載:「蓖蔽象棋,有六簿些;分營並進,道相迫些;成梟而牟,呼五白些。」意思是說,用玉石(即蓖)做成的相當於骰子。象棋,亦作「象碁」,漢族棋類益智遊戲,象棋在中國有著三千多年的歷史,屬於二人對抗性遊戲的一種。
  • 《紛爭終結者:被遺棄的孩子們》好玩嗎 遊戲特色玩法介紹
    《紛爭終結者:被遺棄的孩子們》是一款回合制SRPG遊戲,遊戲中包含了600多種天賦和200多附加天賦,下邊就給大家帶來紛爭終結者被遺棄的孩子們的遊戲特色玩法介紹,大家可以來看一看。遊戲特色玩法介紹SRPG所有可想像到的。紛爭終結者: 被遺棄的孩子們以回合戰棋的 SRPG遊戲,紛爭終結者的背景下進行的第一個故事。
  • 蒙古族棋類
    蒙古族棋類作者:魏鐸          蒙古族棋類是草原牧民十分喜愛的一種智力遊戲,平時茶餘飯後,牧民的蒙古包裡就會擺開棋盤相互對弈,藉以提神醒腦,消遣娛樂,增添寂寞時光中的生活情趣。       蒙古族象棋與西洋棋同出一源,最早是古代印度的一種四人遊戲,大約在800年前成吉思汗西徵時,首先在蒙古貴族中流行起來,後來幾經演變,最終形成了蒙古族象棋特有的規則和棋路。蒙古族象棋與西洋棋的棋盤完全一樣,正方形的棋盤上有縱橫8個方格,分為深淺兩種顏色。下棋雙方各有16枚棋子,並用木頭雕刻成立體造型。
  • 韓國獨立遊戲《紛爭終結者》開啟搶先體驗 支持簡中
    近日,由6個韓國人做的獨立戰旗遊戲《紛爭終結者: 被遺棄的孩子們》在Steam開啟搶先體驗,遊戲支持簡中,感興趣的玩家可以關注一下。  《紛爭終結者: 被遺棄的孩子們》由韓國獨立遊戲工作室Dandylion開發,遊戲講述了在架空歷史下,一群青年組成平民團體「紛爭終結者」(Troubleshooter)打擊犯罪的故事。
  • 下圍棋so easy,AlphaZero開始玩量子計算!
    為了獲勝,AlphaZero有一個功能叫做蒙特卡洛樹搜索,這種方法能夠幫助它在遊戲中「預知未來」。由於在所有可能策略中抽樣的可能性比較小,而且神經網絡只能近似估計,所以特別是在其訓練階段,蒙特卡洛樹搜索能夠極大地提高遊戲的準確性以及訓練效率。這類似於職業棋手在下棋時能夠提前想幾步棋。