AlphaGo又進化了:西洋棋和將棋也被拿下!

2020-12-06 太平洋電腦網

  【PConline資訊】此前,報導稱,MeepMind為AlphaGo引入了「強化學習」(reinforcement learning)的AI技術,讓AlphaGo具備了超強的自我學習的能力。它不再需要人類棋譜,就能通過自我對弈獲得超人類的圍棋技藝。

  新版的AlphaGo被稱為AlphaGo Zero,它不再依靠人類數據。通過機器學習系統,僅訓練3天就戰勝了AlphaGo Lee,比分為100:0,後者就是當初戰敗李世石的那款。經過40天訓練後,Alpha Zero又以89:11戰勝了Alpha Master,即橫掃柯潔的版本。

  據報導,日前DeepMind在arXiv發表論文,展示了Alpha Zero的最新進展。官方表示,Alpha Zero 已經具備很強的通用性,除了圍棋之外,還可以學習其它任務,比如西洋棋和將棋

  在上述兩個案例中, AlphaGo Zero可在24小時內,獲得超人的棋藝,甚至達到了世界冠軍的水平。

  當然,並非所有東西AlphaGo Zero都能掌控,目前AI面對最大的挑戰——複雜的即時戰略遊戲,比如《星際爭霸》。

  不過,相信隨著AI的不斷進化,過不了多久人類就被戰勝了。

相關焦點

  • AlphaGo又進化了:除了圍棋 現在還學會西洋棋
    團隊舉了兩個例子,說它可以學習西洋棋和將棋,將棋是日本的一種遊戲,與西洋棋類似。在兩個案例中,AlphaGo Zero 24小時內就能獲得超人一般的棋藝,達到擊敗世界冠軍的水平。為什麼在兩個遊戲中AI可以獲得卓越的技能呢?因為西洋棋與將棋沒有圍棋複雜。DeepMind有能力讓AlphaGo Zero具備通用性,這樣它就可以掌管不同的遊戲,這說明機器學習的能力越來越強。
  • 谷歌論文詳解AlphaZero:為西洋棋、將棋與圍棋帶來新曙光
    2017年年末,Google AI 子公司 DeepMind 的研究人員宣布他們的 AI 程序進化到了 AlphaZero,利用自對弈強化學習,在短時間內打敗了頂尖的西洋棋和將棋(日本版西洋棋)程序,也就是說,在只知道基本規則的情況下,AlphaZero 靠自對弈精通了圍棋、西洋棋和將棋。
  • 圍棋與象棋(中國象棋、西洋棋、日本將棋)該如何選擇?
    棋就是一遊戲,不要給他賦予太多的文化內涵,人工智慧的出現,說明什麼棋都和文化內涵無關,就是一遊戲。而遊戲,最大的作用就是以棋會友,這四種棋,在你們那裡或者在整個國內,就只有象棋能起以棋會友的作用。其他幾種就是網路遊戲而已,不會也罷。將棋,對抗激烈,複雜程度高,中後期持駒一多非常考驗計算能力,個人認為很有意思。B站上有不少學習資源可供參考。
  • AlphaZero降臨:8小時內拿下圍棋、西洋棋、日本將棋!
    AlphaZero 首先經過 8 個小時的對世界頂級圍棋棋譜的學習,就成功擊敗了與李世石對戰的 AlphaGo v18;又經過了 4 個小時的訓練,它又擊敗了世界頂級的西洋棋程序——Stockfish;緊接著,又是2個小時的訓練之後,世界上最強的日本將棋程序Elmo又敗在了它的手下。看出來了嗎?AlphaZero 或許已經有了些許邁向棋類通用 AI 的跡象!
  • AlphaZero問世:8小時完爆圍棋、西洋棋、日本將棋
    據了解,AlphaZero算法可以在8個小時訓練擊敗李世石版本AlphaGo;再用4小時訓練擊敗世界頂級的西洋棋程序Stockfish;再用2小時訓練擊敗世界頂級將棋程序Elmo此外,我們看到這次的AlphaZero與AlphaGo Zero有幾點不同,首先AlphaGo Zero是在假設結果為贏/輸二元的情況下,對獲勝概率進行估計和優化。而AlphaZero會將平局或其他潛在結果納入考慮,對結果進行估計和優化。其次,AlphaGo和AlphaGo Zero會轉變棋盤位置進行數據增強,而AlphaZero不會。
  • 打敗柯潔的AlphaGo有了繼任者AlphaZero 西洋棋/圍棋/將棋通殺
    Stockfish:西洋棋 AI 世界冠軍;elmo:2017 年度世界計算機將棋錦標賽冠軍;AlphaGo:戰勝柯潔的AI高手。實測西洋棋需要 9 小時、將棋 12 小時、圍棋 13 天,涉及 5000 個張量處理單元(TPU)。  這麼說可能不太能量化理解,可以參考一下一套 TPU 每天可以處理超過 Google Photos 中的 1 億+照片,所以 AlphaZero 對硬體的性能的要求還是相當高的。
  • 阿爾法狗再進化!通用棋類AI AlphaZero 8小時完勝象棋、將棋頂級程序
    繼今年10月在《自然》雜誌上發表論文正式推出人工智慧圍棋程序AlphaGo Zero後,Alphabet旗下機器學習子公司DeepMind團隊近日又發表論文稱,最新版本的 AlphaZero 在經過不到一天的訓練後,「令人信服地」打敗了西洋棋和日本將棋頂尖的電腦程式 。
  • AlphaGo後裔AlphaZero創造奇蹟,不到24小時訓練擊敗西洋棋、圍棋...
    據稱,新的算法經過不到 24 小時的訓練後,可以在西洋棋和日本將棋上擊敗目前業內頂尖的電腦程式(這些程序早已超越人類世界冠軍水平),也可以輕鬆擊敗訓練 3 天時間的 AlphaGo Zero。經過八個小時地自我練習,擊敗最初戰勝人類圍棋冠軍的 AI 程序,再經過四個小時的訓練後,又擊敗了當前世界西洋棋冠軍程序 Stockfish。更令人驚訝的是,僅經過兩個小時的訓練後,就戰勝了世界最頂尖的日本將棋程序之一 Elmo。
  • 精通西洋棋的AI研究員:AlphaZero真的是一次突破嗎?
    DeepMind 最近發表了一篇關於 AlphaZero 的論文,介紹了一個通過自我學習掌握西洋棋或將棋的系統。 進入正文之前,我首先做個自我介紹。我是一名人工智慧領域研究者,方向是自然語言處理;我同樣也是一名西洋棋大師,目前是韓國的頂尖選手,但是由於我全職科研最近幾年不是很活躍。因此,我會盡力提出一個合理的、有建設性的觀點。
  • AlphaGo繼任者:一個算法通吃三大棋類
    全文共2849字,預計學習時長5分鐘2017年末,AlphaZero誕生——一個可以自學西洋棋,將棋(日本象棋)和圍棋的獨立系統。傳統的西洋棋程序——包括世界計算機西洋棋冠軍Stockfish和IBM突破性的「深藍」依賴於數千個由高手玩家製作的規則和啟發式方法,這些方法試圖考慮到每盤棋局中所有可能發生的情況。將棋遊戲的程序也是針對於它自身專用的,並且使用了與西洋棋程序類似的搜尋引擎和算法。
  • 通用版AlphaGo登《Nature》:最強AI棋手,不懂規則也能精通遊戲
    編譯 | 子佩編輯 | Panken智東西12月24日消息,繼AlphaGo揚名海外後,DeepMind再推新模型MuZero,該模型可以在不知道遊戲規則的情況下,自學圍棋、西洋棋、日本將棋和Atari遊戲並制定最佳獲勝策略,論文今日發表至《Nature》。
  • Science封面:AlphaZero達成終極進化體,史上最強棋類AI降臨!
    下面,就讓我們一起來看看,AlphaZero的論文作者David Silver、Thomas Hubert、Julian Schrittwieser和Demis Hassabis親自撰文,闡述他們如何用5000個TPU,讓AlphaZero快速掌握將棋、西洋棋和圍棋。
  • 通用版AlphaGo登《Nature》!最強AI棋手,不懂規則也能精通遊戲
    智東西(公眾號:zhidxcom)編譯 |子佩 編輯 |Panken智東西12月24日消息,繼AlphaGo揚名海外後,DeepMind再推新模型MuZero,該模型可以在不知道遊戲規則的情況下,自學圍棋、西洋棋、日本將棋和Atari遊戲並制定最佳獲勝策略,論文今日發表至《Nature》。
  • 人工智慧和算法已在象棋和圍棋等領域上擊敗人類
    人工智慧和算法已在象棋和圍棋等領域上擊敗人類 讀芯術微信公眾號 發表於 2020-11-16 14:16:34 世界西洋棋冠軍賽始於1886年。
  • 揭秘谷歌 AlphaZero:從 AlphaGo 進化,如何通殺棋類遊戲
    儘管他們的通用AI系統適用於許多雙人遊戲,但是研究人員卻進行了調整,使其專門針對圍棋、西洋棋以及將棋(日本象棋)。這種AI程序事先並不了解任何一種棋類遊戲的規則。一開始,它只是隨意下子。之後,它通過和自己對弈掌握了遊戲規則。九個小時內,AlphaZero在大量特殊谷歌硬體集群中自我對弈4400萬局。之後兩個小時,它的表現已經超過人類棋手。四個小時之後,它就打敗了全球最出色的象棋引擎。
  • 新版Alphago棋風更穩健
    柯潔經過一天的苦戰在失利已成定局的情況下,依舊堅持下完比賽;經過改進的Alphago則依靠穩健的棋風拿下了對手。新版Alphago採用了增強學習的策略,下棋技巧上遠勝初代依靠監督學習戰勝李世石的初代Alphago,它曾化名Master拿下所有高手,加之谷歌在人工智慧底層架構TensorFlow的提升,讓Alphago速度更快。
  • 《自然》收錄「四代AlphaGo」論文,學習算法有望廣泛使用
    」 AlphaGo Zero 去掉了人類知識部分,而是只給 AI 提供規則,然後通過自我博弈,就能學習出自己的策略;「孫兒」 AlphaZero 則可通過完全信息,利用泛化能力更強的強化學習算法來做訓練,並學會不同的遊戲,如圍棋、西洋棋和日本將棋。
  • 柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我
    【文/觀察者網 周遠方】昨夜,「半狗」柯潔贏了一隻41連勝的「小狗」,輾轉難眠…… 他在今天(18日)凌晨0時23分發微博感嘆: 一個AI滿地走的時代...除了alphago以外,這個暱稱為「符合預期」的AI尤其強,實力應該已經遠超當時與李世石對弈的alphago了吧?...