自學高手AlphaGo Zero 100:0戰勝李世石

2021-01-16 IT168

AlphaGo Zero 是加強版AlphaGo,Go中的戰鬥機,其代號為 AlphaGo Zero。它的獨門秘籍,是「自學成才」。AlphaGo Zero 從一張白紙開始,零基礎學習,在短短3天內,成為頂級高手。

AlphaGo之父、DeepMind聯合創始人兼CEO 戴密斯·哈薩比斯(Demis Hassabis)說:「AlphaGo在兩年內達到的成績令人震驚。現在,AlphaGo Zero是我們最強版本,它提升了很多。Zero提高了計算效率,並且沒有使用到任何人類圍棋數據。」

今年5月,以3:0的比分贏下中國棋手柯潔後,AlphaGo宣布退役,但DeepMind公司並沒有停下研究的腳步。倫敦當地時間10月18日,DeepMind團隊公布了最強版AlphaGo ,代號AlphaGo Zero。

AlphaGo Zero的水平已經超過所有版本的AlphaGo。在對陣曾贏下韓國棋手李世石那版AlphaGo時,AlphaGo Zero取得了100:0的壓倒性戰績。

AlphaGo此前的版本,結合了數百萬人類圍棋專家的棋譜,以及強化學習的監督學習進行了自我訓練。

在戰勝人類圍棋職業高手之前,它經過了好幾個月的訓練,依靠的是多臺機器和48個TPU(谷歌專為加速深層神經網絡運算能力而研發的晶片)。

相關焦點

  • 打敗李世石的AlphaGo,被弟弟AlphaGo Zero打敗了,成績是0-100
    去年,有個小孩讀遍人世所有的棋譜,辛勤打譜,苦思冥想,棋藝精進,4-1打敗世界冠軍李世石,從此人間無敵手。他的名字叫阿法狗。今年,他的弟弟只靠一副棋盤和黑白兩子,沒看過一個棋譜,也沒有一個人指點,從零開始,自娛自樂,自己參悟,100-0打敗哥哥阿法狗。他的名字叫阿法元。
  • 再進化版本AlphaGo Zero以100:0完勝
    再進化版本AlphaGo Zero以100:0完勝 如今,說起由谷歌旗下團隊DeepMind所開發的人工智慧(AI)AlphaGo,你的頭腦當中會回想起什麼呢?是它在16年3月與圍棋高手李世石的一戰成名,還是化身「Master」在30秒快棋戰當中連克數十名世界級高手,亦或是今年5月份讓柯傑連負三局進而崩潰的強橫實力?
  • 新版AlphaGo Zero100:0完爆舊「狗」:3天走完人類千年棋史
    經過短短3天的自我訓練,AlphaGo Zero(最新人工智慧圍棋程序)就強勢打敗了此前戰勝李世石的舊版AlphaGo
  • 打敗李世乭的AlphaGo,被弟弟AlphaGo Zero打敗了,成績是0-100-虎嗅網
    今年,他的弟弟只靠一副棋盤和黑白兩子,沒看過一個棋譜,也沒有一個人指點,從零開始,自娛自樂,自己參悟,100-0打敗哥哥 AlphaGo 。他的名字叫 AlphaGo Zero(阿法元) 。自學三天,100-0擊潰阿法狗
  • 谷歌發布AlphaGo Zero, 40天自學2900萬種遊戲!
    它可以通過一種「強化學習」的機器學習技術,自學多種遊戲,僅經過三天訓練便擊敗了前代的AlphaGo Lee。據悉,AlphaGo Zero能利用強化學習技術(Reinforcement Learning),大幅提高自學能力。
  • 【午報】阿爾法狗再進化:自學3天,就100:0碾壓李世石版舊狗
    導語:AlphaGo Zero在對陣曾贏下韓國棋手李世石那版AlphaGo時,AlphaGo Zero取得了100:0的壓倒性戰績。
  • 1:4輸給谷歌AlphaGo圍棋AI 李世石:人工智慧不可戰勝
    1997年IBM的深藍計算機戰勝了西洋棋冠軍,20年後的2016年穀歌的圍棋AI程序「AlphaGo」戰勝了圍棋九段高手李世石,五局比賽人類只贏得了一局,沒想到這就是人類的巔峰了。本月19日,韓國傳奇選手李世石正式向韓國圍棋協會提交辭呈,結束了自己的職業生涯,12歲進入圍棋界,36歲的李世石在24年的徵戰中戰勝了多位人類頂級棋手,先後拿下了韓國國內32個冠軍、18個國際冠軍。
  • 第二場AlphaGo2:0李世石 李世石回天乏術
    李世石又輸了。 「輸到天上去了!」柯潔在解說時表示:「不可思議,(李世石)不打劫,不拼搏,(看上去像)消極比賽」。 北京時間3月10日下午消息,谷歌人工智慧AlphaGo與韓國棋手的第二局較量在首爾四季酒店舉行,在此次較量中雙方互換黑白,由AlphaGo執黑對戰李世石。最終,AlphaGo再下一城,以總比分2:0領先李世石。
  • 【話題】AlphaGo Zero!圍棋之神真來了……
    在對陣曾贏下韓國棋手李世石那版的AlphaGo時,AlphaGo Zero取得了100比0的壓倒性戰績,這真是棋藝高超啊……圍棋之神真來了文|體壇周報記者 謝銳比Alpha Go還要厲害得多的人工智慧誕生了,它便是阿爾法元Alpha Go Zero。
  • 李世石出現「神之一手」 第四局戰勝AlphaGo
    13日下午,谷歌人工智慧「阿爾法圍棋」(AlphaGo)與韓國棋手李世石繼續在韓國首爾鍾路區四季酒店進行第四場較量,經過4個多小時的比賽,最終李世石戰勝AlphaGo迎來首勝,終結三連敗的同時將比分扳成以1:3。今天的第四局比賽,李世石執白終於戰勝AlphaGo,為人類也更為他自己贏得一局可以保留顏面的勝利。
  • 更強AlphaGo出世!自學三日就能超越人類千年
    阿爾法零(AlphaGo Zero)完全不依賴於人類數據,自學三天圍棋,對陣阿爾法李世石(AlphaGo Lee)竟然能取得100比0的戰績。圍棋世界冠軍古力也感嘆:「20年不抵3天啊,我們的傷感,人類的進步!」AlphaGo四個版本回顧AlphaGo最先出現在公眾視野,是2015年10月5-0完勝人類的歐洲冠軍樊麾二段。
  • Deepmind新一代AlphaGo Zero自學3天打敗AlphaGo
    :0的戰績擊敗曾經的AlphaGo。舉個簡單的例子,AlphaGo是經過大量的人工對弈數據學習和訓練才一點點登上圍棋的巔峰,它之所以能在去年打敗李世石,並且在今年以Master的身份戰勝排名世界第一的柯潔,都依賴於海量的人類對弈數據。
  • AlphaGo戰勝李世石:機器人的勝利意義無需放大
    ,而李世石的水平絕非歐洲冠軍樊麾二段可比,更重要的是他一貫以計算精準、失誤極少見少。正是基於之前的判斷,李世石賽前才信心滿滿地表示雖有壓力但自認勝算較大。而國內圍棋第一人柯潔更是認為李世石將5:0輕鬆勝出。應該說李世石對於此戰應該是非常重視的,這從他的開局就能看出來。猜先失敗的機器人AlphaGo拱手讓出選擇權。李世石果斷選擇了執黑先行,目的就是想從布局就開始掌控局面。李世石的黑7頗為怪異,顯然是想以怪招求勝。
  • AlphaGo Zero橫空出世,從零學習造恐怖記錄【附83盤棋譜】
    10月19日凌晨,在國際學術期刊Nature上發表的一篇研究論文中,谷歌下屬公司Deepmind報告新版程序AlphaGo Zero:從空白狀態學起,在無任何人類輸入的條件下,它能夠迅速自學圍棋
  • 柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我
    【文/觀察者網 周遠方】昨夜,「半狗」柯潔贏了一隻41連勝的「小狗」,輾轉難眠…… 他在今天(18日)凌晨0時23分發微博感嘆: 一個AI滿地走的時代...除了alphago以外,這個暱稱為「符合預期」的AI尤其強,實力應該已經遠超當時與李世石對弈的alphago了吧?...
  • AlphaGo Zero問世 柯潔說人類多餘了
    當初打敗李世石的AlphaGo Lee,跟它的百局對弈比分是100:0,打敗柯潔的AlphaGo Master,在它手下贏了11盤,但也輸了89盤。更重要的是,AlphaGo Zero打敗AlphaGo Lee,是從零開始學圍棋,自學三天,便以百戰百勝的成績碾壓,而打敗在程序上,跟自己有很多相同之處的AlphaGo Master,只用了21天。
  • ...再次進化,AlphaGo Zero 這次擊敗了戰勝柯潔的 AlphaGo Master
    據了解,憑藉「強化學習」的機器學習技術,AlphaGoZero 可以通過自學玩轉多種遊戲,並在遊戲中吸取經驗教訓。令人興奮的是,在訓練 AlphaGo Zero 的過程中,為其引入了圍棋遊戲並學習先進的概念,挑選出一些有利的位置和序列。經過 3 天的訓練後,AlphaGo Zero 能夠擊敗 AlphaGo Lee,而後者是去年擊敗韓國選手李世石的 DeepMind 軟體。
  • 棋壇至尊AlphaGo Zero,不止震驚了圍棋界
    Deepmind在《自然》發表的一篇論文Mastering the game of Go without human knowledge中提到,一款新版的AlphaGo電腦程式能夠從空白狀態起,在不需要任何人類輸入的條件下,迅速自學圍棋。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了Nature微博原文:【可以自學成才的AlphaGo Zero】本周Deepmind在《自然》發表的一篇論文Mastering the game of Go without human knowledge,一款新版的AlphaGo電腦程式能夠從空白狀態起,在不需要任何人類輸入的條件下,迅速自學圍棋。
  • 新版Alphago棋風更穩健
    柯潔與Alphago的人機大戰第一場結束,Alphago執白戰勝了柯潔,勝四分之一子。柯潔經過一天的苦戰在失利已成定局的情況下,依舊堅持下完比賽;經過改進的Alphago則依靠穩健的棋風拿下了對手。新版Alphago採用了增強學習的策略,下棋技巧上遠勝初代依靠監督學習戰勝李世石的初代Alphago,它曾化名Master拿下所有高手,加之谷歌在人工智慧底層架構TensorFlow的提升,讓Alphago速度更快。柯潔身為現圍棋世界冠軍,此次也是有備而來,並宣稱用所有的熱情與Alphago進行了對決。