谷歌發布AlphaGo Zero, 40天自學2900萬種遊戲!

2020-11-27 驅動中國

驅動中國2017年10月19日消息   據英國Nature雜誌報導,谷歌旗下的AI子公司DeepMind本周發布了新一代AlphaGo程序,這套AI程序被命名為「AlphaGo Zero」。它可以通過一種「強化學習」的機器學習技術,自學多種遊戲,僅經過三天訓練便擊敗了前代的AlphaGo Lee。

據悉,AlphaGo Zero能利用強化學習技術(Reinforcement Learning),大幅提高自學能力。在三天時間內自行掌握了圍棋的規則,還自行創造了更優的棋路。在這時間內未獲得人類的幫助,自行學習先進概念,選擇有利位置和序列戰勝了曾擊敗李世石的AlphaGo Lee。而經過40天的訓練,自學了2900萬種遊戲,AlphaGo Zero戰勝了曾擊敗柯潔的AlphaGo Master。

此前,AlphaGo Lee及AlphaGo Master兩代在接受訓練時,觀摩學習了人類專業或業餘棋手對弈的海量棋局。而AlphaGo Zero則沒有獲得這樣的訓練,它只是進行數百萬次的自我對弈 ,從中學習棋藝。

DeepMind公司表示,這一套新的程序核心就是連接在一起的人造神經元。AI程序會觀察旗子在棋盤上的位置,並推算下步棋怎麼走及獲勝的概率。不過,AlphaGo Zero相比上代版本是一個更簡單的程序,接受訓練的數據更少,承載的計算機設備體積更小。

AlphaGo的首席研究員David Silver表示,「由於未引入人類棋手的數據,AlphaGo Zero遠比過去的版本強大,我們去除了人類知識的限制,它能夠自己創造知識。」

研究團隊表示,AlphaGoZero的棋藝也是從一開始糟糕透頂到缺乏經驗的業餘棋手,最後成為圍棋高手。它的面世是AI發展的裡程碑,因為它是完全沒有人類棋手數據做指引的情況下,進行自我學習進化。當然,除過圍棋之外,AlphaGo Zero目前正在研究的一個課題就是關於藥物方面蛋白質如何摺疊的問題,將來有望取得突破。

相關焦點

  • 谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了
    【中關村在線新聞資訊】10月19日消息,今天谷歌旗下人工智慧團隊DeepMind在今天對外發布了一款全新的AlphaGo程序。這款軟體名為AlphaGo Zero,與之前擊敗了李世石的AlphaGo Master進行對弈,勝率高達100%。
  • AlphaGo Zero橫空出世,從零學習造恐怖記錄【附83盤棋譜】
    :從空白狀態學起,在無任何人類輸入的條件下,它能夠迅速自學圍棋,並以100:0的戰績擊敗「前輩」。        該論文稱,在數百萬局自我對弈後,隨著程序訓練的進行,AlphaGo Zero獨立發現了人類用幾千年才總結出來的圍棋規則,還建立了新的戰略,為這個古老的遊戲帶來新見解。        AlphaGo Lee是AlphaGo Zero的「前輩」。
  • ...再次進化,AlphaGo Zero 這次擊敗了戰勝柯潔的 AlphaGo Master
    10 月 19 日消息,DeepMind作為谷歌旗下專注於推進人工智慧(AI)研究的子公司,在今日發布了新款程序「AlphaGo Zero」。據了解,憑藉「強化學習」的機器學習技術,AlphaGoZero 可以通過自學玩轉多種遊戲,並在遊戲中吸取經驗教訓。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    AlphaGo的論文發布早就有預告,有預兆,並非突如其來,石破天驚……但當它就這樣出現,糊在小編臉上,還是顯得那麼讓人震撼……論文摘要在另一篇置頂文已經有了,這裡只是略微補全一些周邊信息。棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了
  • 阿爾法狗再進化AlphaGo Zero橫空出世 無師自學40天就可打敗柯潔
    阿爾法狗再進化AlphaGo Zero橫空出世 無師自學40天就可打敗柯潔  Evelyn Zhang • 2017-10
  • AlphaGo Zero完全自學吊打老狗,人類數據沒用了?
    因此,我們把AlphaGo Zero稱作「阿爾法元」,天為始,元為初,寓意從零開始。本文共計2711字,閱讀時間5分鐘 。谷歌人工智慧團隊DeepMind 發布了他們的最新論文Mastering the game of Go without human knowledge,向人們介紹了阿爾法狗家族的新成員——阿爾法元。與之前幾個版本的阿爾法狗不同,阿爾法元除了解圍棋規則外,完全不依靠棋譜和人類數據,從零開始「自學成才」,成為全世界最厲害的(人工智慧)圍棋手。1完爆對手,阿爾法元有多厲害?
  • 谷歌發布AlphaGo Zero 100:0擊潰AlphaGo
    DoNews10月19日消息(記者 翟繼茹)據TechCrunch報導,谷歌旗下人工智慧公司DeepMind宣布AlphaGo出現了升級版AlphaGoZero。AlphaGo打敗李世石用了3000萬盤比賽作為訓練數據,而AlphaGo Zero僅用了490萬盤比賽數據。
  • 阿爾法狗再進化 89:11擊敗AlphaGo Master
    阿爾法狗再進化 89:11擊敗AlphaGo Master  阿爾法狗再進化,10月19日谷歌旗下人工智慧研究部門DeepMind發布了新版AlphaGo(阿爾法狗)軟體,它可以完全靠自己學習圍棋 這款名為AlphaGo Zero的系統可以通過自我對弈進行學習
  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    網易科技訊10月19日消息,DeepMind今天發布了一款新版本的AlphaGo程序,經過三天的訓練,該系統能夠擊敗AlphaGo Lee,後者是去年擊敗了韓國選手李世石(Lee Sedol)的DeepMind軟體,勝率是100
  • 自學高手AlphaGo Zero 100:0戰勝李世石
    它的獨門秘籍,是「自學成才」。AlphaGo Zero 從一張白紙開始,零基礎學習,在短短3天內,成為頂級高手。AlphaGo之父、DeepMind聯合創始人兼CEO 戴密斯·哈薩比斯(Demis Hassabis)說:「AlphaGo在兩年內達到的成績令人震驚。現在,AlphaGo Zero是我們最強版本,它提升了很多。Zero提高了計算效率,並且沒有使用到任何人類圍棋數據。」
  • 最強「新狗」AlphaGo Zero發布 柯潔:對於它的自我進步來講,人類太...
    北京時間今天(10月19日)凌晨,谷歌旗下的DeepMind團隊公布了進化後的最強版AlphaGo ,代號AlphaGo Zero。AlphaGo曾打敗了中國頂尖棋手柯潔,而AlphaGo Zero經過3天的訓練,就以100:0的比分完勝AlphaGo。
  • 棋壇至尊AlphaGo Zero,不止震驚了圍棋界
    Deepmind在《自然》發表的一篇論文Mastering the game of Go without human knowledge中提到,一款新版的AlphaGo電腦程式能夠從空白狀態起,在不需要任何人類輸入的條件下,迅速自學圍棋。
  • 【話題】AlphaGo Zero!圍棋之神真來了……
    與阿爾法狗不同,阿爾法元不再學習人類棋譜,而是在掌握基本規則後,通過左右互博,僅僅40天時間,即成為碾壓Master的人工智慧。美國的兩位棋手在《自然》雜誌對阿爾法元的棋局做了點評:它的開局和收關與職業棋手的下法並無區別,這說明,人類在圍棋上幾千年的智慧結晶,看起來並非全錯,阿爾法元的中盤看起來則非常詭異,著法比阿爾法狗左右互搏時使出的怪招更加不可思議。
  • Deepmind新一代AlphaGo Zero自學3天打敗AlphaGo
    AlphaGo Zero3天時間就能達到擊敗李世石的AlphaGo Lee的水平,21天可以達到了之前擊敗柯潔的AlphaGo Master的水平。 今天凌晨,谷歌旗下Deepmind人工智慧團隊發布了一篇轟動AI界的論文,《Mastering the game of Go without human knowledge》(在沒有人類知識的情況下掌握圍棋),一句話總結這篇論文,他們研發的AlphaGo大表哥AlphaGo Zero能夠在沒有人類圍棋對弈數據的情況下
  • 新版AlphaGo Zero100:0完爆舊「狗」:3天走完人類千年棋史
    經過短短3天的自我訓練,AlphaGo Zero(最新人工智慧圍棋程序)就強勢打敗了此前戰勝李世石的舊版AlphaGo
  • 能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了
    谷歌人工智慧團隊DeepMind團隊在國際學術期刊《自然》(Nature)上發表論文,宣布新版AlphaGo——AlphaGo Zero可以在沒有人類指導的情況下學習,其水平超過此前所有AlphaGo(阿爾法狗)。
  • 揭秘谷歌 AlphaZero:從 AlphaGo 進化,如何通殺棋類遊戲
    這個AI程序起源於在2016年名聲大噪的圍棋AI AlphaGo,而AlphaZero被應用於更多棋類遊戲中,取得了令人可喜的成就。以下為文章全文:幾周前,谷歌AI子公司DeepMind內的一群研究人員在國際權威學術期刊《科學》(Science)上發表了一篇論文,其中描述了一種遊戲領域的人工智慧(AI)。
  • AlphaGo Zero問世 柯潔說人類多餘了
    【科技訊】10月19日消息,谷歌是全球最偉大的公司之一,這一點毋庸置疑。就在今天,谷歌旗下的創業公司DeepMind又發布了最新產品AlphaGo Zero。沒錯,就是之前接連打敗圍棋世界冠軍,李世石九段和柯潔九段的那個阿爾法狗的終極版。
  • AlphaGo Zero橫空出世,人機圍棋大戰正式收官:以後不會再有這樣的...
    2017年10月19日凌晨,谷歌下屬公司 Deepmind 在《自然》(Nature)刊文,報告了新版、也是終版圍棋程序:AlphaGo Zero,這個程序可以從空白狀態學起,在無任何人類輸入的條件下,迅速自學圍棋,並已經以100:0的戰績擊敗老版 AlphaGo。