谷歌發布AlphaGo Zero, 40天自學2900萬種遊戲!

2020-11-27 驅動中國

驅動中國2017年10月19日消息據英國Nature雜誌報導，谷歌旗下的AI子公司DeepMind本周發布了新一代AlphaGo程序，這套AI程序被命名為「AlphaGo Zero」。它可以通過一種「強化學習」的機器學習技術，自學多種遊戲，僅經過三天訓練便擊敗了前代的AlphaGo Lee。

據悉，AlphaGo Zero能利用強化學習技術（Reinforcement Learning），大幅提高自學能力。在三天時間內自行掌握了圍棋的規則，還自行創造了更優的棋路。在這時間內未獲得人類的幫助，自行學習先進概念，選擇有利位置和序列戰勝了曾擊敗李世石的AlphaGo Lee。而經過40天的訓練，自學了2900萬種遊戲，AlphaGo Zero戰勝了曾擊敗柯潔的AlphaGo Master。

此前，AlphaGo Lee及AlphaGo Master兩代在接受訓練時，觀摩學習了人類專業或業餘棋手對弈的海量棋局。而AlphaGo Zero則沒有獲得這樣的訓練，它只是進行數百萬次的自我對弈，從中學習棋藝。

DeepMind公司表示，這一套新的程序核心就是連接在一起的人造神經元。AI程序會觀察旗子在棋盤上的位置，並推算下步棋怎麼走及獲勝的概率。不過，AlphaGo Zero相比上代版本是一個更簡單的程序，接受訓練的數據更少，承載的計算機設備體積更小。

AlphaGo的首席研究員David Silver表示，「由於未引入人類棋手的數據，AlphaGo Zero遠比過去的版本強大，我們去除了人類知識的限制，它能夠自己創造知識。」

研究團隊表示，AlphaGoZero的棋藝也是從一開始糟糕透頂到缺乏經驗的業餘棋手，最後成為圍棋高手。它的面世是AI發展的裡程碑，因為它是完全沒有人類棋手數據做指引的情況下，進行自我學習進化。當然，除過圍棋之外，AlphaGo Zero目前正在研究的一個課題就是關於藥物方面蛋白質如何摺疊的問題，將來有望取得突破。

相關焦點

谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了

【中關村在線新聞資訊】10月19日消息，今天谷歌旗下人工智慧團隊DeepMind在今天對外發布了一款全新的AlphaGo程序。這款軟體名為AlphaGo Zero，與之前擊敗了李世石的AlphaGo Master進行對弈，勝率高達100%。
AlphaGo Zero橫空出世,從零學習造恐怖記錄【附83盤棋譜】

：從空白狀態學起，在無任何人類輸入的條件下，它能夠迅速自學圍棋，並以100：0的戰績擊敗「前輩」。該論文稱，在數百萬局自我對弈後，隨著程序訓練的進行，AlphaGo Zero獨立發現了人類用幾千年才總結出來的圍棋規則，還建立了新的戰略，為這個古老的遊戲帶來新見解。 AlphaGo Lee是AlphaGo Zero的「前輩」。
...再次進化,AlphaGo Zero 這次擊敗了戰勝柯潔的 AlphaGo Master

10 月 19 日消息，DeepMind作為谷歌旗下專注於推進人工智慧（AI）研究的子公司，在今日發布了新款程序「AlphaGo Zero」。據了解，憑藉「強化學習」的機器學習技術，AlphaGoZero 可以通過自學玩轉多種遊戲，並在遊戲中吸取經驗教訓。
AlphaGo Zero用40天成為世界最強圍棋AI

AlphaGo的論文發布早就有預告，有預兆，並非突如其來，石破天驚……但當它就這樣出現，糊在小編臉上，還是顯得那麼讓人震撼……論文摘要在另一篇置頂文已經有了，這裡只是略微補全一些周邊信息。棋士柯潔：一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了
阿爾法狗再進化AlphaGo Zero橫空出世無師自學40天就可打敗柯潔

阿爾法狗再進化AlphaGo Zero橫空出世無師自學40天就可打敗柯潔 Evelyn Zhang • 2017-10
AlphaGo Zero完全自學吊打老狗,人類數據沒用了?

因此，我們把AlphaGo Zero稱作「阿爾法元」，天為始，元為初，寓意從零開始。本文共計2711字，閱讀時間5分鐘。谷歌人工智慧團隊DeepMind 發布了他們的最新論文Mastering the game of Go without human knowledge，向人們介紹了阿爾法狗家族的新成員——阿爾法元。與之前幾個版本的阿爾法狗不同，阿爾法元除了解圍棋規則外，完全不依靠棋譜和人類數據，從零開始「自學成才」，成為全世界最厲害的（人工智慧）圍棋手。1完爆對手，阿爾法元有多厲害？
谷歌發布AlphaGo Zero 100:0擊潰AlphaGo

DoNews10月19日消息(記者翟繼茹)據TechCrunch報導，谷歌旗下人工智慧公司DeepMind宣布AlphaGo出現了升級版AlphaGoZero。AlphaGo打敗李世石用了3000萬盤比賽作為訓練數據，而AlphaGo Zero僅用了490萬盤比賽數據。
阿爾法狗再進化 89:11擊敗AlphaGo Master

阿爾法狗再進化 89：11擊敗AlphaGo Master 阿爾法狗再進化，10月19日谷歌旗下人工智慧研究部門DeepMind發布了新版AlphaGo（阿爾法狗）軟體，它可以完全靠自己學習圍棋這款名為AlphaGo Zero的系統可以通過自我對弈進行學習
柯潔回應新版本AlphaGo問世:人類太多餘了

網易科技訊10月19日消息，DeepMind今天發布了一款新版本的AlphaGo程序，經過三天的訓練，該系統能夠擊敗AlphaGo Lee，後者是去年擊敗了韓國選手李世石（Lee Sedol）的DeepMind軟體，勝率是100
自學高手AlphaGo Zero 100:0戰勝李世石

它的獨門秘籍，是「自學成才」。AlphaGo Zero 從一張白紙開始，零基礎學習，在短短3天內，成為頂級高手。AlphaGo之父、DeepMind聯合創始人兼CEO 戴密斯·哈薩比斯(Demis Hassabis)說：「AlphaGo在兩年內達到的成績令人震驚。現在，AlphaGo Zero是我們最強版本，它提升了很多。Zero提高了計算效率，並且沒有使用到任何人類圍棋數據。」
最強「新狗」AlphaGo Zero發布柯潔:對於它的自我進步來講,人類太...

北京時間今天（10月19日）凌晨，谷歌旗下的DeepMind團隊公布了進化後的最強版AlphaGo ，代號AlphaGo Zero。AlphaGo曾打敗了中國頂尖棋手柯潔，而AlphaGo Zero經過3天的訓練，就以100：0的比分完勝AlphaGo。
棋壇至尊AlphaGo Zero,不止震驚了圍棋界

Deepmind在《自然》發表的一篇論文Mastering the game of Go without human knowledge中提到，一款新版的AlphaGo電腦程式能夠從空白狀態起，在不需要任何人類輸入的條件下，迅速自學圍棋。
【話題】AlphaGo Zero!圍棋之神真來了……

與阿爾法狗不同，阿爾法元不再學習人類棋譜，而是在掌握基本規則後，通過左右互博，僅僅40天時間，即成為碾壓Master的人工智慧。美國的兩位棋手在《自然》雜誌對阿爾法元的棋局做了點評：它的開局和收關與職業棋手的下法並無區別，這說明，人類在圍棋上幾千年的智慧結晶，看起來並非全錯，阿爾法元的中盤看起來則非常詭異，著法比阿爾法狗左右互搏時使出的怪招更加不可思議。
Deepmind新一代AlphaGo Zero自學3天打敗AlphaGo

AlphaGo Zero3天時間就能達到擊敗李世石的AlphaGo Lee的水平，21天可以達到了之前擊敗柯潔的AlphaGo Master的水平。今天凌晨，谷歌旗下Deepmind人工智慧團隊發布了一篇轟動AI界的論文，《Mastering the game of Go without human knowledge》（在沒有人類知識的情況下掌握圍棋），一句話總結這篇論文，他們研發的AlphaGo大表哥AlphaGo Zero能夠在沒有人類圍棋對弈數據的情況下
新版AlphaGo Zero100:0完爆舊「狗」:3天走完人類千年棋史

經過短短3天的自我訓練，AlphaGo Zero（最新人工智慧圍棋程序）就強勢打敗了此前戰勝李世石的舊版AlphaGo
能贏AlphaGo的只有它自己柯潔回應新版問世:人類太多餘了

谷歌人工智慧團隊DeepMind團隊在國際學術期刊《自然》（Nature）上發表論文，宣布新版AlphaGo——AlphaGo Zero可以在沒有人類指導的情況下學習，其水平超過此前所有AlphaGo（阿爾法狗）。
揭秘谷歌 AlphaZero:從 AlphaGo 進化,如何通殺棋類遊戲

這個AI程序起源於在2016年名聲大噪的圍棋AI AlphaGo，而AlphaZero被應用於更多棋類遊戲中，取得了令人可喜的成就。以下為文章全文：幾周前，谷歌AI子公司DeepMind內的一群研究人員在國際權威學術期刊《科學》（Science）上發表了一篇論文，其中描述了一種遊戲領域的人工智慧（AI）。
AlphaGo Zero問世柯潔說人類多餘了

【科技訊】10月19日消息，谷歌是全球最偉大的公司之一，這一點毋庸置疑。就在今天，谷歌旗下的創業公司DeepMind又發布了最新產品AlphaGo Zero。沒錯，就是之前接連打敗圍棋世界冠軍，李世石九段和柯潔九段的那個阿爾法狗的終極版。
AlphaGo Zero橫空出世,人機圍棋大戰正式收官:以後不會再有這樣的...

2017年10月19日凌晨，谷歌下屬公司 Deepmind 在《自然》（Nature）刊文，報告了新版、也是終版圍棋程序：AlphaGo Zero，這個程序可以從空白狀態學起，在無任何人類輸入的條件下，迅速自學圍棋，並已經以100:0的戰績擊敗老版 AlphaGo。

谷歌發布AlphaGo Zero, 40天自學2900萬種遊戲!

相關焦點

谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了

AlphaGo Zero橫空出世,從零學習造恐怖記錄【附83盤棋譜】

...再次進化,AlphaGo Zero 這次擊敗了戰勝柯潔的 AlphaGo Master

AlphaGo Zero用40天成為世界最強圍棋AI

阿爾法狗再進化AlphaGo Zero橫空出世 無師自學40天就可打敗柯潔

AlphaGo Zero完全自學吊打老狗,人類數據沒用了?

谷歌發布AlphaGo Zero 100:0擊潰AlphaGo

阿爾法狗再進化 89:11擊敗AlphaGo Master

柯潔回應新版本AlphaGo問世:人類太多餘了

自學高手AlphaGo Zero 100:0戰勝李世石

最強「新狗」AlphaGo Zero發布 柯潔:對於它的自我進步來講,人類太...

棋壇至尊AlphaGo Zero,不止震驚了圍棋界

【話題】AlphaGo Zero!圍棋之神真來了……

Deepmind新一代AlphaGo Zero自學3天打敗AlphaGo

新版AlphaGo Zero100:0完爆舊「狗」:3天走完人類千年棋史

能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了

揭秘谷歌 AlphaZero:從 AlphaGo 進化,如何通殺棋類遊戲

AlphaGo Zero問世 柯潔說人類多餘了

AlphaGo Zero橫空出世,人機圍棋大戰正式收官:以後不會再有這樣的...

阿爾法狗再進化AlphaGo Zero橫空出世無師自學40天就可打敗柯潔

最強「新狗」AlphaGo Zero發布柯潔:對於它的自我進步來講,人類太...

能贏AlphaGo的只有它自己柯潔回應新版問世:人類太多餘了

AlphaGo Zero問世柯潔說人類多餘了