超越AlphaGo的AlphaZero出世

2020-12-05 中國機器人網

據韓媒報導，超越圍棋人工智慧「AlphaGo」的「AlphaZero」已面世，「AlphaZero」圍棋的特點是在沒有教科書或棋譜的情況下，只要知道遊戲法則，就具備掌握所有棋類遊戲的能力。特別是以圍棋為對象，與「AlphaGo」不同的是一個算法可以適用於西洋棋、昭和（日本象棋）等其他棋類遊戲，是AI廣泛應用的重要裡程碑，因此備受期待。

12月7日，包括谷歌Deep Mind創始人兼CEO德米斯·哈比斯在內的13位研究學者在「科學」雜誌上發表了題目為「通過自我學習掌握西洋棋、昭和、圍棋的通用強化學習算法」。
「AlphaZero」與「AlphaGo」一樣都是不需要大數據學習，「AlphaZero」用了4個小時打敗了2016年西洋棋AI冠軍」Stockfish」，用了2個小時打敗了2017年昭和象棋AI冠軍」 Elmo」，」Stockfish」與」 Elmo」都是在輸入大數據的基礎上採用檢索最優數的方式，「AlphaZero」則是像人的大小腦一樣用深層神經網技術自己積累數據，採用快速找出勝算高且最優數的方式。

「AlphaZero」用了8個小時就贏了圍棋9段王者李世石，而之前「AlphaGo」用了30個小時，在圍棋領域與「AlphaGo」對決的勝率達到61%。Deep Mind研究員戴維德表示「最近因為技術的發達，出現了能夠輕鬆徵服西洋棋、象棋、圍棋之類的棋類遊戲算法，AI開發的下一個課題是徵服多個人參與的視頻遊戲，類似於戰略模擬的遊戲」。

另外，Deep Mind 於12月2日在墨西哥坎昆舉行的蛋白質構造預測學術大會上用AI 」AlphaFold」成功預測了生命的基本分子蛋白質的三維形態，「AlphaFold」成功預測了43個蛋白質中25個結構構造並取得第一名，而第二名獲得者只成功預測了43個蛋白質中的3個構造。

相關焦點

AlphaZero:從小白開始制霸多個遊戲

機器之心報導機器之心編輯部 DeepMind 推出的 AlphaGo 曾在圍棋項目中取得了超越人類的表現，其研究曾經兩次登上 Nature。
佛教在港臺:臺灣慈光寺印象——出家不出世入世而超越

二、出家不出世，入世而超越慈光寺山門的前面有一座小小的涼亭，上有一楹聯云：「風聲雨聲鐘磬聲，聲聲入耳；山色水色煙霞色，色色皆空。」此聯脫胎於晚明東林黨人的聯語「風聲雨聲讀書聲，聲聲入耳；家事國事天下事，事事關心」，而另闢一種新境界。
更強AlphaGo出世!自學三日就能超越人類千年

到36小時的時候，阿爾法零就能超越李世石版，發現星位一間夾點角定式。到第55小時，它能發現人類目前暫時理解不到的非人類棋手的定式。到72小時，它就能初步出關，能超越所有人類棋手了。當然，阿爾法零與上一個版本阿爾法大師下成89勝11負，還是通過了40天的修煉才做到的。但與人類棋手，需要至少15到20年的學習才有可能成長為頂級棋手來說，阿爾法零的出現確實太驚人了。
能贏AlphaGo的只有它自己柯潔回應新版問世:人類太多餘了

對此，柯潔回應稱：「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」2016 年在 AlphaGo 和李世石的對戰後，人工智慧進入大眾的視野，今年5月27日，中國棋手柯潔與人工智慧「阿爾法圍棋」(AlphaGo)展開三番棋比賽的終局對決。
AlphaGo 圍棋教學工具已發布

在Deepmind所謂的「教學工具」發布之前，小編曾在腦海出現萬千猜想……但今天揭底才知道，原來只是一個平平淡淡的網頁……（建議複製到電腦上打開，因為據有的棋友反映手機打不開，小編這裡實測手機能打開，只是讀取了較長時間）https://alphagoteach.deepmind.com
AlphaGo Zero用40天成為世界最強圍棋AI

棋士柯潔：一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了從亂下開始，1天達到V18（超越人類棋手水平），21天達到Master，40天碾壓Master。 less is more。 2017年起，在某些領域，AI不再需要人類知識。
谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了

谷歌團隊發布AlphaGo Zero：柯潔稱人類太多餘了（圖片來自於推特）在這款軟體發出之後，柯潔也對這款軟體發表了自己的看法，他認為：「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」之所以柯潔會這樣說，主要是因為AlphaGo Zero的練習主要是通過自我對弈在三十天之內發展起來的。
柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我

【文/觀察者網周遠方】昨夜，「半狗」柯潔贏了一隻41連勝的「小狗」，輾轉難眠…… 他在今天（18日）凌晨0時23分發微博感嘆：一個AI滿地走的時代...除了alphago以外，這個暱稱為「符合預期」的AI尤其強，實力應該已經遠超當時與李世石對弈的alphago了吧？...
新版Alphago棋風更穩健

alphago再過一萬年也不可能窮盡所有圍棋的定式。這次比賽其實不是人機大戰，而是人類使用電腦作為工具探索新的東西，就像哈勃望遠鏡讓人類發現新的領域一樣。人工智慧可以幫助專家以更快的速度解決問題。本次比賽的目的也不是alphago還是棋手贏，最終還是人類贏。祝柯潔好運。」來源：網易科技
出世造句和解釋_出世的例句有哪些 - 小孩子點讀

[沙汀《丁跛公》：「他得隔一天上一次城，繳掉那些零碎收來的糧款，因為時候已經是土匪出世的季節了。」]出世參考例句：1、橫空出世，莽崑崙，閱盡人間春色。2、他到銀樓買了一塊金鎖片送給甫出世的小孫子。3、以入世之態度做事，以出世之態度做人。4、非攻的重新出世到底是所謂何事。5、他們夫妻倆勤習育兒知識，把剛出世的嬰兒照顧得無微不至。
AlphaGo、AlphaZero、AlphaStar之後會是AlphaGun嗎?

人腦的運行是基於體內不斷進行的化學變化，而運行人工智慧的電腦並沒有化學變化，所以目前階段的人工智慧從本質上也是無法超越人腦的智慧的。智能戰爭的擔憂雖然目前的人工智慧還不能超越人類的智慧，但是暴露在各種偵查手段下的戰場，也已經是一個近乎完全信息系統，人工智慧在那樣的環境下已經佔有絕對優勢。智能戰爭不再是人和人的戰爭，而是冷酷的人和機器的戰爭。擁有高精尖武器和頂級人工智慧的國家將會長久甚至永遠的霸凌全世界。
棋類大師 AlphaZero 無師自通,「通用人工智慧」加速到來?

AlphaGo zero玩的是，最大限度發揮了自身創造力的遊戲，而邏輯性思維的對手的眼光卻無法超越短期的利益。它下的西洋棋不僅是無法想像的，這在過去是要被放到顯著位置供眾人景仰的。那篇關於AlphaZero的論文在最近結束的NIPS 2017大會上進行了介紹。這篇論文非常短，主體只有7頁的篇幅。這篇論文為AlphaZero確定下法而對棋局位置評估的內容範圍之大提供了有趣的詳細描述。
手把手:AlphaGo有啥了不起,我也能教你做一個(附Python代碼)

一臺機器已經學會了一種超越人類的圍棋策略。這在以前被認為是一項不可能完成的任務，或者至少需要十年之功。AlphaGo與李世石的第3場比賽這已是一項了不起的成就。我之前寫過一篇AlphaGo Zero的知識點速查手冊可供參考：https://medium.com/applied-data-science/alphago-zero-explained-in-one-diagram-365f5abf67e0Tim Wheeler
揭秘谷歌 AlphaZero:從 AlphaGo 進化,如何通殺棋類遊戲

一開始，他們認為自己不會輸給一臺機器：「我想人類的直覺非常高級，AI無法超越我們。」李世石在與AlphaGo對弈前的一天這樣說道。可是，當AlphaGo開始贏得勝利之後，恐慌感油然而生。在某一個心生酸楚感的瞬間，李世石因首局失利承受著巨大的壓力，他突然起身離開桌子，不顧比賽時間限制，走到外面去抽了一根煙。他俯瞰著首爾的屋頂。（在網際網路上，有五千多萬人在關注著這場比賽。）
AlphaGo後裔AlphaZero創造奇蹟,不到24小時訓練擊敗西洋棋、圍棋...

昨天，AlphaGo 研究團隊提出了 AlphaZero：一種可以從零開始，通過自我對弈強化學習在多種任務上達到超越人類水平的新算法。據稱，新的算法經過不到 24 小時的訓練後，可以在西洋棋和日本將棋上擊敗目前業內頂尖的電腦程式（這些程序早已超越人類世界冠軍水平），也可以輕鬆擊敗訓練 3 天時間的 AlphaGo Zero。
柯潔感嘆AlphaGo可怕:讓三子!如先捅三刀(圖)

柯潔寫到：「早就聽說新版alphago的強大....但...讓...讓三個？我的天，這個差距有多大呢？簡單的解釋一下就是一人一手輪流下的圍棋，對手連續讓你下三步...又像武林高手對決讓你先捅三刀一樣...我到底是在和一個怎樣可怕的對手下棋...」　　2016年底，神秘的Master在網上颳起一陣圍棋旋風。以60勝0敗的戰績橫掃一眾圍棋頂尖高手，其中柯潔也3次落敗。
柯潔回應新版本AlphaGo問世:人類太多餘了

對此，柯潔回應稱：「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」
柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo

消息曝光後，柯潔評價稱：「一個純淨、純粹自我學習的AlphaGo是最強的...對於alphago的自我進步來講...人類太多餘了。」今日凌晨，柯潔發微博表示，自己在網上對弈時遇到了一個名為「符合預期」的AI，對方實力十分強勁，應該已經遠超當時與李世石對弈的AlphaGo。該AI在某圍棋平臺一舉拿下41連勝，最終被自己終結。
AlphaZero誕生一周年:登上Science封面,完整論文首次公開

20年前與深藍對弈的加裡卡斯帕羅夫DeepMind博文連結：https://deepmind.com/blog/alphazero-shedding-new-light-grand-games-chess-shogi-and-go
超越AlphaZero,DeepMind新算法MuZero登頂Nature

因此，DeepMind團隊提出了MuZero算法，通過將基於樹的搜索與經過學習的模型相結合，可以在一系列具有挑戰性和視覺複雜的領域中，無需了解基本的動態變化即可實現超越人類的出色性能。MuZero算法學習可迭代模型，該模型能夠產生與規劃相關的預測，包括動作選擇策略、價值函數和獎勵。據報導，在57種不同的Atari遊戲上進行評估時，MuZero算法獲得了最先進的性能。

超越AlphaGo的AlphaZero出世

相關焦點

AlphaZero:從小白開始制霸多個遊戲

佛教在港臺:臺灣慈光寺印象——出家不出世 入世而超越

更強AlphaGo出世!自學三日就能超越人類千年

能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了

AlphaGo 圍棋教學工具已發布

AlphaGo Zero用40天成為世界最強圍棋AI

谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了

柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我

新版Alphago棋風更穩健

出世造句和解釋_出世的例句有哪些 - 小孩子點讀

AlphaGo、AlphaZero、AlphaStar之後會是AlphaGun嗎?

棋類大師 AlphaZero 無師自通,「通用人工智慧」加速到來?

手把手:AlphaGo有啥了不起,我也能教你做一個(附Python代碼)

揭秘谷歌 AlphaZero:從 AlphaGo 進化,如何通殺棋類遊戲

AlphaGo後裔AlphaZero創造奇蹟,不到24小時訓練擊敗西洋棋、圍棋...

柯潔感嘆AlphaGo可怕:讓三子!如先捅三刀(圖)

柯潔回應新版本AlphaGo問世:人類太多餘了

柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo

AlphaZero誕生一周年:登上Science封面,完整論文首次公開

超越AlphaZero,DeepMind新算法MuZero登頂Nature

佛教在港臺:臺灣慈光寺印象——出家不出世入世而超越

能贏AlphaGo的只有它自己柯潔回應新版問世:人類太多餘了