自學成才?新版「阿法狗」迅速成為圍棋霸主

2020-11-27 新華網客戶端

　　人工智慧（AI）領域再次出現驚人突破——據英國《自然》雜誌近日發表的論文報導，一款新版的「阿法狗」（AlphaGo）電腦程式能夠從空白狀態起，在不需要任何人類棋譜輸入的條件下，自學圍棋，無師自通，自學成才。

　　這款新程序名叫「阿法元」（AlphaGo Zero），其以100比0的不敗戰績，狠狠打擊了曾書寫歷史的舊版「阿法狗」。

　　實力，「阿法狗」的輝煌戰績

　　人工智慧「阿法狗」出自谷歌旗下深度思維（DeepMind）公司。最早在2016年1月，《自然》雜誌以封面位置報導該程序在和所有其他圍棋程序的對抗中獲得了99.8%的勝率，並且以5∶0的成績打敗了歐洲圍棋冠軍。

　　隨後同年3月，「阿法狗」挑戰世界圍棋冠軍李世石，經五局鏖戰，人類1∶4不敵人工智慧，引發巨大轟動。人們的震驚源於在圍棋19×19棋盤上，一步甚至會有幾百種走法，傳統的人工智慧算法難以估計局面和下子。

　　但「阿法狗」仍在積攢實力。今年1月，一個神秘帳號Master公布自己正是「阿法狗」新版。該帳號在知名圍棋平臺上先後挑戰柯潔、樸廷桓和井山裕太等頂級高手，豪取勝利，隨後戰贏「棋聖」聶衛平，直至60盤時自爆身份，決勝收官。

　　3天，「阿法元」的無師自通

　　此次在最新論文中，英國倫敦深度思維公司「阿法狗」項目的主要負責人戴維·西爾弗、戴密斯·哈薩比斯及其同事，報告了新版「阿法狗」軟體——「阿法元」。

　　「阿法元」最引人注目之處在於其無師自通的本領。其學習從「零」開始，單純基於與自己的對弈，不需要任何歷史棋譜的指引，也不需要任何人類經驗的點撥。

　　對於這個新軟體，人類的輸入僅僅限於一張棋盤和一副棋子，沒有任何人類數據參與。「阿法元」只用到了一張神經網絡，這張網絡經過訓練，專門預測程序自身的棋步和棋局的贏家，讓「阿法元」在每次自我對弈中進步。

　　通過3天的訓練——包括近500萬局自我對弈——「阿法元」已能夠超越人類並打敗之前的「阿法狗」版本。戴維·西爾弗表示，「阿法元」遠比「阿法狗」強大，它已不再為人類的知識所限，而能夠自行發現新知識。

　　擺脫了人類經驗的輔助和依賴，人工智慧竟然變得更強！在「阿法元」嶄露頭角後，人們揣測：難道我們人類還耽誤「阿法狗」了？

　　震驚，AI的獨立發現

　　其實，人工智慧的最大挑戰之一，即是研發一種能從「零」開始、以超人類的水平學習複雜概念的算法。

　　在去年3月那場世所矚目的比賽中，「阿法狗」軟體打敗了人類圍棋世界冠軍。當時的這款圍棋程序，是利用價值網絡去計算局面，用策略網絡去選擇下子。

　　但為了贏得這場人機大戰，科學家團隊在訓練「阿法狗」時，同時用到了監督式學習（基於上百萬種人類專業選手的下棋步驟）和基於自我對弈的強化學習。舊「阿法狗」訓練過程長達幾個月，用到多臺機器和48個TPU（神經網絡訓練所需的專業晶片）。

　　而此次，據研究團隊介紹，新程序「阿法元」只使用了一臺機器和4個TPU。

　　在「阿法狗」之前，最成功的圍棋程序僅能達到人類業餘選手的程度，還不能在不讓子的情況下和專業賽手一較高下，原本人們認為，至少要10年後人工智慧才有可能達到這一成就。但「阿法狗」的橫空出世改寫了預言。而在其問世不足兩年的時間裡，「阿法元」再次刷新人們的認知——隨著程序訓練的進行，人工智慧已獨立發現了人類用幾千年才總結出來的圍棋規則，還建立了新的策略，可以說，人工智慧已經為這個古老的遊戲，帶來全新見解。

　　（科技日報北京10月22日電）

相關焦點

阿法狗算什麼?這個星球最聰明的人說:零來了擺脫人類自學成才

新版阿法狗來勢洶洶，據Deepmind團隊透露，新阿法狗「零」的水平已經超過之前所有版本的阿法狗。在對陣曾贏下李世石的那版阿法狗時，AlphaGo Zero取得了100:0的壓倒性戰績。而且，它是從一張白紙開始，零基礎學習，在短短3天內，成為頂級高手。
打敗圍棋世界冠軍阿爾法狗再進化:通過自學訓練輕鬆完虐圍棋霸主

阿爾法狗，猛一看這個名字，還以為是一類狗的統稱，事實上，它是一款圍棋人工智慧軟體，由谷歌旗下人工智慧研究部門DeepMind開發製造。它曾分別與頂級圍棋棋手李世石和世界圍棋第一人柯潔展開「人機大戰」，並最終取得勝利。
網曝Master是新版阿法狗與網站籤有保密協議

據華西都市報－封面新聞記者了解，MASTER正是新版「阿法狗」，目前處於公測階段，由於這臺「新狗」重出江湖之前，與弈城、野狐等國內知名圍棋對弈網站籤有保密協議，因此到目前為止，我們不可能得到對弈網站方面的官方承認。但正如一位成都業餘圍棋高手所言——只有「阿法狗」才能如此碾壓人類的頂尖高手，這是一個最簡單的推理，不需要官方證實。
谷歌推出阿法狗圍棋工具:讓機器教人類下棋

12月4日下午消息，今天下午13時，由聶衛平圍棋道場和谷歌聯合推出的「尋找圍棋小先鋒」活動，在上海世博園萬國體育館舉行。聶衛平道場創始人、圍棋9段聶衛平先生、谷歌CEO桑達爾·皮查伊先生和谷歌大中華區總裁石博盟先生參加了此次發布會。
還記得那個打敗了柯潔的阿法狗嗎?新一代阿法星已全面超越人類

原本人們以為圍棋將會是人類引以為傲的智商唯一保留地，然而阿法狗擊碎了這一切，從一開始戰勝韓國著名棋手，再到後來戰勝中國最強棋手柯潔，阿法狗已經用多次的實戰證明了自己已經是不敗之神，而都得益於它的特殊機制，跟完全的死記硬背不同的是，阿法狗是通過自己去看數萬場棋局，然後學習經驗並且優化自己。
柯潔:阿法狗是圍棋上帝我輸得完全沒有脾氣

柯潔：阿法狗是圍棋上帝我輸得完全沒有脾氣暴風體育訊（陶冶浙江烏鎮報導）5月
阿法狗並不是真正的人工智慧:3分鐘讓你徹底明白阿法狗如何下棋

原標題：阿法狗並不是真正的人工智慧：3分鐘讓你徹底明白阿法狗如何下棋阿法狗很強大，它的強大是由於它的原理和算法，這是大家都知道的，但具體咋回事，可能很多人就說不上來了。
阿法狗2.0版來了!這次人工智慧要正式摒棄人類棋譜

阿法狗2.0版來了！新版「阿法狗」將正式摒棄人類棋譜，只靠計算機自身深度學習的方式成長——即探索「深度學習」方式的極限，臻至「圍棋之神」的境界。2.0版的AlphaGo，將通過數學模型下的自我對局和深度學習，下出真正屬於人工智慧（AI）的圍棋。柯潔微博。
阿法狗又毀了一個小目定式(圍棋AI太可怕)

阿法狗又毀了一個小目定式（圍棋AI太可怕）一般來說，一手棋，圍棋AI給出的勝率從54%降到了51%
阿法狗之父登《時代》人物榜提前十年攻克圍棋

阿法狗之父入選百大人物谷歌技術總監雷-庫茲韋爾稱：「哈薩比斯和他的團隊創造了阿爾法圍棋，打敗了世界最好棋手之一的李世石，比人工智慧軟體攻克圍棋的預期至少提早了十年，這在人工智慧領域是一個裡程碑事件。哈薩比斯是創造人工智慧突破的領導學者之一，在過去兩年在《自然》上發表了三篇文章。他和我同樣堅信，人工智慧將會幫助解決人類生活中艱巨的挑戰，例如消除貧困，治療疾病和改善環境。」
創造出「阿法狗」的是怎樣的人

在Deepmind公司公布的一段視頻中，有人就留意到，在「阿法狗」與樊麾對弈時，「阿法狗」的介紹標籤上貼著一個英國國旗。而這一次「阿法狗」挑戰韓國的世界冠軍李世石，現場的選手信息介紹中，也同樣給「阿法狗」貼上了一個英國國旗。
《棋魂》阿法狗和褚嬴對局誰會贏?

那我們就看褚嬴和阿法狗對局誰會贏？（AlphaGo是第一個擊敗人類職業圍棋選手的的人工智慧機器人）阿法狗是一個具有學習技能的人工智慧，阿法狗在圍棋方面的學習和計算能力遠超人類。世界排名第一的圍棋世界冠軍柯潔：「在我看來它（指阿爾法圍棋）就是圍棋上帝，能夠打敗一切。」「對於AlphaGo的自我進步來講，人類太多餘了。」而在計算能力上，阿法狗大約相當於1000臺計算機的運算能力，一個普通人類的大腦對抗1000臺計算機的計算能，好像褚嬴並不佔優勢。
從阿法狗大雪崩新變化說起

大雪崩、妖刀、大斜被譽為最難解的三大定式，正在進行的歐洲圍棋大會上，樊麾老師演講中談到了阿法狗對於大雪崩的看法。不禁又想到吳大師的那句話：圍棋定式不應叫「定式」大雪崩內拐定式最長出現的局面，至此雙方正常進行。
人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo

AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo(1769字)。公號由秦隴紀發起，未覆蓋各領域科普及簡化，期待大家參與~】人工智慧從0到1：阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo(1736字)2016年底AlphaGo阿法狗4-1打敗世界冠軍Lee Sedol
人機大戰落幕阿法狗3:0全勝柯潔落淚

阿法狗在不斷進化實際上與柯潔對戰的阿法狗並不是與李世石對戰的阿法狗，李世石也在採訪中確認了這一點，他認為下法更加直接明確，不會出現一些莫名其妙的布局，牢牢掌控了整盤。
周日上演|《挑戰阿法GO》圍棋童話劇

劇情簡介：原本膽小怯懦的阿傑，在來自GO星球狗狗思睿的引導下，一夜之間成為了圍棋神童。阿傑的名氣也引起了阿法GO的設計者的目光，他帶來了阿法GO要跟阿傑比賽......科幻/冒險/ 友情/ 玄幻/ 高潮不斷/ 雅俗共賞
神之一手實現終極逆襲人類首次戰勝"阿法狗"

它捍衛了圍棋之美和人類智慧，足以讓觀者熱淚盈眶。　　昨天，備受矚目的阿爾法人工智慧圍棋與韓國棋手李世石的第四番較量如期而至。經歷了前三次的失敗，李世石終於扳回一局，捍衛了人類的榮譽，而他在第78手的一招妙棋更是被看做打亂「阿法狗」節奏的神之一手。明天，在本次人機大戰的收官一局中，李世石將執黑再戰「阿法狗」。
輸給阿法狗又怎樣,至少贏了王思聰

一個是從來沒有輸過的冷血殺手一個是當今圍棋第一人的少年這兩位，註定要有一戰，而且必然是驚天地泣鬼神的，就像決戰光明頂中張無忌與六大門派高手過招一樣吸人眼球。只是，這一次的結局跟我們想像的不太一樣。擁有主角光環的柯潔以四分之一子的微弱劣勢敗給了阿法狗。事已至此，誰都會料到這結局會在網上炸開鍋的。
手把手教你打造自己的「阿法狗」

別裝了，你根本就不懂圍棋，此前也壓根沒聽說過什麼李世石。可你最近還是到處跟人大談「阿法狗」，就好像那就是你姥姥家的旺財一樣。　　有沒有覺得「阿法狗」萌萌噠？
不是誰都能成阿法狗日本圍棋AI輸給人

（原標題：不是誰都能成阿法狗日本圍棋AI輸給人）

自學成才?新版「阿法狗」迅速成為圍棋霸主

相關焦點

阿法狗算什麼?這個星球最聰明的人說:零來了 擺脫人類自學成才

打敗圍棋世界冠軍阿爾法狗再進化:通過自學訓練輕鬆完虐圍棋霸主

網曝Master是新版阿法狗 與網站籤有保密協議

谷歌推出阿法狗圍棋工具:讓機器教人類下棋

還記得那個打敗了柯潔的阿法狗嗎?新一代阿法星已全面超越人類

柯潔:阿法狗是圍棋上帝 我輸得完全沒有脾氣

阿法狗並不是真正的人工智慧:3分鐘讓你徹底明白阿法狗如何下棋

阿法狗2.0版來了!這次人工智慧要正式摒棄人類棋譜

阿法狗又毀了一個小目定式(圍棋AI太可怕)

阿法狗之父登《時代》人物榜 提前十年攻克圍棋

創造出「阿法狗」的是怎樣的人

《棋魂》阿法狗和褚嬴對局誰會贏?

從阿法狗大雪崩新變化說起

人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo

人機大戰落幕 阿法狗3:0全勝柯潔落淚

周日上演|《挑戰阿法GO》圍棋童話劇

神之一手實現終極逆襲 人類首次戰勝"阿法狗"

輸給阿法狗又怎樣,至少贏了王思聰

手把手教你打造自己的「阿法狗」

不是誰都能成阿法狗 日本圍棋AI輸給人

阿法狗算什麼?這個星球最聰明的人說:零來了擺脫人類自學成才

網曝Master是新版阿法狗與網站籤有保密協議

柯潔:阿法狗是圍棋上帝我輸得完全沒有脾氣

阿法狗之父登《時代》人物榜提前十年攻克圍棋

人機大戰落幕阿法狗3:0全勝柯潔落淚

神之一手實現終極逆襲人類首次戰勝"阿法狗"

不是誰都能成阿法狗日本圍棋AI輸給人