把柯潔虐哭的阿法狗被「新一代」Alpha Go Zero虐死,人工智慧也太可怕了!

2021-01-19 新民周刊


文 | 孔冰欣

 

曾經,有(幾)只「別人家的狗狗」,縱橫棋壇,打遍天下,連連擊敗圍棋界的高手高手高高手,震驚了世界。就連我們的傲嬌星人柯潔老師,在與「地球最強狗狗」對決的過程中,也被狠狠「虐」了一把,心有不甘地留下男兒淚,不得不跑到廁所調整心情,由衷感嘆人工智慧的強大。

 

姓名:AlphaGo(Fan,Lee,Master,Zero)


1. 擊敗樊麾

2015年10月,AlphaGo擊敗樊麾,成為第一個無需讓子即可在19路棋盤上擊敗圍棋職業棋手的電腦圍棋程序,寫下了歷史,相關成果在2016年1月發表於Nature。


2. 擊敗李世石

2016年3月,AlphaGo在一場五番棋比賽中4:1擊敗頂尖職業棋手李世石,成為第一個不藉助讓子而擊敗圍棋職業九段棋手的電腦圍棋程序,再創歷史。五局賽後韓國棋院授予AlphaGo有史以來第一位名譽職業九段。


3. 排名短暫超越柯潔

2016年7月18日,AlphaGo在Go Ratings網站的排名升至世界第一。但幾天之後被柯潔反超。


4. 化名「Master」橫掃棋界

2016年底至2017年年初,再度強化的AlphaGo以「Master」為名,在未公開其真實身份的情況下,借非正式的網絡快棋對戰進行測試,挑戰中韓日臺的一流高手,60戰全勝。


5. 戰勝柯潔,成為世界第一

2017年5月23至27日烏鎮圍棋峰會,最新的強化版AlphaGo和世界第一棋手柯潔對局,並配合八段棋手協同作戰與對決五位頂尖九段棋手等五場比賽,獲取3比零全勝的戰績,團隊戰與組隊戰也全勝。這次AlphaGo的運算資源消耗僅為贏李世石版本的十分之一。在與柯潔的比賽結束後,中國圍棋協會授予AlphaGo職業圍棋九段的稱號。


 

大家猜得到這開頭,卻想必猜不到後續的發展。一物降一物,這(幾)只偉大的「狗狗」——AlphaGo(阿法狗)在踩碎了圍棋愛好者的一地玻璃心之後,終於被家族的「新世代」——AlphaGoZero給收拾了。近日,《自然》(Nature)雜誌發表了一篇題為Mastering the game of Go without human knowledge(不使用人類知識掌握圍棋)的論文,詳細介紹了阿法狗的Daddy們、即谷歌DeepMind團隊最新的研究成果:AlphaGo Zero從圍棋小白起步,不需要任何歷史棋譜的指引,更不需要參考人類任何的知識經驗,純靠個人強化學習(reinforcementlearning)和參悟,棋藝力壓家族前輩,成為「真·傳說中的·百戰百勝」,100-0擊潰前任哥哥。

 

 

DeepMind的創始人+CEO Demis Hassabis

 

眼冒金星、智商不夠用的小編,在啃了若干篇對該論文的解讀後,鬥膽嘗試用「說人話」的方式,儘量深入淺出,先為親愛的讀者們梳理下AlphaGoZero的特點(如有未盡之處,請大家輕拍):

 

•從零開始學習,不需要任何人類的經驗

•使用更少的算力得到了更好的結果

•發現了新的圍棋定式

•策略網絡和價值網絡成為一個神經網絡

•無需進行隨機推演(Rollout)

……


 

 突破「白板理論」 

 

所謂「白板理論」(Tabula rasa),其實是哲學上的一個著名觀點:嬰兒生下來白板一塊,通過不斷訓練、成長獲得知識和智力。據此,AI 領域的先驅圖靈曾經提出了著名的「圖靈測試」,認為只要能用機器製造一個類似小孩的 AI,然後加以訓練,就能得到一個近似成人智力,甚至超越人類智力的AI。

 

現代科學則指出,嬰兒不能算純粹的「白板」,生物億萬年的進化,導致人類幼時初初睜開眼睛,就天然具備「偏愛高熱量食物、餓了就哭鬧引起注意」的本能策略。而和人類嬰兒相比,計算機才是實打實的「白板」,於是,一場新討論開始了:監督學習(Supervised Learning)和無監督學習(Unsupervised Learning),哪種方式更適合讓機器從零開始獲得智能?顧名思義,前者強調要把人類的經驗灌輸給機器,後者強調讓機器自己摸索萬事的規律。(小編打個不是最恰當的比方,前者有點像死記硬背式的教育,後者有點像自由散漫的放養式教育……)

 

阿法狗超人的棋藝,是建立在計算機海量學習、參悟人類棋譜、棋藝的基礎之上的,就算我們輸了,至少可以聊以自慰:你小子,也別得意,再牛,祖師爺還是我們人類!可是,AlphaGoZero,乃無監督學習的產物。通過幾天的訓練——包括近500萬局自我對弈——AlphaGoZero便上了天,分分鐘「秒殺」人類不算,還打敗之前所有的AlphaGo版本(包括監督學習的版本)。敲黑板劃重點:據悉,達到這樣驚人的水準,AlphaGoZero用的時間比前任阿法狗短得多了!一個花了幾天工夫,另一個則花了幾個月的工夫。更可怕的是,隨著程序訓練的進行,AlphaGoZero獨立發現了人類用幾千年的時間才總結出的圍棋規則,且建立了新的戰略,為古老的遊戲帶來全新的見解。

 

這說明了什麼問題?說明「你好,人類」「再見,人類」,把「人類」甩了的計算機,貌似反而進步得更快。人類的智慧與經驗,好像已經顯得多餘、「拖後腿」了。

 

柯潔評價:

 

扎心,淚目……


算法改進,讓AlphaGoZero更強

 

由於在硬體和算法上的進步,AlphaGo變得越來越有效率

 

如上圖所示,由於在硬體和算法上的進步,「AlphaGo」系列變得越來越有效率。優秀的算法不僅僅能降低能耗,也能極大提高效率。另外,這也表明圍棋問題的複雜度並不需要動用大規模的計算能力,那是浪費。

 

Deepmind博客介紹,AlphaGo Zero採用了新的強化學習方法,從一個不知道圍棋遊戲規則的神經網絡開始(如前文所述,「白板」),然後通過將這個神經網絡與強大的搜索算法結合,實現自我對弈了。在這樣的訓練過程中,神經網絡被更新和調整,並用於預測下一步落子和最終的輸贏。

 

這一更新後的神經網絡將再度與搜索算法組合,這一過程將不斷重複,創建出一個新的、更強大版本的AlphaGo Zero。在每次迭代中,系統的性能和自我對弈的質量均能夠有部分提高。最終的神經網絡越來越精確,AlphaGo Zero也變得更強。

 


感興趣的朋友們,可自行搜索論文原文,進行深度學習。(小編怕再說下去,就誤人子弟遭群毆了……)

 

對於人工智慧的發展,我們期待能用來幫助人類攻克諸如蛋白質摺疊、製造出治療疑難雜症的藥物、減少能源消耗、尋找革命性的新材料等等重大難題與挑戰。有專家表示,「目前,人工智慧和人甚至動物相比,所知所能依然有限……不要盲目追逐流行的東西,要審時度勢,踏實做積累,看準了坑再跳」;此外,「機器經驗與人類經驗有很大差別,我們該如何去選擇和利用呢?」

 

總結,現在,人類應該還不用擔心被人工智慧「滅」了,未來如何,則尚待定論。不過,人類的智慧也好,機器的智慧也好,我們肯定「智慧」本身,而把「智慧」用在什麼地方,是比「智慧」本身更複雜的命題。希望一切的「智慧」,都可以讓生活變得更美好吧——這也許是非常天真的想法,而我們情願這麼想。


然而對AI取代人類的焦慮,卻也已經是全球化的了。



轉載請後臺聯繫周刊君,獲得授權!

轉載時,須註明作者、出處和微信號。

相關焦點

  • 阿法狗並不是真正的人工智慧:3分鐘讓你徹底明白阿法狗如何下棋
    原標題:阿法狗並不是真正的人工智慧:3分鐘讓你徹底明白阿法狗如何下棋 阿法狗很強大,它的強大是由於它的原理和算法,這是大家都知道的,但具體咋回事,可能很多人就說不上來了。
  • 人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo
    0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo(1769字)。公號由秦隴紀發起,未覆蓋各領域科普及簡化,期待大家參與~】 人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo(1736字)2016年底AlphaGo阿法狗4-1打敗世界冠軍Lee Sedol
  • 阿法狗2.0版來了!這次人工智慧要正式摒棄人類棋譜
    阿法狗2.0版來了!新版「阿法狗」將正式摒棄人類棋譜,只靠計算機自身深度學習的方式成長——即探索「深度學習」方式的極限,臻至「圍棋之神」的境界。2.0版的AlphaGo,將通過數學模型下的自我對局和深度學習,下出真正屬於人工智慧(AI)的圍棋。柯潔微博。
  • 阿法狗又毀了一個小目定式(圍棋AI太可怕)
    阿法狗又毀了一個小目定式(圍棋AI太可怕) 一般來說,一手棋,圍棋AI給出的勝率從54%降到了51%
  • 阿法狗算什麼?這個星球最聰明的人說:零來了 擺脫人類自學成才
    ▲2016年3月9日,韓國棋手李世石九段及女兒與「阿爾法圍棋」創始人德米什·哈薩比斯(前左)合影 圖據新華社從「人工神經網絡研究」到「脫離人類認知」,新一代的阿法狗到底有什麼不同在今年5月烏鎮一役完勝人類第一高手柯潔、宣布就此封盤退役的阿法狗為何在短短數月之後又捲土重來?紅星新聞記者19日晚在第一時間連線到了阿法狗之父、谷歌Deepmind公司CEO德米什·哈薩比斯,他向我們獨家揭秘了新一代阿法狗之謎。
  • 還記得那個打敗了柯潔的阿法狗嗎?新一代阿法星已全面超越人類
    原本人們以為圍棋將會是人類引以為傲的智商唯一保留地,然而阿法狗擊碎了這一切,從一開始戰勝韓國著名棋手,再到後來戰勝中國最強棋手柯潔,阿法狗已經用多次的實戰證明了自己已經是不敗之神,而都得益於它的特殊機制,跟完全的死記硬背不同的是,阿法狗是通過自己去看數萬場棋局,然後學習經驗並且優化自己。
  • 創造出「阿法狗」的是怎樣的人
    在Deepmind公司公布的一段視頻中,有人就留意到,在「阿法狗」與樊麾對弈時,「阿法狗」的介紹標籤上貼著一個英國國旗。而這一次「阿法狗」挑戰韓國的世界冠軍李世石,現場的選手信息介紹中,也同樣給「阿法狗」貼上了一個英國國旗。
  • 新版「阿法狗」迅速成為圍棋霸主
    這款新程序名叫「阿法元」(AlphaGo Zero),其以100比0的不敗戰績,狠狠打擊了曾書寫歷史的舊版「阿法狗」。  實力,「阿法狗」的輝煌戰績  人工智慧「阿法狗」出自谷歌旗下深度思維(DeepMind)公司。
  • 神之一手實現終極逆襲 人類首次戰勝"阿法狗"
    昨天,備受矚目的阿爾法人工智慧圍棋與韓國棋手李世石的第四番較量如期而至。經歷了前三次的失敗,李世石終於扳回一局,捍衛了人類的榮譽,而他在第78手的一招妙棋更是被看做打亂「阿法狗」節奏的神之一手。明天,在本次人機大戰的收官一局中,李世石將執黑再戰「阿法狗」。
  • 《棋魂》阿法狗和褚嬴對局誰會贏?
    那我們就看褚嬴和阿法狗對局誰會贏?(AlphaGo是第一個擊敗人類職業圍棋選手的的人工智慧機器人)阿法狗是一個具有學習技能的人工智慧,阿法狗在圍棋方面的學習和計算能力遠超人類。「對於AlphaGo的自我進步來講,人類太多餘了。」而在計算能力上,阿法狗大約相當於1000臺計算機的運算能力,一個普通人類的大腦對抗1000臺計算機的計算能,好像褚嬴並不佔優勢。
  • 谷歌DeepMind團隊新AI研究:阿法元無師自通,百戰百勝阿法狗
    人工智慧的一項重要目標,是在沒有任何先驗知識的前提下,通過完全的自學,在極具挑戰的領域,達到超人的境地。去年,阿法狗(AlphaGo)代表人工智慧在圍棋領域首次戰勝了人類的世界冠軍,但其棋藝的精進,是建立在計算機通過海量的歷史棋譜學習參悟人類棋藝的基礎之上,進而自我訓練,實現超越。可是今天,我們發現,人類其實把阿法狗教壞了!
  • 手把手教你打造自己的「阿法狗」
    可你最近還是到處跟人大談「阿法狗」,就好像那就是你姥姥家的旺財一樣。    有沒有覺得「阿法狗」萌萌噠?   一時間,「阿法狗」成為了高科技、人工智慧的代言者。你當然不可能在寵物店找到這隻「阿法狗」,這套大名叫做AlphaGo的智能設備有錢你也買不到。不過,紳寶君能保證你可以輕鬆打造出屬於自己的「阿法狗」——還能到處跑的那種。
  • 網曝Master是新版阿法狗 與網站籤有保密協議
    據華西都市報-封面新聞記者了解,MASTER正是新版「阿法狗」,目前處於公測階段,由於這臺「新狗」重出江湖之前,與弈城、野狐等國內知名圍棋對弈網站籤有保密協議,因此到目前為止,我們不可能得到對弈網站方面的官方承認。但正如一位成都業餘圍棋高手所言——只有「阿法狗」才能如此碾壓人類的頂尖高手,這是一個最簡單的推理,不需要官方證實。
  • 從阿法狗大雪崩新變化說起
    大雪崩、妖刀、大斜被譽為最難解的三大定式,正在進行的歐洲圍棋大會上,樊麾老師演講中談到了阿法狗對於大雪崩的看法。不禁又想到吳大師的那句話:圍棋定式不應叫「定式」大雪崩內拐定式最長出現的局面,至此雙方正常進行。
  • 人機大戰落幕 阿法狗3:0全勝柯潔落淚
    阿法狗在不斷進化實際上與柯潔對戰的阿法狗並不是與李世石對戰的阿法狗,李世石也在採訪中確認了這一點,他認為下法更加直接明確,不會出現一些莫名其妙的布局,牢牢掌控了整盤。
  • 第一次人機大戰阿法狗的五路尖衝,是學自李世石
    早期的阿法狗遍覽人類棋譜,猶如悟出九陰真經的黃裳熟讀天下道家之書,無師自通、內外兼修,終成一代大師。  在與人類勝負師李世石的人機大戰中,最令人盪氣迴腸的非第4局莫屬,此局造就了李世石"神之一手"的傳奇。
  • 阿法狗挑戰星際爭霸打不過簡單電腦 網友腦洞:天網的陰謀
    官方:《星際爭霸》太難了官方以一篇長博客解釋阿法狗碰壁原因,認為目前核心問題在於阿法狗還無法像人類那樣,同時處理多種事物,而且像《星際爭霸》這類的遊戲的操作空間太大。,對人類來說非常簡單,但阿法狗卻需要進行長期的訓練。」
  • 柯潔:阿法狗是圍棋上帝 我輸得完全沒有脾氣
    柯潔:阿法狗是圍棋上帝 我輸得完全沒有脾氣 暴風體育訊(陶冶 浙江烏鎮報導)5月
  • 醉漢陽臺狠踹狗狗10腳,兒子哭求:爸爸不要打了!狗狗死了
    導讀:醉漢陽臺狠踹狗狗10腳,兒子哭求:爸爸不要打了!狗狗死了深圳一名男子回家一開門就看見「滿地屎尿」,再加上喝了酒,拿起一旁的棍子對狗狂砸,不只如此,還把毛孩踢到牆角,狠踹10幾腳;狗狗的哀嚎聲傳遍整個社區,一旁目睹全程的孩子哭喊著:「爸爸不要打了!狗狗死了」。
  • 柯潔對戰阿爾法狗完敗也不用怕 阿法狗只是一條"狗"而已
    柯潔對戰阿爾法狗完敗也不用怕 阿法狗只是一條"狗"而已  柯潔必然完敗,阿爾法狗才是圍棋界的"上帝"  首先來看看阿爾法狗的歷史:  阿爾法圍棋(AlphaGo)是一款圍棋人工智慧程序,由谷歌(Google)旗下DeepMind公司的戴密斯·哈薩比斯