Master就是AlphaGo升級版!60連勝背後看專家怎麼評說

2020-12-06 36kr

編者按:本文來自微信公眾號「新智元」(ID:AI_era),作者弗格森、序媛,36氪經授權發布。

2017年1月4日晚上,Master 完勝第59盤棋的時候,突然發聲自認:「我是 AlphaGo 的黃博士」,Master之前以橫掃千軍的姿態戰勝幾乎所有中國的圍棋大師,包括「棋聖」聶衛平和柯潔。本文帶來新智元智庫專家白碩、鄧侃的獨家解讀。同時,國內圍棋AI 的一名開發者也透露了他的看法:Master的水平略有些讓人失望。新智元還採訪了中國圍棋隊總教練俞斌,他在文中談了自己的看法和理解。這一次,機器可能不再借用人類經驗,而是憑藉自我對弈和學習戰勝了人類,讓人類認識到另一個「真理」的存在。從某種程度上來說,這是一個新的「紀元」的開啟。

1月4日晚間,此前橫掃圍棋界的神秘大師「Master」 忽然發聲,自亮身份,它寫道:我是AlphaGo 黃博士。

此時,Master 剛剛取得第59場不敗紀錄,將對戰人類棋手的紀錄變為59:0。此前,人們的猜測是Master在完成60場比賽後,會隱退,或者發聲。但是,沒有人想到,在59場的時候,Master自己亮明了身份。

官方聲明:

Master 已經在線上平臺上接連戰勝了聶衛平、柯潔、樸廷桓、唐韋星、範廷鈺、王古力、周俊勳和黃雲嵩等多位圍棋高手。

戰勝「棋聖」,黃博士是誰?

2017年下午3點04分,聶衛平執白3又1/4子之差負於Master,Master取得第54勝!

聶衛平在圍棋圈有「棋聖」之稱,只是這次,他也拿Master沒辦法。對弈結束後,Master 用繁體字打出了「謝謝聶老師」的消息。這個時候,其實Master的身份已經有所暗示了。後來Master所說的「黃博士」,指的是黃士傑博士。黃博士是臺灣人,習慣用繁體。

如果大家有看3月份李世石與 AlphaGo 的對奕的話,應該會注意到在李世石對面有個將 AlphaGo 的棋步下到棋盤,並且將李世石的棋步再輸到電腦上的人。這位就是谷歌 DeepMind 的資深研究員,也是 AlphaGo 的主要程序開發者,臺灣出身的黃士傑博士。

黃士傑(前左)在替AlphaGo 執子

黃士傑博士畢業於臺灣師範大學,博士論文就是以「應用於電腦圍棋之蒙地卡羅樹搜索法的新啟發式演算法」,本身也是業餘六段的圍棋棋手。

此前,黃士傑在接受Engadget的採訪時曾說,如果再給 AlphaGo 一年半載的話,說不定李世石真的就是史上唯一贏過 AlphaGo 一場的人了...

果然,半載之後,我們看到令人嘆服的結果。

Master的技術沒有想像的那麼好?

對於此次掀起風暴的Master,新智元智庫專家白碩評價說:

  • 第一,並不意外。如果世界上還有另外一個團隊達到這樣的水平反而是意外。

  • 第二,又有進步。現在的AlphaGo水平比去年戰勝李世石的時候發揮更穩定、對人類棋手更有啟發性,對人類觀眾更有觀賞性,導致人類對棋理的認識正在醞釀重大的突破。

  • 第三,還有潛力。按現在勢頭發展,基於對弈棋譜的深度學習和基於左右互搏的增強學習正在形成良性互動的局面,但願這一階段不要過快結束(否則就跑步進入機器跟人類沒得可學的階段了)。

  • 第四,除了不斷增強對弈能力外,讓機器以人類能理解的方式講述其棋路,以全新的體驗變革人類傳授和學習圍棋的方式,其意義不亞於戰勝人類。

新智元問及其他的機器包括國內的一些圍棋AI是否有機會超越Master呢?是否需要重大算法突破才能破解Master的時間積累優勢?

白碩說:「我知道有人在做。如果能大幅提高算法的效率,就意味著在同樣時間內可以遍歷更多有意義的變化,增強學習會做得越好。個人判斷,算法上的優化仍有空間,趕超仍有機會。未來機器之間的對弈會是新的看點。」

然而,也有專業人士表示有些失望。一位要求匿名的中國某大型網際網路公司AI開發者對新智元表示,Master 橫掃人類棋手毫不意外,但是對過程有點失望,Master的技術沒有想像的那麼好,畢竟去年7月份 Aja Huang 在一次演講中透漏可以讓頂尖棋手2子,半年過去了,看不出一定能讓2子。也許這並不是最新版。

棋風奔放怪異,因為沒有學習過人類棋譜?

在DeepMind官宣之前,「Master」的身份激發了多方猜測,有不少人認為這就是AlphaGo的升級版,但與後者不同的是「Master」的招法極其奔放,推翻了很多人類棋手常走的定式,棋風與去年3月的AlphaGo大不相同。  

值得注意的是,DeepMind公司創始人Hassabis 曾在一次採訪中透露,他們正在嘗試訓練一個沒有學習過人類棋譜的人工智慧,而這可能就是Master和AlphaGo不同的原因。

CMU 博士鄧侃對新智元表示:

3月份AlphaGo 與李世石對決第一盤,取得勝利後,就說明算法已經超越人類頂級高手。接下去的幾盤,AlphaGo 贏了,這是預料之中。輸了一盤,反倒有點奇怪。因為算法只會越變越強大。

隨著訓練越來越強化,AlphaGo 的棋藝越來越精緻,這是自然而然的趨勢。戰勝所有人類高手,只不過是時間的問題。但是看不出 (現在的)AlphaGo 的算法,有本質突破。至少沒有讀到 DeepMind 在這個領域的新論文。

AlphaGo 系統中,有  Monte Carlo tree search(蒙特卡洛樹搜索),不妨把它理解為左右手互博。互博時間越長,實際上就是把各種可能的對弈方案,統統演練一遍。所以,AlphaGo 的訓練時間越長,它對各種對弈方案的了解就越全面。

在自我對弈中成長起來的新AlphaGo,可能完全不需要人類棋譜。

被認為與AlphaGo「必有一戰」的世界第一柯潔,在這次對戰中也敗下陣來,但是柯潔在微博上寫的感想倒是很值得深思。

他寫道:「新的風暴即將來襲。我從3月份到現在研究了大半年的棋軟,無數次的理論、實踐,就是想知道計算機到底強在哪裡。昨夜輾轉反側,不想竟一夜難眠,人類數千年的實戰演練進化,計算機卻告訴我們人類全是錯的。我覺得,甚至沒有一個人沾到圍棋真理的邊。但我想說,從現在開始,我們棋手將結合計算機,邁進全新的領域達到全新的境界。  

專訪中國圍棋隊總教練俞斌:慢棋是人類最後的機會,但是懸念不大

在Master身份明確後,新智元第一時間聯繫了中國圍棋隊總教練俞斌進行專訪。

新智元:您覺得人類棋手還有機會嗎?  

俞斌:基本上沒有。只留有一絲懸念,就是長時間的慢棋,但只是懸念,我判斷慢棋也不行。

新智元:如果下慢棋,人類棋手最後的突破口可能是什麼呢?

俞斌:慢棋人的錯誤會少很多,但能否一爭勝負有懸念。感覺可能性很小。

新智元:之前有人認為,人類棋手以後只和人類比,而機器棋手只會和機器棋手對決了,您認為圍棋最後是這樣嘛?

俞斌:人與人比會,機器與機器比也有,但不會只是這兩種。人與機器,人帶機器,用時、讓子等等,還是會有不少比的類型的。也許會有機器參加的團隊賽等等

新智元:看來機器的加入反而有了更多玩法。那麼您認為機器的出現,看起來像人類的天花板,人類圍棋是否會放下勝負心,真正實現人和人對圍棋本身的享受呢?

俞斌:哲學問題😳 。圍棋是勝負的遊戲。享受的是勝負的樂趣。有人工智慧高手,並不影響享受圍棋的樂趣。沒有勝負而享受圍棋,我理解不了。這是我個人的哲學觀點。

一次橫掃千軍的網絡對戰,Master的進擊之路

12月29日晚19點多,一位名叫「Master」的新手登錄弈城,起初沒有高手搭理,但在戰勝謝爾豪四段、孟泰齡六段、於之瑩五段、韓一洲四段、喬智健四段後這個帳號熱度陡增。這晚Master十戰全勝,已註定其出世不凡。  

第二天中午「Master」再度現身,在對王昊洋六段、嚴在明三段等職業棋手4連勝後,終於引出了韓國第一人樸廷桓九段。重頭戲開始上演,結果也是重量級的,樸廷桓在必敗局面下超時負。此結果在高手中炸了鍋,接著等級分排名第7的連笑七段登場挑戰,卻連敗兩場!值得注意的是,緊接著Master與帳號為「吻別」的網絡棋手交鋒兩次,均以中盤獲勝。弈城網工作人員表示,「吻別」很有可能就是擁有4個世界冠軍頭銜的當今世界圍棋第一人柯潔。如果「吻別」真是柯潔,那就意味著Master對當今中、韓第一人的戰績是6:0。  

31號,「Master」又連續戰勝各大挑戰者,其中新科百靈杯冠軍陳耀燁九段也以失敗告終,最後的最後,這位堪比「掃地僧」的神秘高手連續30盤不敗,像是在逗大夥玩似的來了句:「今天累了,明天休息一天。」  

最終敗在「Master」棋下的有江維傑九段、辜梓豪五段、樸永訓九段、柁嘉熹九段、井山裕太九段、孟泰齡六段、金志錫九段……  

連一旁觀戰的柯潔九段都大驚失色:「從來沒見過這樣的招法,圍棋還能這麼下?」為此他感嘆:看Master的著法,等於說以前學的圍棋都是錯誤的,原來學棋的時候要被罵的著法現在Master都下出來了。」同樣的,知乎網友 @趙小康 評論道,Master對陣這些圍棋高手,「大多數對局都是中盤取勝,人類數千年時間總結出的定式、大局觀在master面前顯得陳腐可笑。」

1月3日9:30,棋手古力九段按捺不住,最終發出10萬元懸賞,獎勵給戰勝Master的勇士。但其後又有4位頂尖棋手被擊敗……  

不過就在51場連勝之後,1月4日,「Master」第52盤以和棋結束,「Master」的51連勝紀錄就此終止。這場比賽中,「Master」挑戰中國圍棋職業選手陳耀燁。「Master」執黑棋、陳耀燁執白棋,30秒3次快棋。不過陳耀燁出現了斷線情況,30秒沒有落子,系統判定和棋。  

今日,「Master」出現以來最受矚目的比賽在Master和聶衛平之間進行。年屆64歲的中國棋聖和「Master」的比賽也是這個人工智慧程序進行的第54局比賽。本局「Master」特意把比賽用時調整為每方1分鐘一手,以示對聶衛平的尊敬。  

最終本局進行至手,執白的聶衛平以7目半的劣勢落敗。本局「Master」在右上角下出犀利的手段,吃掉了聶衛平一塊棋由此確立優勢,並保持到了最後。而隨著棋聖聶衛平落敗,「Master」將自己的不敗紀錄延續至54場,中日韓高手無一能在這次「快棋」對決中取勝。

4日晚,隨著古力敗下陣來,Master 對人類棋手獲得了60場不敗的記錄。

AlphaGo 技術原理

AlphaGo 從三月份至今,經過10個月的發展,已經有了非常長足的進步,不過要追溯其技術原理,最詳細的還是三月份發表在Nature 的封面論文:Mastering the game of Go with deep neural networks and tree search(通過深度神經網絡和樹搜索,學會圍棋遊戲)。

AlphaGo 給圍棋帶來了新方法,它背後主要的方法是 Value Networks(價值網絡)和 Policy Networks(策略網絡),其中 Value Networks 評估棋盤位置,Policy Networks 選擇下棋步法。這些神經網絡模型通過一種新的方法訓練,結合人類專家比賽中學到的監督學習,以及在自己和自己下棋(Self-Play)中學到強化學習。這不需要任何前瞻式的 Lookahead Search,神經網絡玩圍棋遊戲的能力,就達到了最先進的蒙特卡洛樹搜索算法的級別(這種算法模擬了上千種隨機自己和自己下棋的結果)。我們也引入了一種新搜索算法,這種算法將蒙特卡洛模擬和價值、策略網絡結合起來。

通過將 Value Networks、Policy Networks 與樹搜索結合起來,AlphaGo 達到了專業圍棋水準,讓我們看到了希望:在其他看起來無法完成的領域中,AI 也可以達到人類級別的表現!

DeepMind 團隊對圍棋項目的介紹(新智元翻譯)

相關焦點

  • 60連勝,謎底揭曉 Master宣布自己是AlphaGo
    60連勝,謎底揭曉 Master宣布自己是AlphaGo 2017-01-05 01:07:07來源:重慶晨報作者:${中新記者姓名
  • 60盤連勝 狂掃棋壇高手 神秘Master就是AlphaGo!
    Master這個神秘的「大師」,在兩個在線圍棋平臺上線,截至3日已經連勝樸廷桓、元晟溱、柯潔,把自己的連勝紀錄擴大到54盤。「Master」是誰?直到1月4日晚間,在Master拿下第59場勝利後,Master帳號才宣布自己就是AlphaGo,而代替其執子的就是AlphaGo團隊中的黃士傑博士。
  • AlphaGo強勢回歸!「血洗」圍棋界,獲60連勝,完勝柯潔、聶衛平等一...
    晚間,Master又贏了世界冠軍 周睿羊 ,獲得第 59 場連勝的傲人戰績。與此同時,Master終於揭開神秘面紗,承認自己就是 AlphaGo 團隊的黃士傑。之後「Master」還宣布第 60 局對手為中國的古力九段,結果並未能出意外,Master對人類圍棋高手的戰績停留在60勝0付1和,和的這一場還是因棋手掉線系統自動判和,這是人類撿的一個漏 。
  • 柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我
    【文/觀察者網 周遠方】昨夜,「半狗」柯潔贏了一隻41連勝的「小狗」,輾轉難眠…… 他在今天(18日)凌晨0時23分發微博感嘆: 一個AI滿地走的時代...除了alphago以外,這個暱稱為「符合預期」的AI尤其強,實力應該已經遠超當時與李世石對弈的alphago了吧?...
  • 柯潔對戰master全場圍棋比賽完整視頻 master柯潔棋譜介紹
    master柯潔比賽直播視頻完整版在線觀看,master柯潔棋譜介紹。1月3日晚,紅遍網絡的神秘棋手「Master」如約登錄了騰訊圍棋對弈平臺,先送韓國第一人樸廷桓5連敗,再勝另一位韓國世界冠軍元晟溱,取得對人類的49連勝後,迎來了對柯潔的終極之戰!
  • 連刷勝場數據的Master是阿爾法狗升級版?
    從12月29日開始,它開始在弈城、野狐等圍棋對戰平臺上輪番挑戰各大圍棋高手,截至1月3日23點30分,已經取得了不可思議的50連勝。「最新進展:1月3日晚,紅遍網絡的神秘棋手「Master」如約登陸騰訊圍棋對弈平臺,先後對壘了韓國棋手樸廷桓九段、元晟溱九段以及中國棋手何潔九段。結果Master在這三場較量中戰勝人類棋手,目前已經取得50連勝。」
  • Master挑戰人類高手60連勝 承認是阿爾法狗
    從去年12月29日「上線」到1月4日,短短的7天之內,一個名為「Master」的神秘帳號在多家網絡圍棋平臺連續挑落50多名世界圍棋高手,取得60連勝。  特別值得一提的是中日韓三國的最強選手:柯潔、井山裕太和樸廷桓三人,無一倖免,均被「Master」挑落馬下。
  • 神秘「大師」原來是新版AlphaGo 對人類保持60連勝
    聶衛平  昨晚,隨著Master取得對中日韓頂尖高手的59連勝,它的神秘面紗也終於摘下:Master自己宣布它就是此前戰勝李世石的人工智慧AlphaGo(新版),而代為執子的就是隨後,Master將第60盤挑戰的機會留給古力,但結果仍是Master勝出,它以60連勝0負的戰績結束了這次網測,卻給棋手和棋迷留下了無限的遐想空間。  作為中國圍棋旗幟性的人物,聶衛平昨天下午向「Master」提出挑戰。因為家裡網絡有問題,聶衛平專程前往野狐圍棋網去下棋。因為北京交通情況不理想,老聶在路上堵了好一會兒才到網站。
  • 60連勝Master實為AlphaGo 圍棋界:打破職業棋手思維定式
    果然,一年之後圍棋界又殺出來了一個Master,歲末年初的短短7天,對戰高手豪取60連勝。所說的高手可不是隨便戴的高帽,Master的手下敗將包括中、日、韓目前最意氣風發的棋士柯潔、樸廷桓、井山裕太、新科應氏杯世界冠軍唐韋星,甚至包括棋聖聶衛平。  輕鬆取勝後,Master在屏幕上自揭身份,原來它就是披了馬甲的AlphaGo。一年不見,「這位」人工智慧棋藝大漲。
  • 柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo
    前不久,《自然》雜誌刊登了谷歌DeepMind團隊的新成果,名為AlphaZero的人工智慧程序完全靠自我對弈學習下棋,不依賴人類圍棋經驗,僅訓練3天就戰勝了AlphaGo Lee,比分100:0,後者就是戰敗李世石的那套。經過40天訓練後,Alpha Zero又以89:11戰勝了Alpha Master,即橫掃柯潔的那套。
  • master是什麼意思,為何能改變圍棋的靈魂
    在剛剛過去的2016年裡面,有一個事件的出現完全打破了圍棋界的傳說,那就是master,這個master是什麼意思?從2016年12月29日晚起,一個註冊為「master」、標註為韓國九段的「網絡棋手」接連「踢館」弈城網和野狐網。截至2017年1月3日夜迫使有「當今圍棋第一人」之稱的柯潔中盤投子後,master已經斬獲了50連勝,擊敗15位世界冠軍。外界普遍認為,這位master不是人類,而是人工智慧。但該AI是否就是谷歌旗下在2016年3月一戰成名的AlphaGo,尚不可知。
  • 「阿爾法狗」重裝上陣60連勝,但不等於機器擁有智慧
    去年3月一戰成名的AlphaGo(阿爾法圍棋),在歲末年初化身為「Master」,進行60場網際網路棋局車輪大戰,挑落了幾乎所有的中日韓三國圍棋界的天才與泰鬥。隨後在當地時間1月4日清晨,谷歌DeepMind創始人兼CEO戴米斯·哈薩比斯(Demis Hassabis)發布推文稱,Master就是AlphaGo,正式宣布升級版的AlphaGo問世。
  • 別傻了,「Master」是不是AlphaGo根本就不重要
    至昨天晚間,迫使有「當今圍棋第一人」之稱的柯潔中盤投子後,Master 已經斬獲了 50 連勝,擊敗 15 位世界冠軍。而就在我們發稿前,「棋聖」聶衛平親自出手與 Master 較量,毫無懸念地大敗而歸,使得 Master 取得了 54連勝。而你不用懷疑,Master 這 54 場勝利的含金量簡直不能再高了。
  • Master 自曝真實身份,他與 AlphaGo 的關係居然是……
    這兩天在網際網路上引起圍棋界、人工智慧界無數高手與吃瓜群眾好奇困惑的 ID 今晚終於自揭身份——從 Master 的 ID 背後傳來一句消息:「我是 AlphaGo 的黃博士。」黃博士是在 Master 戰勝中國圍棋世界冠軍周睿羊拿下第 59 場連勝後,在公頻上直接公開發出這一消息的。
  • 恭喜你被騙了韓教授稱AlphaGo故意輸棋
    AlphaGo是經過深度學習研發而成的人工智慧,在最基礎的招式識別中反覆失誤高達十幾次,顯然這並不是AlphaGo的真實水平,也就是說他應該是放水了。那麼為何會放水呢?金珍鎬表示是為了削減人工智慧的成長水平之快速造成的人類恐慌而所致。 在李世石與AlphaGo對決前,大多數圍棋專家認為李世石將會贏得比賽,但是唯有金珍鎬認為AlphaGo將會完勝。
  • 鬥阿爾法狗後柯潔連勝二十場 摘全運會圍棋冠軍
    這也是柯潔自 5 月與 alphago 人機大戰後,取得的第 20 場連勝。「原來和人類下棋是那麼有趣」,被「阿爾法狗」3:0完虐後,柯潔如是說。自烏鎮圍棋峰會與AlphaGo三番棋對抗後,柯潔開啟連勝模式,算上今天這盤已經連勝了二十場。有棋友戲稱,在經歷「阿爾法狗」的歷練後,柯潔已榮升「半人半狗」,快來一個人類去阻止他吧。
  • 再看馬航MH370失蹤,60多位晶片專家喪生,背後真相讓人頭皮發麻!
    幾年前的馬航MH37飛機失蹤,當時花了很大的功夫,就是找不到失蹤的飛機。但是最新的消息,上邊有60多位晶片專家喪生,現在想來背後原因真是讓人頭皮發麻。但是這件事情引起了很大的反響,很多網友都是發表了自己的看法,有人認為是飛機出了問題,也有人說是有人在背後做小動作。但是現在突然傳出來消息,上面有著60多名晶片專家,而這些專家大多都是來自華為、中興以及中國電信等企業。  背後真相
  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」這些專家系統,很多是借用海量人類經驗和數據開發出來的。然而,在有些特定問題上,人類的知識要麼過於昂貴,要麼不靠譜,要麼無法獲得。因此,人工智慧研究的一個長期目標就是跳過這一步,創造能在最有挑戰性的領域,不用人類輸入就達到超人水平的算法。我們發表在《自然》期刊上的最新論文,展示了實現該目標的關鍵一步。
  • 圍棋Master到底是誰 阿爾法狗成重點懷疑對象
    不過,中國圍棋教練俞斌猜測這位Master很可能是阿爾法狗,當然也有可能是其他智能程序,總之,master的超強表現完全超越了人類的智力範疇,下面,我們一起來看一下詳細內容吧!他在前四屆中日圍棋擂臺賽中11連勝,為圍棋在中國大陸的普及產生了深遠影響。著有《我的圍棋之路》、《聶衛平自戰百局》等書。   本局「Master」特意把比賽用時調整為每方1分鐘一手,以示對聶衛平的尊敬。最終本局進行至手,執白的聶衛平以7目半的劣勢落敗。本局「Master」在右上角下出犀利的手段,吃掉了聶衛平一塊棋由此確立優勢,並保持到了最後。
  • 【話題】AlphaGo Zero!圍棋之神真來了……
    年底,Alpha Go升級版化身Master在網上對人類高手60連勝,震驚棋界。2017年5月第二次「人機大戰」,Alpha Go2.0版3比0勝柯潔九段,此後宣布不再與人對弈。Alpha Go Zero之所以能當自己的老師,是用了一種叫強化學習的新模式。