陳經:根據AlphaGo弈城圍棋網的疑似測試對局預測谷李大戰比分

2020-12-16 觀察者網

弈城圍棋網有一個帳號叫deepmind。2016年1月28號谷歌Deepmind小組開發的圍棋程序AlphaGo戰勝職業選手的勁爆消息出來之後，這個帳號名引發了棋迷的關注。之後AlphaGo的共同第一作者Aja Huang發貼說，這個帳號是他本人的，但否認是AlphaGo。對此我們根據deepmind的歷史戰績進行一些推測。

2014年4月2日，deepmind在弈城下了第一盤棋，一開始註冊是5D。半個月時間，這個帳號分別以17勝1負和15勝3負的成績，升上了6D和7D。弈城圍棋網5D及以上的升段規則是和同級別對手下「升降級對局」，最後20局裡勝15局升1段，全勝升2段。然後deepmind就在7D與8D之間上上下下，從2014年4月17日到2015年9月16日長達1年半的時間，一共五次從7D升到8D，四次從8D降到7D，下了300多盤。這個戰績是標準的強7弱8，也符合Aja Huang臺灣業餘六段的水平。這一切都很正常。

之後發生了奇妙的事情。2015年8月23日，deepmind第五次打上了8D，升段當天連下了6盤，還全輸了。之後到8月29號7連勝，9月4號5號又四連敗。然後到9月16號，8勝1負，累計戰績15勝5負，首次升上了9D！打上9D以後當天下了一盤，輸了。然後接近三個月沒下棋。一個強7弱8，偶而運氣爆棚衝上9D也是可能的，正常的軌跡應該是迅速掉下8。

接下來在2015年10月，谷歌和樊麾二段籤了保密協議，讓AlphaG和他下了5盤正式對局5:0，2016年1月28發布消息時棋譜也公布了。還有5盤非正式對局，樊麾贏了2盤，棋譜未公布。

2015年12月2號，deepmind重新開始在9D上下棋，一直到2016年2月28日，一共下了136盤。一開始就在9D上打了一波13勝2負，表現得象一個強9。然後12月底到2016年1月，一波8連敗掉到8D了，這個戰績到是很象強7弱8。然後迅速地15勝5負，2016年2月2日回到9D。升上9D又是一波15勝2負。之後時勝時負，一直在9D。

2月27號開始，deepmind更多地和職業棋手對局了。弈城帳號標註為P的是經過驗證的職業棋手，deepmind勝了mob(P)，輸給了另三位。對手中也有雖然未標註為P，但和職業棋手帳號互有勝負的強9，如amalauag，從歷史戰績看也是有職業棋手實力的。deepmind和amalauag下了三盤，2勝1負。

如果是Aja Huang本人下，很不可能對9d取得經常性的連勝，更不可能和職業棋手們互有勝負，差距應該在三子左右。合理推測，谷歌圍棋到弈城網上測試也屬正常。2月23號谷歌與李世石人機大戰發布會公布的信息，3月8號到15號代表AlphaGo與李世石在棋盤上進行五盤對局的，正是Aja Huang。他負責擺放棋子，並輸入招數到機器。這也可以說是Aja Huang在下棋，他發貼說deepmind是自己在弈城上下也可以解釋。谷李大戰在即，谷歌加緊測試，在弈城上更多找職業棋手過招。

如果說以上是基於戰績的推測，可以進一步看下棋譜的印記。

AlphaGo執黑對樊麾

這是AlphaGo與樊麾的第二盤對局，開局就是一個大雪崩定式。第31手，AlphaGo下了這招明顯異常的「點」，與白32擋交換。幾個職業棋手都指出，這個點和白擋的交換，有明顯的潛在損失。本來不點，黑擋在G2位是個先手，白要應的。現在有了白32立的硬腿，黑再要擋在G2位，就不是先手了，因為接下來黑收氣，白可以A2吃掉黑。

AlphaGo執黑對樊麾

如果一定要下點這招，那麼點了以後，黑也應該立刻A6爬回，與白A2交換。接下來黑A7接是先手，能保證黑是絕對兩眼活棋，還不損空。然而AlphaGo沒有走，如上圖讓樊麾38搶先扳到與AlphaGo的39接交換，空損了。接下來如果白B11點，黑這塊將只有一個眼。31的點以及後續讓白搶到38扳，AlphaGo的損失雖然不大，但確實是明顯的問題手。

2014年7月30日，阿含桐山杯8強賽柯潔執黑對古力

職業棋手和業餘高手肯定不會這樣下的。如上圖，古力對柯潔也下了同樣的大雪崩。古力第40手也點了，但點的時機是，白右邊S13的擋已經不可能下到了，不需要保留了。而且後來古力44手搶先爬回定型，保證兩眼。柯潔43手不能扳N19吃三子太小，古力44就爬了。

弈城圍棋網2015年12月6日，deepmind執白對Reminisce

上圖是deepmind和Reminisce的對局，也是大雪崩。第50手，deepmind和AlphaGo一樣下了這個點，也同樣沒有T6爬回，被對手55手搶先扳到。當然和AlphaGo那局一樣，虧的不多，對手也和樊麾一樣後面殺崩了迅速敗陣。

看到deepmind這個帳號在弈城圍棋網上離奇的戰績軌跡，以及棋譜上與AlphaGo的不謀而合，對網絡圍棋比較熟的棋友們大概心裡有數了吧。

顯然，這也是近來和deepmind對局的弈城9D及帶P的職業棋手們的感覺。他們和deepmind對局時似乎明白網絡另一頭是誰，紛紛出招測試，下了不少精彩的棋。

除去deepmind在9d上明顯是Aja Huang本人在下的連敗對局，大致可以評估一下它的實力。有興趣的可以到弈城圍棋下載客戶端、註冊帳號，自己查找deepmind的所有棋譜觀看。

對於一般的9d，deepmind，或者說背後的AlphaGo有明顯優勢，可以輕鬆地連勝。棋譜上表現出來就是大局觀好，空很容易就領先了，或者一個局部下來就佔了壓倒性優勢了。但也不是特別穩定，偶而會輸（也有可能是Aja Huang本人在下）。

deepmind對帶P的職業棋手，還佔不到什麼便宜，雖然也有勝局，但是負多勝少。這些出戰的職業棋手並非職業強手，大致要排名100名以後了，和李世石差距不小。但他們比樊麾的實力要強一些，對李世石也不是沒有勝機，不是讓先的水平差距。

之前李世石2月16日就人機大戰接受採訪時就說，除了與樊麾的對局，他還到網上找了三四盤AlphaGo的棋譜來研究，認為是自己讓先到二子的實力，有絕對必勝的信心。很可能他找的就是deepmind在弈城網的棋譜。之後deepmind在弈城上又和更強的對手下了多盤，感覺實力有所提升，李世石讓先不一定行。

大致可以判斷，AlphaGo在弈城上進行測試，表現出來的是職業棋手中較弱的水平，但顯然是有職業水平的。而且可能它是用單機版進行測試，人機對戰時顯然會用多得多的伺服器。但也不會帶來很大的水平提升，根據谷歌發表在《自然》上的文章，伺服器版對單機版也只有77%的勝率，大約3：1的戰績。

人機大戰將在2016年3月8日開戰，也沒幾天了。如果弈城上deepmind帳號這幾天的棋譜能體現AlphaGo的實力，那麼和李世石還是有著明顯的實力差距。但這種差距不是業餘棋手與職業棋手之間那種絕對水平的差距，已經可以談勝負概率了。

李世石必須小心應對，甚至不能有「上手心態」，必須把對手當作一個職業棋手來認真對待。特別的是，職業棋手對局，低手就算暫時領先，高手仍會有大把機會。因為低手面對「勝機」會出現心理波動，高手會選複雜的下，低手心理緊張再加時間不夠，犯錯送回來很常見。但AlphaGo的表現會非常穩定，算得也很快，李世石出了致命錯誤以後，想靠攪局翻盤不會成功。

李世石29日接受韓國電視臺採訪

李世石說，作為人類代表，要取得五盤全勝，因為輸一盤就會給出電腦將要取勝的危險信號。他想一盤不輸，必須從一開始就非常小心，抓住AlphaGo的一些不嚴謹的小錯，建立並擴大領先優勢。五盤對局，每盤雙方手數以250手計，李世石要下600-700手，出現致命錯誤的概率還是有的。

如果要預測比賽勝負，李世石肯定會獲勝，得到100萬美元獎金。五番棋高手的勝率遠高於單局勝率。柯潔對李世石如果有4：1的勝率（目前為7：2），他聲稱的「夢百合杯五番決賽李的勝機不足5%」在數學概率上就是一個合理估計。這次柯潔估計AlphaGo對李世石的勝機還不到5%，直覺上也是成立的。

但是這比賽不管勝負要下滿五盤，李世石想五盤全勝也不容易。預計谷李大戰，最後比分為4：1。李世石勝出維護人類尊嚴，但AlphaGo取得的進展也繼續令人驚嘆。

作者簡介：筆名陳經，香港科技大學計算機科學碩士，中國科學技術大學風雲學會研究員，棋力新浪圍棋6D。21世紀初開始有獨特原創性的經濟研究，2003年的《經濟版圖中的發展中國家》預言中國將不斷產業升級，挑戰發達國家，2006年著有《中國的「官辦經濟」》。

本文系觀察者網獨家稿件，文章內容純屬作者個人觀點，不代表平臺觀點，未經授權，不得轉載，否則將追究法律責任。關注觀察者網微信guanchacn，每日閱讀趣味文章。

陳經:根據AlphaGo弈城圍棋網的疑似測試對局預測谷李大戰比分

相關焦點

陳經:即使AlphaGo不出來下棋,我們還有絕藝

DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?

深挖圍棋AI技術:alphaGo在下一盤什麼棋?

AlphaGo首現Bug 圍棋算法死穴在哪兒?

圍棋世界冠軍檀嘯復盤班開始招生啦

master是什麼意思,為何能改變圍棋的靈魂

谷歌副總裁透露人機大戰多個細節:採用中國圍棋規則

人機大戰第二季柯潔不敵國產狗 AI圍棋群雄並起

阿爾法狗教你下棋谷歌上線AlphaGo圍棋教學工具

重磅| DeepMind官方確認Master身份:全面回顧AlphaGo的再度出山之旅

101圍棋網級別對應大致棋力

圍棋「人機大戰」升級版將上演,電腦能打敗人腦嗎?

獨立峰巔一覽眾山小樸廷桓弈城馬踏連營二十連勝

AlphaGo是什麼如何運行?人機大戰比賽規則+交手記錄資料

AI戰勝歐洲圍棋冠軍圍棋界怎麼說

【格弈網訓】1080元跟職業棋手學一年圍棋網課

擊敗了李世石九段的圍棋人工智慧「AlphaGo」究竟是什麼?

我是黃士傑,AlphaGo人肉臂

AI圍棋的千層套路②:阿法狗顛覆的圍棋理論開局爬二路翻身了?

陳經:根據AlphaGo弈城圍棋網的疑似測試對局預測谷李大戰比分

相關焦點

陳經:即使AlphaGo不出來下棋,我們還有絕藝

DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?

深挖圍棋AI技術:alphaGo在下一盤什麼棋?

AlphaGo首現Bug 圍棋算法死穴在哪兒?

圍棋世界冠軍檀嘯復盤班開始招生啦

master是什麼意思,為何能改變圍棋的靈魂

谷歌副總裁透露人機大戰多個細節:採用中國圍棋規則

人機大戰第二季柯潔不敵國產狗 AI圍棋群雄並起

阿爾法狗教你下棋 谷歌上線AlphaGo圍棋教學工具

重磅| DeepMind官方確認Master身份:全面回顧AlphaGo的再度出山之旅

101圍棋網級別對應大致棋力

圍棋「人機大戰」升級版將上演,電腦能打敗人腦嗎?

獨立峰巔一覽眾山小 樸廷桓弈城馬踏連營二十連勝

AlphaGo是什麼如何運行?人機大戰比賽規則+交手記錄資料

AI戰勝歐洲圍棋冠軍 圍棋界怎麼說

【格弈網訓】1080元跟職業棋手學一年圍棋網課

擊敗了李世石九段的圍棋人工智慧「AlphaGo」究竟是什麼?

我是黃士傑,AlphaGo人肉臂

AI圍棋的千層套路②:阿法狗顛覆的圍棋理論 開局爬二路翻身了?

阿爾法狗教你下棋谷歌上線AlphaGo圍棋教學工具

獨立峰巔一覽眾山小樸廷桓弈城馬踏連營二十連勝

AI戰勝歐洲圍棋冠軍圍棋界怎麼說

AI圍棋的千層套路②:阿法狗顛覆的圍棋理論開局爬二路翻身了?