弈城圍棋網有一個帳號叫deepmind。2016年1月28號谷歌Deepmind小組開發的圍棋程序AlphaGo戰勝職業選手的勁爆消息出來之後,這個帳號名引發了棋迷的關注。之後AlphaGo的共同第一作者Aja Huang發貼說,這個帳號是他本人的,但否認是AlphaGo。對此我們根據deepmind的歷史戰績進行一些推測。
2014年4月2日,deepmind在弈城下了第一盤棋,一開始註冊是5D。半個月時間,這個帳號分別以17勝1負和15勝3負的成績,升上了6D和7D。弈城圍棋網5D及以上的升段規則是和同級別對手下「升降級對局」,最後20局裡勝15局升1段,全勝升2段。然後deepmind就在7D與8D之間上上下下,從2014年4月17日到2015年9月16日長達1年半的時間,一共五次從7D升到8D,四次從8D降到7D,下了300多盤。這個戰績是標準的強7弱8,也符合Aja Huang臺灣業餘六段的水平。這一切都很正常。
之後發生了奇妙的事情。2015年8月23日,deepmind第五次打上了8D,升段當天連下了6盤,還全輸了。之後到8月29號7連勝,9月4號5號又四連敗。然後到9月16號,8勝1負,累計戰績15勝5負,首次升上了9D!打上9D以後當天下了一盤,輸了。然後接近三個月沒下棋。一個強7弱8,偶而運氣爆棚衝上9D也是可能的,正常的軌跡應該是迅速掉下8。
接下來在2015年10月,谷歌和樊麾二段籤了保密協議,讓AlphaG和他下了5盤正式對局5:0,2016年1月28發布消息時棋譜也公布了。還有5盤非正式對局,樊麾贏了2盤,棋譜未公布。
2015年12月2號,deepmind重新開始在9D上下棋,一直到2016年2月28日,一共下了136盤。一開始就在9D上打了一波13勝2負,表現得象一個強9。然後12月底到2016年1月,一波8連敗掉到8D了,這個戰績到是很象強7弱8。然後迅速地15勝5負,2016年2月2日回到9D。升上9D又是一波15勝2負。之後時勝時負,一直在9D。
2月27號開始,deepmind更多地和職業棋手對局了。弈城帳號標註為P的是經過驗證的職業棋手,deepmind勝了mob(P),輸給了另三位。對手中也有雖然未標註為P,但和職業棋手帳號互有勝負的強9,如amalauag,從歷史戰績看也是有職業棋手實力的。deepmind和amalauag下了三盤,2勝1負。
如果是Aja Huang本人下,很不可能對9d取得經常性的連勝,更不可能和職業棋手們互有勝負,差距應該在三子左右。合理推測,谷歌圍棋到弈城網上測試也屬正常。2月23號谷歌與李世石人機大戰發布會公布的信息,3月8號到15號代表AlphaGo與李世石在棋盤上進行五盤對局的,正是Aja Huang。他負責擺放棋子,並輸入招數到機器。這也可以說是Aja Huang在下棋,他發貼說deepmind是自己在弈城上下也可以解釋。谷李大戰在即,谷歌加緊測試,在弈城上更多找職業棋手過招。
如果說以上是基於戰績的推測,可以進一步看下棋譜的印記。
AlphaGo執黑對樊麾
這是AlphaGo與樊麾的第二盤對局,開局就是一個大雪崩定式。第31手,AlphaGo下了這招明顯異常的「點」,與白32擋交換。幾個職業棋手都指出,這個點和白擋的交換,有明顯的潛在損失。本來不點,黑擋在G2位是個先手,白要應的。現在有了白32立的硬腿,黑再要擋在G2位,就不是先手了,因為接下來黑收氣,白可以A2吃掉黑。
AlphaGo執黑對樊麾
如果一定要下點這招,那麼點了以後,黑也應該立刻A6爬回,與白A2交換。接下來黑A7接是先手,能保證黑是絕對兩眼活棋,還不損空。然而AlphaGo沒有走,如上圖讓樊麾38搶先扳到與AlphaGo的39接交換,空損了。接下來如果白B11點,黑這塊將只有一個眼。31的點以及後續讓白搶到38扳,AlphaGo的損失雖然不大,但確實是明顯的問題手。
2014年7月30日,阿含桐山杯8強賽柯潔執黑對古力
職業棋手和業餘高手肯定不會這樣下的。如上圖,古力對柯潔也下了同樣的大雪崩。古力第40手也點了,但點的時機是,白右邊S13的擋已經不可能下到了,不需要保留了。而且後來古力44手搶先爬回定型,保證兩眼。柯潔43手不能扳N19吃三子太小,古力44就爬了。
弈城圍棋網2015年12月6日,deepmind執白對Reminisce
上圖是deepmind和Reminisce的對局,也是大雪崩。第50手,deepmind和AlphaGo一樣下了這個點,也同樣沒有T6爬回,被對手55手搶先扳到。當然和AlphaGo那局一樣,虧的不多,對手也和樊麾一樣後面殺崩了迅速敗陣。
看到deepmind這個帳號在弈城圍棋網上離奇的戰績軌跡,以及棋譜上與AlphaGo的不謀而合,對網絡圍棋比較熟的棋友們大概心裡有數了吧。
顯然,這也是近來和deepmind對局的弈城9D及帶P的職業棋手們的感覺。他們和deepmind對局時似乎明白網絡另一頭是誰,紛紛出招測試,下了不少精彩的棋。
除去deepmind在9d上明顯是Aja Huang本人在下的連敗對局,大致可以評估一下它的實力。有興趣的可以到弈城圍棋下載客戶端、註冊帳號,自己查找deepmind的所有棋譜觀看。
對於一般的9d,deepmind,或者說背後的AlphaGo有明顯優勢,可以輕鬆地連勝。棋譜上表現出來就是大局觀好,空很容易就領先了,或者一個局部下來就佔了壓倒性優勢了。但也不是特別穩定,偶而會輸(也有可能是Aja Huang本人在下)。
deepmind對帶P的職業棋手,還佔不到什麼便宜,雖然也有勝局,但是負多勝少。這些出戰的職業棋手並非職業強手,大致要排名100名以後了,和李世石差距不小。但他們比樊麾的實力要強一些,對李世石也不是沒有勝機,不是讓先的水平差距。
之前李世石2月16日就人機大戰接受採訪時就說,除了與樊麾的對局,他還到網上找了三四盤AlphaGo的棋譜來研究,認為是自己讓先到二子的實力,有絕對必勝的信心。很可能他找的就是deepmind在弈城網的棋譜。之後deepmind在弈城上又和更強的對手下了多盤,感覺實力有所提升,李世石讓先不一定行。
大致可以判斷,AlphaGo在弈城上進行測試,表現出來的是職業棋手中較弱的水平,但顯然是有職業水平的。而且可能它是用單機版進行測試,人機對戰時顯然會用多得多的伺服器。但也不會帶來很大的水平提升,根據谷歌發表在《自然》上的文章,伺服器版對單機版也只有77%的勝率,大約3:1的戰績。
人機大戰將在2016年3月8日開戰,也沒幾天了。如果弈城上deepmind帳號這幾天的棋譜能體現AlphaGo的實力,那麼和李世石還是有著明顯的實力差距。但這種差距不是業餘棋手與職業棋手之間那種絕對水平的差距,已經可以談勝負概率了。
李世石必須小心應對,甚至不能有「上手心態」,必須把對手當作一個職業棋手來認真對待。特別的是,職業棋手對局,低手就算暫時領先,高手仍會有大把機會。因為低手面對「勝機」會出現心理波動,高手會選複雜的下,低手心理緊張再加時間不夠,犯錯送回來很常見。但AlphaGo的表現會非常穩定,算得也很快,李世石出了致命錯誤以後,想靠攪局翻盤不會成功。
李世石29日接受韓國電視臺採訪
李世石說,作為人類代表,要取得五盤全勝,因為輸一盤就會給出電腦將要取勝的危險信號。他想一盤不輸,必須從一開始就非常小心,抓住AlphaGo的一些不嚴謹的小錯,建立並擴大領先優勢。五盤對局,每盤雙方手數以250手計,李世石要下600-700手,出現致命錯誤的概率還是有的。
如果要預測比賽勝負,李世石肯定會獲勝,得到100萬美元獎金。五番棋高手的勝率遠高於單局勝率。柯潔對李世石如果有4:1的勝率(目前為7:2),他聲稱的「夢百合杯五番決賽李的勝機不足5%」在數學概率上就是一個合理估計。這次柯潔估計AlphaGo對李世石的勝機還不到5%,直覺上也是成立的。
但是這比賽不管勝負要下滿五盤,李世石想五盤全勝也不容易。預計谷李大戰,最後比分為4:1。李世石勝出維護人類尊嚴,但AlphaGo取得的進展也繼續令人驚嘆。
作者簡介:筆名陳經,香港科技大學計算機科學碩士,中國科學技術大學風雲學會研究員,棋力新浪圍棋6D。21世紀初開始有獨特原創性的經濟研究,2003年的《經濟版圖中的發展中國家》預言中國將不斷產業升級,挑戰發達國家,2006年著有《中國的「官辦經濟」》。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。