陳經:根據AlphaGo弈城圍棋網的疑似測試對局預測谷李大戰比分

2021-01-20 觀察者網

弈城圍棋網有一個帳號叫deepmind。2016年1月28號谷歌Deepmind小組開發的圍棋程序AlphaGo戰勝職業選手的勁爆消息出來之後,這個帳號名引發了棋迷的關注。之後AlphaGo的共同第一作者Aja Huang發貼說,這個帳號是他本人的,但否認是AlphaGo。對此我們根據deepmind的歷史戰績進行一些推測。

2014年4月2日,deepmind在弈城下了第一盤棋,一開始註冊是5D。半個月時間,這個帳號分別以17勝1負和15勝3負的成績,升上了6D和7D。弈城圍棋網5D及以上的升段規則是和同級別對手下「升降級對局」,最後20局裡勝15局升1段,全勝升2段。然後deepmind就在7D與8D之間上上下下,從2014年4月17日到2015年9月16日長達1年半的時間,一共五次從7D升到8D,四次從8D降到7D,下了300多盤。這個戰績是標準的強7弱8,也符合Aja Huang臺灣業餘六段的水平。這一切都很正常。

之後發生了奇妙的事情。2015年8月23日,deepmind第五次打上了8D,升段當天連下了6盤,還全輸了。之後到8月29號7連勝,9月4號5號又四連敗。然後到9月16號,8勝1負,累計戰績15勝5負,首次升上了9D!打上9D以後當天下了一盤,輸了。然後接近三個月沒下棋。一個強7弱8,偶而運氣爆棚衝上9D也是可能的,正常的軌跡應該是迅速掉下8。

接下來在2015年10月,谷歌和樊麾二段籤了保密協議,讓AlphaG和他下了5盤正式對局5:0,2016年1月28發布消息時棋譜也公布了。還有5盤非正式對局,樊麾贏了2盤,棋譜未公布。

2015年12月2號,deepmind重新開始在9D上下棋,一直到2016年2月28日,一共下了136盤。一開始就在9D上打了一波13勝2負,表現得象一個強9。然後12月底到2016年1月,一波8連敗掉到8D了,這個戰績到是很象強7弱8。然後迅速地15勝5負,2016年2月2日回到9D。升上9D又是一波15勝2負。之後時勝時負,一直在9D。

2月27號開始,deepmind更多地和職業棋手對局了。弈城帳號標註為P的是經過驗證的職業棋手,deepmind勝了mob(P),輸給了另三位。對手中也有雖然未標註為P,但和職業棋手帳號互有勝負的強9,如amalauag,從歷史戰績看也是有職業棋手實力的。deepmind和amalauag下了三盤,2勝1負。

如果是Aja Huang本人下,很不可能對9d取得經常性的連勝,更不可能和職業棋手們互有勝負,差距應該在三子左右。合理推測,谷歌圍棋到弈城網上測試也屬正常。2月23號谷歌與李世石人機大戰發布會公布的信息,3月8號到15號代表AlphaGo與李世石在棋盤上進行五盤對局的,正是Aja Huang。他負責擺放棋子,並輸入招數到機器。這也可以說是Aja Huang在下棋,他發貼說deepmind是自己在弈城上下也可以解釋。谷李大戰在即,谷歌加緊測試,在弈城上更多找職業棋手過招。

如果說以上是基於戰績的推測,可以進一步看下棋譜的印記。

AlphaGo執黑對樊麾

這是AlphaGo與樊麾的第二盤對局,開局就是一個大雪崩定式。第31手,AlphaGo下了這招明顯異常的「點」,與白32擋交換。幾個職業棋手都指出,這個點和白擋的交換,有明顯的潛在損失。本來不點,黑擋在G2位是個先手,白要應的。現在有了白32立的硬腿,黑再要擋在G2位,就不是先手了,因為接下來黑收氣,白可以A2吃掉黑。

AlphaGo執黑對樊麾

如果一定要下點這招,那麼點了以後,黑也應該立刻A6爬回,與白A2交換。接下來黑A7接是先手,能保證黑是絕對兩眼活棋,還不損空。然而AlphaGo沒有走,如上圖讓樊麾38搶先扳到與AlphaGo的39接交換,空損了。接下來如果白B11點,黑這塊將只有一個眼。31的點以及後續讓白搶到38扳,AlphaGo的損失雖然不大,但確實是明顯的問題手。

2014年7月30日,阿含桐山杯8強賽柯潔執黑對古力

職業棋手和業餘高手肯定不會這樣下的。如上圖,古力對柯潔也下了同樣的大雪崩。古力第40手也點了,但點的時機是,白右邊S13的擋已經不可能下到了,不需要保留了。而且後來古力44手搶先爬回定型,保證兩眼。柯潔43手不能扳N19吃三子太小,古力44就爬了。

弈城圍棋網2015年12月6日,deepmind執白對Reminisce

上圖是deepmind和Reminisce的對局,也是大雪崩。第50手,deepmind和AlphaGo一樣下了這個點,也同樣沒有T6爬回,被對手55手搶先扳到。當然和AlphaGo那局一樣,虧的不多,對手也和樊麾一樣後面殺崩了迅速敗陣。

看到deepmind這個帳號在弈城圍棋網上離奇的戰績軌跡,以及棋譜上與AlphaGo的不謀而合,對網絡圍棋比較熟的棋友們大概心裡有數了吧。

顯然,這也是近來和deepmind對局的弈城9D及帶P的職業棋手們的感覺。他們和deepmind對局時似乎明白網絡另一頭是誰,紛紛出招測試,下了不少精彩的棋。

除去deepmind在9d上明顯是Aja Huang本人在下的連敗對局,大致可以評估一下它的實力。有興趣的可以到弈城圍棋下載客戶端、註冊帳號,自己查找deepmind的所有棋譜觀看。

對於一般的9d,deepmind,或者說背後的AlphaGo有明顯優勢,可以輕鬆地連勝。棋譜上表現出來就是大局觀好,空很容易就領先了,或者一個局部下來就佔了壓倒性優勢了。但也不是特別穩定,偶而會輸(也有可能是Aja Huang本人在下)。

deepmind對帶P的職業棋手,還佔不到什麼便宜,雖然也有勝局,但是負多勝少。這些出戰的職業棋手並非職業強手,大致要排名100名以後了,和李世石差距不小。但他們比樊麾的實力要強一些,對李世石也不是沒有勝機,不是讓先的水平差距。

之前李世石2月16日就人機大戰接受採訪時就說,除了與樊麾的對局,他還到網上找了三四盤AlphaGo的棋譜來研究,認為是自己讓先到二子的實力,有絕對必勝的信心。很可能他找的就是deepmind在弈城網的棋譜。之後deepmind在弈城上又和更強的對手下了多盤,感覺實力有所提升,李世石讓先不一定行。

大致可以判斷,AlphaGo在弈城上進行測試,表現出來的是職業棋手中較弱的水平,但顯然是有職業水平的。而且可能它是用單機版進行測試,人機對戰時顯然會用多得多的伺服器。但也不會帶來很大的水平提升,根據谷歌發表在《自然》上的文章,伺服器版對單機版也只有77%的勝率,大約3:1的戰績。

人機大戰將在2016年3月8日開戰,也沒幾天了。如果弈城上deepmind帳號這幾天的棋譜能體現AlphaGo的實力,那麼和李世石還是有著明顯的實力差距。但這種差距不是業餘棋手與職業棋手之間那種絕對水平的差距,已經可以談勝負概率了。

李世石必須小心應對,甚至不能有「上手心態」,必須把對手當作一個職業棋手來認真對待。特別的是,職業棋手對局,低手就算暫時領先,高手仍會有大把機會。因為低手面對「勝機」會出現心理波動,高手會選複雜的下,低手心理緊張再加時間不夠,犯錯送回來很常見。但AlphaGo的表現會非常穩定,算得也很快,李世石出了致命錯誤以後,想靠攪局翻盤不會成功。

李世石29日接受韓國電視臺採訪

李世石說,作為人類代表,要取得五盤全勝,因為輸一盤就會給出電腦將要取勝的危險信號。他想一盤不輸,必須從一開始就非常小心,抓住AlphaGo的一些不嚴謹的小錯,建立並擴大領先優勢。五盤對局,每盤雙方手數以250手計,李世石要下600-700手,出現致命錯誤的概率還是有的。

如果要預測比賽勝負,李世石肯定會獲勝,得到100萬美元獎金。五番棋高手的勝率遠高於單局勝率。柯潔對李世石如果有4:1的勝率(目前為7:2),他聲稱的「夢百合杯五番決賽李的勝機不足5%」在數學概率上就是一個合理估計。這次柯潔估計AlphaGo對李世石的勝機還不到5%,直覺上也是成立的。

但是這比賽不管勝負要下滿五盤,李世石想五盤全勝也不容易。預計谷李大戰,最後比分為4:1。李世石勝出維護人類尊嚴,但AlphaGo取得的進展也繼續令人驚嘆。

作者簡介:筆名陳經,香港科技大學計算機科學碩士,中國科學技術大學風雲學會研究員,棋力新浪圍棋6D。21世紀初開始有獨特原創性的經濟研究,2003年的《經濟版圖中的發展中國家》預言中國將不斷產業升級,挑戰發達國家,2006年著有《中國的「官辦經濟」》。

本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。

相關焦點

  • AlphaGo今年正式挑戰柯潔 AI引發圍棋觀念轉變
    有煙霧 有「督戰」  一邊保守著秘密,弈城一邊為人機大戰造勢,先是在自己網站上發了含混的消息,後在圍棋貼吧裡發了含混的帖子。可隨著「Master」連戰連捷,圍棋的一切都在瞬間卷進了風暴。那一刻,谷歌創始人布林就身在北京。  這次來訪北京,布林並沒有公開自己的來意。
  • 陳經:即使AlphaGo不出來下棋,我們還有絕藝
    【在剛剛落幕的日本UEC杯計算機圍棋大賽上,中國的AI「絕藝」一路過關斬將,贏得冠軍。一周前,觀察者網專欄作者陳經曾撰文詳細分析了絕藝的水平,觀察者網特重刊本文,以饗讀者。】 日本的Zen是AI勤奮對弈的典範,長年在業餘棋迷為主的KGS上公開測試,受到棋迷的擁護。在學習AlphaGo的論文後升級為DeepZenGo之後,Zen在KGS上打到了第一名,並在與趙治勳的三番棋中勝了一局,首次有了正式比賽戰勝職業棋手的記錄。2016年12月29日幾乎和Master同時,DeepZenGo來到弈城接受業餘高手和職業棋手們的檢驗。
  • 圍棋人機大戰第四局:AlphaGo連續失誤 李世石扳回一局
    3月13日中午12點,迎來「人機大戰」第四場,此前韓國九段棋手李世石連敗三場,五局系列賽提前告負。最後兩局的意義,更多是為職業棋手的尊嚴,為測試、尋找的可能薄弱點而戰。 在兩小時布局時間用完之際,李世石出現「年度妙手」考驗AlphaGo(阿爾法狗)。AlphaGo陷入長考,並下出一步看似失誤的棋。第78手讓大家看到熟悉的李世石九段回來了。
  • AlphaGo 圍棋教學工具已發布
    基於 231,000 盤人類棋手對局以及 75 盤 AlphaGo 與人類棋手對局的數據,本工具提供對圍棋近代史上 6,000 種開局變化的分析。通過對 AlphaGo 和職業與業餘棋手的下法進行比較,探索圍棋的奧妙。
  • 「阿爾法狗」圍棋對戰勝55局?誰是這場營銷的贏家?
    根據百度指數顯示,12月30日之後,「圍棋」的媒體指數持續攀升,昨日已經達到10777,遠遠超過日常關注波動範圍。2016年12月29日,網絡圍棋對戰平臺弈城網上,一個帳號悄悄改名,從「Magister」改名為「Master」,從用戶的註冊信息來看,這是個來自韓國的「棋手」,此前並無任何對局信息。
  • 柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo
    人類AI圍棋之爭,還在繼續。今年5月底,人機圍棋大戰終極對決,最終世界排名第一的柯潔九段和AlphaGo的圍棋終極人機大戰以0:3完敗。賽後,柯潔在接受採訪時直言,AlphaGo太完美,看不到任何勝利的希望。
  • 陳經:人機大戰首局柯潔「憾負」AlphaGo的看點
    【文/觀察者網專欄作者 陳經】 2017年5月23日上午10:30,廣大棋迷與人工智慧愛好者非常關注的柯潔與AlphaGo的三番棋首局終於開打。經過4個小時的戰鬥,柯潔執黑以1/4子的最小差距負於AlphaGo,三番棋暫時以0:1落後。這盤棋有哪些看點?AlphaGo又展示了哪些新東西?
  • 最終一戰柯潔再負AlphaGo,此後再無圍棋人機大戰
    在這場人機大戰中,世界圍棋第一人0:3完敗於圍棋人工智慧。全程回顧上午10:30,聶衛平宣布比賽正式開始。棋聖也略顯緊張,一開始忘了拿起麥克風,宣布規則時又說成黑棋貼2¾子。耗時1分05秒,執黑的AlphaGo第一手下在棋盤的右下角。又是一個不合「禮儀」的開頭。
  • 更強AlphaGo出世!自學三日就能超越人類千年
    阿爾法零(AlphaGo Zero)完全不依賴於人類數據,自學三天圍棋,對陣阿爾法李世石(AlphaGo Lee)竟然能取得100比0的戰績。圍棋世界冠軍古力也感嘆:「20年不抵3天啊,我們的傷感,人類的進步!」AlphaGo四個版本回顧AlphaGo最先出現在公眾視野,是2015年10月5-0完勝人類的歐洲冠軍樊麾二段。
  • 圍棋有AlphaGo P2P行業有什麼?
    3月9日,谷歌研發的人工智慧圍棋軟體AlphaGo與韓國世界冠軍李世石在韓國首爾結束了第一場人機比賽,執黑子的李世石投子認輸,AlphaGo
  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    從官網上可以看到,該工具通過利用 231000 盤人類棋手對局、75 盤 AlphaGo 與人類棋手對局的數據,能對圍棋近代史上 6000 種比較常見的開局給出分析。通過這個工具,大家可以探索圍棋奧妙,比較 AlphaGo 的下棋路數與專業選手、業餘選手的不同點,從中學習。官網上對於工具的使用也有相關說明:如何使用這一工具?
  • 圍棋人機大戰第二季柯潔VS阿爾法狗AlphaGo比賽時間地點
    柯潔是中國圍棋職業九段棋手,他也是圍棋等級分排名世界第一。  此次人機終極大戰中,代表人類出戰的是目前排名世界第一的職業圍棋九段選手柯潔,而代表機器一方的則是AlphaGo的2.0版本。區別於和李世石對戰的AlphaGo1.0,這次對戰柯潔的AlphaGo2.0採用了新的算法模型。此前,該版本曾化名Master,以在線對弈的形式擊敗了包括柯潔在內的所有選手,60戰而無一敗。
  • AlphaGo戰李世石的四種比分 人機大戰誰遭橫掃?
    正文:  |人機大戰,不同比分意味著什麼?  人機大戰本身造成人與機器對立的天然屬性,使其能吸引所有人的目光。但大家容易忽略的是,一切最核心的因素,歸根結底都是人的因素。這裡面重要的不僅僅是人與機器之間的關係,更是人與人之間的關係。  這次的人機大戰,很容易讓身處漩渦中央的圍棋界和人工智慧界產生莫名的對立感。
  • 深挖圍棋AI技術:alphaGo在下一盤什麼棋?
    我們有大量人類圍棋高手的對局(海量中等水平的對局),每一個局面下「好」的走法直接就能夠從高手對局庫裡得到,認為他們的對局都是「好」的走法。但是要得到一個局面的「絕對」得分卻很難,因為我們只知道一盤對局最終的結果。
  • 圍棋人機大戰一周年:被AlphaGo改變的世界
    在圍棋的人機大戰中,頂級人類選手完敗給人工智慧。人工智慧一戰成名,李世乭留下落寞側影。為AlphaGo落子的黃士傑一年後回憶說:「當時我代表AlphaGo下棋,必須保持冷靜」。從那時起到現在,人類始終生活在一個被AlphaGo改變的世界。一年回望站在圍棋人機大戰一周年的節點上,該如何回顧過去、展望未來呢?
  • AlphaGo將公布自我對局棋譜 未來幫助解決癌症
    5月27日下午消息,圍棋峰會今日進入最後一天,柯潔九段中盤告負,總比分0:3敗於AlphaGo。賽後,DeepMind方面表示,為更好分享棋妙世界,將會與柯潔合作分析三盤對局,展現AlphaGo的變化,並將我們分析比賽的過程做視頻,與全球愛好者分享。
  • AlphaGo視角人機大戰詳解公布 人類究竟輸在哪
    9月12日,Deepmind公布了李世石與AlphaGo人機大戰AlphaGo視角的講解,樊麾解說,古力、周睿羊技術指導,黃士傑編輯。五盤棋解說分別名為破曉,創造力,革命,永不放棄和新時代。樊麾分享很多在人機大戰第一現場的感受。以下是部分內容節選。
  • 李世石1:4憾負AlphaGo 柯潔從此成網紅
    此前的四盤對抗,人工智慧證明了科技進步的速度,李世石用第四盤的逆轉證明了人類的靈感,人機大戰製造了巨大的話題被世人關注,據統計,有超過一... 今日是李世石和AlphaGo(阿爾法圍棋)人機大戰最後一盤較量。
  • master是什麼意思,為何能改變圍棋的靈魂
    ,不排除這是在人機大戰中一舉成名的「阿爾法狗」。2016年12月29日晚至31日下午,Master在弈城網上與多位「披著馬甲」的中、韓職業棋手對弈,其中XIUZHI、龍膽、劍術這3個棋迷們熟知的帳號分別對應韓國第一人樸廷桓、新科百靈杯冠軍陳耀燁以及中國名人戰冠軍連笑。這些對局採用的都是「20秒3次」的超快棋方式,結果Master在對這幾位重量級高手的交鋒中分別取得4:0、2:0和2:0的戰績。