陳經:根據AlphaGo弈城圍棋網的疑似測試對局預測谷李大戰比分

2020-12-16 觀察者網

弈城圍棋網有一個帳號叫deepmind。2016年1月28號谷歌Deepmind小組開發的圍棋程序AlphaGo戰勝職業選手的勁爆消息出來之後,這個帳號名引發了棋迷的關注。之後AlphaGo的共同第一作者Aja Huang發貼說,這個帳號是他本人的,但否認是AlphaGo。對此我們根據deepmind的歷史戰績進行一些推測。

2014年4月2日,deepmind在弈城下了第一盤棋,一開始註冊是5D。半個月時間,這個帳號分別以17勝1負和15勝3負的成績,升上了6D和7D。弈城圍棋網5D及以上的升段規則是和同級別對手下「升降級對局」,最後20局裡勝15局升1段,全勝升2段。然後deepmind就在7D與8D之間上上下下,從2014年4月17日到2015年9月16日長達1年半的時間,一共五次從7D升到8D,四次從8D降到7D,下了300多盤。這個戰績是標準的強7弱8,也符合Aja Huang臺灣業餘六段的水平。這一切都很正常。

之後發生了奇妙的事情。2015年8月23日,deepmind第五次打上了8D,升段當天連下了6盤,還全輸了。之後到8月29號7連勝,9月4號5號又四連敗。然後到9月16號,8勝1負,累計戰績15勝5負,首次升上了9D!打上9D以後當天下了一盤,輸了。然後接近三個月沒下棋。一個強7弱8,偶而運氣爆棚衝上9D也是可能的,正常的軌跡應該是迅速掉下8。

接下來在2015年10月,谷歌和樊麾二段籤了保密協議,讓AlphaG和他下了5盤正式對局5:0,2016年1月28發布消息時棋譜也公布了。還有5盤非正式對局,樊麾贏了2盤,棋譜未公布。

2015年12月2號,deepmind重新開始在9D上下棋,一直到2016年2月28日,一共下了136盤。一開始就在9D上打了一波13勝2負,表現得象一個強9。然後12月底到2016年1月,一波8連敗掉到8D了,這個戰績到是很象強7弱8。然後迅速地15勝5負,2016年2月2日回到9D。升上9D又是一波15勝2負。之後時勝時負,一直在9D。

2月27號開始,deepmind更多地和職業棋手對局了。弈城帳號標註為P的是經過驗證的職業棋手,deepmind勝了mob(P),輸給了另三位。對手中也有雖然未標註為P,但和職業棋手帳號互有勝負的強9,如amalauag,從歷史戰績看也是有職業棋手實力的。deepmind和amalauag下了三盤,2勝1負。

如果是Aja Huang本人下,很不可能對9d取得經常性的連勝,更不可能和職業棋手們互有勝負,差距應該在三子左右。合理推測,谷歌圍棋到弈城網上測試也屬正常。2月23號谷歌與李世石人機大戰發布會公布的信息,3月8號到15號代表AlphaGo與李世石在棋盤上進行五盤對局的,正是Aja Huang。他負責擺放棋子,並輸入招數到機器。這也可以說是Aja Huang在下棋,他發貼說deepmind是自己在弈城上下也可以解釋。谷李大戰在即,谷歌加緊測試,在弈城上更多找職業棋手過招。

如果說以上是基於戰績的推測,可以進一步看下棋譜的印記。

AlphaGo執黑對樊麾

這是AlphaGo與樊麾的第二盤對局,開局就是一個大雪崩定式。第31手,AlphaGo下了這招明顯異常的「點」,與白32擋交換。幾個職業棋手都指出,這個點和白擋的交換,有明顯的潛在損失。本來不點,黑擋在G2位是個先手,白要應的。現在有了白32立的硬腿,黑再要擋在G2位,就不是先手了,因為接下來黑收氣,白可以A2吃掉黑。

AlphaGo執黑對樊麾

如果一定要下點這招,那麼點了以後,黑也應該立刻A6爬回,與白A2交換。接下來黑A7接是先手,能保證黑是絕對兩眼活棋,還不損空。然而AlphaGo沒有走,如上圖讓樊麾38搶先扳到與AlphaGo的39接交換,空損了。接下來如果白B11點,黑這塊將只有一個眼。31的點以及後續讓白搶到38扳,AlphaGo的損失雖然不大,但確實是明顯的問題手。

2014年7月30日,阿含桐山杯8強賽柯潔執黑對古力

職業棋手和業餘高手肯定不會這樣下的。如上圖,古力對柯潔也下了同樣的大雪崩。古力第40手也點了,但點的時機是,白右邊S13的擋已經不可能下到了,不需要保留了。而且後來古力44手搶先爬回定型,保證兩眼。柯潔43手不能扳N19吃三子太小,古力44就爬了。

弈城圍棋網2015年12月6日,deepmind執白對Reminisce

上圖是deepmind和Reminisce的對局,也是大雪崩。第50手,deepmind和AlphaGo一樣下了這個點,也同樣沒有T6爬回,被對手55手搶先扳到。當然和AlphaGo那局一樣,虧的不多,對手也和樊麾一樣後面殺崩了迅速敗陣。

看到deepmind這個帳號在弈城圍棋網上離奇的戰績軌跡,以及棋譜上與AlphaGo的不謀而合,對網絡圍棋比較熟的棋友們大概心裡有數了吧。

顯然,這也是近來和deepmind對局的弈城9D及帶P的職業棋手們的感覺。他們和deepmind對局時似乎明白網絡另一頭是誰,紛紛出招測試,下了不少精彩的棋。

除去deepmind在9d上明顯是Aja Huang本人在下的連敗對局,大致可以評估一下它的實力。有興趣的可以到弈城圍棋下載客戶端、註冊帳號,自己查找deepmind的所有棋譜觀看。

對於一般的9d,deepmind,或者說背後的AlphaGo有明顯優勢,可以輕鬆地連勝。棋譜上表現出來就是大局觀好,空很容易就領先了,或者一個局部下來就佔了壓倒性優勢了。但也不是特別穩定,偶而會輸(也有可能是Aja Huang本人在下)。

deepmind對帶P的職業棋手,還佔不到什麼便宜,雖然也有勝局,但是負多勝少。這些出戰的職業棋手並非職業強手,大致要排名100名以後了,和李世石差距不小。但他們比樊麾的實力要強一些,對李世石也不是沒有勝機,不是讓先的水平差距。

之前李世石2月16日就人機大戰接受採訪時就說,除了與樊麾的對局,他還到網上找了三四盤AlphaGo的棋譜來研究,認為是自己讓先到二子的實力,有絕對必勝的信心。很可能他找的就是deepmind在弈城網的棋譜。之後deepmind在弈城上又和更強的對手下了多盤,感覺實力有所提升,李世石讓先不一定行。

大致可以判斷,AlphaGo在弈城上進行測試,表現出來的是職業棋手中較弱的水平,但顯然是有職業水平的。而且可能它是用單機版進行測試,人機對戰時顯然會用多得多的伺服器。但也不會帶來很大的水平提升,根據谷歌發表在《自然》上的文章,伺服器版對單機版也只有77%的勝率,大約3:1的戰績。

人機大戰將在2016年3月8日開戰,也沒幾天了。如果弈城上deepmind帳號這幾天的棋譜能體現AlphaGo的實力,那麼和李世石還是有著明顯的實力差距。但這種差距不是業餘棋手與職業棋手之間那種絕對水平的差距,已經可以談勝負概率了。

李世石必須小心應對,甚至不能有「上手心態」,必須把對手當作一個職業棋手來認真對待。特別的是,職業棋手對局,低手就算暫時領先,高手仍會有大把機會。因為低手面對「勝機」會出現心理波動,高手會選複雜的下,低手心理緊張再加時間不夠,犯錯送回來很常見。但AlphaGo的表現會非常穩定,算得也很快,李世石出了致命錯誤以後,想靠攪局翻盤不會成功。

李世石29日接受韓國電視臺採訪

李世石說,作為人類代表,要取得五盤全勝,因為輸一盤就會給出電腦將要取勝的危險信號。他想一盤不輸,必須從一開始就非常小心,抓住AlphaGo的一些不嚴謹的小錯,建立並擴大領先優勢。五盤對局,每盤雙方手數以250手計,李世石要下600-700手,出現致命錯誤的概率還是有的。

如果要預測比賽勝負,李世石肯定會獲勝,得到100萬美元獎金。五番棋高手的勝率遠高於單局勝率。柯潔對李世石如果有4:1的勝率(目前為7:2),他聲稱的「夢百合杯五番決賽李的勝機不足5%」在數學概率上就是一個合理估計。這次柯潔估計AlphaGo對李世石的勝機還不到5%,直覺上也是成立的。

但是這比賽不管勝負要下滿五盤,李世石想五盤全勝也不容易。預計谷李大戰,最後比分為4:1。李世石勝出維護人類尊嚴,但AlphaGo取得的進展也繼續令人驚嘆。

作者簡介:筆名陳經,香港科技大學計算機科學碩士,中國科學技術大學風雲學會研究員,棋力新浪圍棋6D。21世紀初開始有獨特原創性的經濟研究,2003年的《經濟版圖中的發展中國家》預言中國將不斷產業升級,挑戰發達國家,2006年著有《中國的「官辦經濟」》。

本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平臺觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閱讀趣味文章。

相關焦點

  • 陳經:即使AlphaGo不出來下棋,我們還有絕藝
    【在剛剛落幕的日本UEC杯計算機圍棋大賽上,中國的AI「絕藝」一路過關斬將,贏得冠軍。一周前,觀察者網專欄作者陳經曾撰文詳細分析了絕藝的水平,觀察者網特重刊本文,以饗讀者。】 日本的Zen是AI勤奮對弈的典範,長年在業餘棋迷為主的KGS上公開測試,受到棋迷的擁護。在學習AlphaGo的論文後升級為DeepZenGo之後,Zen在KGS上打到了第一名,並在與趙治勳的三番棋中勝了一局,首次有了正式比賽戰勝職業棋手的記錄。2016年12月29日幾乎和Master同時,DeepZenGo來到弈城接受業餘高手和職業棋手們的檢驗。
  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    從官網上可以看到,該工具通過利用 231000 盤人類棋手對局、75 盤 AlphaGo 與人類棋手對局的數據,能對圍棋近代史上 6000 種比較常見的開局給出分析。通過這個工具,大家可以探索圍棋奧妙,比較 AlphaGo 的下棋路數與專業選手、業餘選手的不同點,從中學習。官網上對於工具的使用也有相關說明:如何使用這一工具?
  • 深挖圍棋AI技術:alphaGo在下一盤什麼棋?
    Move Prediction using CNN之前也分析過了,圍棋搜索如果不到遊戲結束,深的局面並不比淺的容易評估,所以我們不需要展開搜索樹,而可以直接評估一個局面下不同走法的好壞。這樣做的好處是很容易獲得訓練數據。我們有大量人類圍棋高手的對局(海量中等水平的對局),每一個局面下「好」的走法直接就能夠從高手對局庫裡得到,認為他們的對局都是「好」的走法。
  • AlphaGo首現Bug 圍棋算法死穴在哪兒?
    再可怕的怪物也是有弱點的,AlphaGo為什麼會下臭棋讓大家大跌眼鏡,圍棋人工智慧第二代第三代的死穴是什麼?圍棋人工智慧第三代的死穴在哪兒?韓國圍棋界曾獲得多項世界冠軍的職業九段李世石對陣谷歌計算機AlphaGo的人機大戰,三連敗之後,執白棋居然扳回一局。
  • 圍棋世界冠軍檀嘯復盤班開始招生啦
    老師介紹檀嘯  職業九段圍棋世界冠軍,中國圍棋國家隊隊員,現役圍甲浙江隊隊員。2017年6月26日,第11屆春蘭杯決賽三番棋決勝局,中國棋手檀嘯經過官子鏖戰執黑241手中盤擊敗韓國棋手樸永訓,以總比分2比1首奪個人世界冠軍,成為大陸第18位圍棋世界冠軍,也是圍棋界第35位世界冠軍。
  • master是什麼意思,為何能改變圍棋的靈魂
    一個網名為Master的「網絡棋手」在著名圍棋對弈網站弈城網上對包括中韓頂尖職業高手在內的棋手創下26勝0負的戰績,中國圍棋隊總教練俞斌稱,不排除這是在人機大戰中一舉成名的「阿爾法狗」。2016年12月29日晚至31日下午,Master在弈城網上與多位「披著馬甲」的中、韓職業棋手對弈,其中XIUZHI、龍膽、劍術這3個棋迷們熟知的帳號分別對應韓國第一人樸廷桓、新科百靈杯冠軍陳耀燁以及中國名人戰冠軍連笑。這些對局採用的都是「20秒3次」的超快棋方式,結果Master在對這幾位重量級高手的交鋒中分別取得4:0、2:0和2:0的戰績。
  • 谷歌副總裁透露人機大戰多個細節:採用中國圍棋規則
    【TechWeb報導】3月8日消息,DeepMind(TechWeb註:DeepMind由人工智慧程序師兼神經科學家Demis Hassabis等人聯合創立,2014年1月谷歌以4億美元收購)創始人兼谷歌副總裁戴密斯·哈薩比斯在接受媒體採訪透露,由谷歌AlphaGo和李世石進行的圍棋人機大戰將採用中國圍棋規則
  • 人機大戰第二季柯潔不敵國產狗 AI圍棋群雄並起
    第一屆「貝瑞基因」杯AI圍棋大賽今天在福州進行,在賽會表演賽中安排了柯潔對陣國產AI「星陣」的比賽。
  • 阿爾法狗教你下棋 谷歌上線AlphaGo圍棋教學工具
    【PConline 資訊】看起來AlphaGo在圍棋界真的是無敵了,如果這麼強大聰明的AI變成了圍棋老師,對於人類來說是不是又是另一種體驗呢?12月13號,谷歌旗下的DeepMind上線了這款在線AlphaGo圍棋教學工具(點擊此訪問)。
  • 重磅| DeepMind官方確認Master身份:全面回顧AlphaGo的再度出山之旅
    在對局周睿羊 9 段的第 59 局比賽之後,名為 Master 的帳號在騰訊野狐圍棋平臺上主動透露了自己的身份:「我是 AlphaGo 的黃博士(黃士傑)。」隨後,在對陣古力 9 段的最後一局結束後,這場由中日韓三國多名旗手對陣人工智慧歷時 7 天的跨年大戰宣告結束。
  • 101圍棋網級別對應大致棋力
    101圍棋網https://www.101weiqi.com/是全網題庫最全的網站,且大部分功能免費開放,很適合小棋手線上做題。
  • 圍棋「人機大戰」升級版將上演,電腦能打敗人腦嗎?
    編者按:3月9日,舉世矚目的圍棋「人機大戰」將在韓國首爾上演,比賽一方為谷歌公司研製的人工智慧程序AlphaGo,另一方則是圍棋世界冠軍、韓國名將李世石九段。雙方將進行5盤較量,勝者將贏得100萬美元的獎金。
  • 獨立峰巔一覽眾山小 樸廷桓弈城馬踏連營二十連勝
    弈城圍棋訊 弈城天高高几許?我今叩枰一問之。12月16日,樸廷桓在經過幾天的努力之後,今天終於再一次為自己和韓國棋手正名,創造了弈城二十連勝的瘋狂戰績,有圖有真相。
  • AlphaGo是什麼如何運行?人機大戰比賽規則+交手記錄資料
    人機大戰比賽規則+交手記錄資料。人腦VS電腦,大戰在即,作為人類的你,必須知道以下幾件事。  曾經,「深藍」與卡斯帕羅夫的西洋棋人機大戰令全球關注,人類在西洋棋領域被AI擊敗。在東方,圍棋這個古老的智力遊戲始終沒有被AI攻破,直到谷歌研發的新計算機圍棋軟體「阿爾法圍棋(AlphaGo)」在去年擊敗歐洲冠軍樊麾。
  • AI戰勝歐洲圍棋冠軍 圍棋界怎麼說
    在跟隨權威強大的西方言論之前,應根據谷歌對此次實驗所提供的消息,分析事實與新聞是否相符。對此,最專業,最有發言權的團體之一——中國圍棋界人士的反應不容忽視,這或會給被標題黨新聞包圍的我們呈現更多維度的思考。棋友給樊麾圍棋水平打個比喻由於樊麾表現不佳,網絡流言四起,或是說歐洲圍棋水平整體低下,或說樊麾早已淡出一線,實力被黑成只有業餘水平。
  • 【格弈網訓】1080元跟職業棋手學一年圍棋網課
    格弈圍棋根據不同教學階段分別設定教學目標,以實戰為導向,採用現代教育理念開展教學活動。格弈緊跟現代科技發展,利用網絡平臺進行線上教學,線下線上配合,相得 益彰,效果突出。  格弈網訓教學安排包括系統基礎課、每日基礎理論知識練習、每周作業精講課、每周兩輪升降循環賽、高手對局精講課     針對業餘10級—5段學員,按照段位分班講授系統基礎課,分為:學步A(零基礎-20k)班學步B(20k-10k)班衝段班(針對級位升業餘1段)1段升2段班
  • 擊敗了李世石九段的圍棋人工智慧「AlphaGo」究竟是什麼?
    如果不對 AlphaGo 背後的神經網絡系統稍作了解,你很容易以為 AlphaGo,在對局開始前跟李世石站在同一起跑線上。2014 年,已經被 Google 收購的 DeepMind,用五款雅達利 (Atari) 遊戲 Pong、打磚塊、太空侵略者、海底救人、Beam Rider 分別測試了自己開發的人工智慧的性能,結果發現:在兩三盤遊戲後,神經網絡的操控能力已經遠超世界上任何一位已知的遊戲高手。
  • 我是黃士傑,AlphaGo人肉臂
    1997年這一年5月11日,卡斯帕羅夫與Deep Blue(深藍)的第二次西洋棋人機大戰落幕,最終人類棋王以2½-3½的總比分,不敵IBM的超級電腦。這是載入人類歷史的一戰。Deep Blue,就是CB許峰雄在IBM開發出的新一代西洋棋電腦程式,棋力數百倍於早先的Deep Thought。
  • AI圍棋的千層套路②:阿法狗顛覆的圍棋理論 開局爬二路翻身了?
    本局選自阿法狗的網絡對局。Master(阿法狗)執黑對陣樸廷桓九段,弈於弈城圍棋網。本局中,狗老師在開局不到五十手的時候果斷選擇二路爬,並且取得了很好的效果,可謂顛覆了傳統的棋理。(實戰圖一 1-14) 白(樸廷桓)14選擇跳出簡明應對。