2017-06-07 09:31:55 慶豐棋聖木可三吉
人機大戰第二季結束的時候,AlphaGo也便退出了競技舞臺,從此江湖上只留下傳說......和50盤自戰棋譜。
在與柯潔九段對戰時,AlphaGo平均大約30-40秒鐘下一手棋,而且是只用了4個TPU的單機版,尚算不上拿出最強手段。
這次的AlphaGo自戰棋譜是平均2分鐘一手棋,具體用了什麼硬體資源未知,不過也絕不會比與柯潔九段下棋的那個版本差就是了。
從這點也證明,在人機大戰第二季前,DeepMind已經信心十足,無需全力施展。
※
即便是與人類最強的棋手們對局,五十餘手之後,AlphaGo也佔據明顯上風,一百手之後勝負基本無懸念。所以,大家都很遺憾沒辦法看到AlphaGo的最強後半盤,而且前半盤是不是就下出了最佳應對也不好說。
由於人類棋手和其它圍棋AI都不是AlphaGo的對手,那麼,剩下的唯一希望就只有AlphaGo vs AlphaGo了。
一些對圍棋不太熟悉的圍觀者喜歡用「矛和盾」的故事來抖機靈,總以為AlphaGo vs AlphaGo是不是就成了無解悖論了?AlphaGo是不是會就此系統崩潰呢?
這是對機器學習缺乏基本的認知。AlphaGo在進化期間,每天都在通過自我對弈的方式來提升。事實上,在第一次人機大戰之後,AlphaGo已經證明了TA具備了位居頂尖棋手之上的實力,接下來的日子裡,TA使用人類棋譜已經非常少了,進步基本靠「自己教自己」。
AlphaGo vs AlphaGo根本不是什麼「矛與盾」的故事,也不存在什麼悖論,而是AlphaGo的「日常」。
po主以前給棋友們講過一盤AlphaGo的自我對弈棋譜,那是AlphaGo Lee版本的自我對弈。
經典對局講解:AlphaGo vs AlphaGo
在那盤棋中,輸掉的AlphaGo是因為一招緩手(也就是大局觀判斷方面的失誤)而「走遠」的。在第一次公布的三盤自戰棋譜裡,有兩盤都是因為「大局觀」的問題而輸棋的。