本文來自微信號:慶豐棋聖木可三吉
大家期待已久的人機大戰第二季三番棋的講解,由兩位對局者親自出馬的靠譜講解,終於來了。
由現「前五十手天下第一(人)」的樊麾二段攜與人機大戰期間完全相同配置的AlphaGo,與體重已達76.5 KG的「世界圍棋第一人」柯潔九段聯袂奉獻專業解說。
第一局連結
第二局連結
第三局連結
這個節目大概是早些時候錄製的,當時圍棋TV的演播室還是這個茶几+沙發的布置。現在已經改成電視臺的那種三角形的桌子了。
因為要做英文字幕,面向世界各地的棋友,所以花了不少時間進行後期製作。感興趣的棋友們也可以學習一些英文詞句。
比如,下得比較「淡」(形容AlphaGo的棋風),這個詞對應的翻譯是「bland」。
出現在鏡頭中的阿柯略顯月半,臉也有點圓,氣色不錯。Corgi said he is thinner(棋薄) in the programme, but now he is fatter(人厚).
看過之後的一個強烈的感覺就是——阿柯還是非常強的,對棋的理解又快又準,而且不固執,的確是最接近於狗哥的棋手,所以雙方的「交流」和理解是比較順暢的。如果是個棋力不夠高或者悟性不夠強的棋手,大概不能形成有效的交流和理解。
同時,也更加深刻地展示了狗哥的棋高,而且是理智型的高。尤其是狗哥站在阿柯的視角拆解變化,當一個局部虧損之後,不會再繼續不理智地越陷越深,而是即使懸崖勒馬,寧肯選擇一個虧得最少的變化,趕緊止損,然後在其他更寬闊地地方尋求追趕的戰機。而人類棋手往往因為思維慣性一條道跑到黑。
另外,狗哥並沒有在任何一個局部都背後準備相當犀利的必殺技。在絕大多數場合,只是依靠對大方向的把握,簡簡單單佔據更好的方向和更大的價值處,一點一點積累足以獲得勝利的資本。至少在對阿柯時,不是非得怎麼一下子搞死對手,沒那麼緊。
有棋友形容得蠻形象的:「這步虧了兩個點,這步虧了一個點,這步虧的有點多,五個點了。。。阿狗勝率80了,gg」。
這盤棋下邊的戰鬥是白棋(柯潔九段執白)虧了,這個判斷也與我們當時的判斷一致。並不是不分高下。更不是前一百手都勢均力敵。
另外就是當時布局階段白棋在下方的棋形,po主是覺得偏薄,在左上交換之後,這裡更薄,不是個很好的構思,將來戰鬥要吃虧。在這次阿柯(以下簡稱76.5KG)自己的講解裡,他當時也覺得這裡有所擔心,不是很滿意。但是,AlphaGo的判斷是認為76.5KG的白棋這麼下是可以的。
不過,大家公認,狗哥也「親自鑑定」,三番棋中的第二局是阿柯下得最好的一局,甚至也是AlphaGo升級為Master版本之後,人類棋手與AlphaGo最為接近的一局,發揮很棒,既是以實力為基礎,又有靈感和一點點小運氣的成分。這是值得稱道的一局棋。
AlphaGo這一版本的棋是很嚴謹的,這次完全可以做到復盤勝,也就是說狗哥的棋是禁得起推敲的,不給對手「這裡是唯一敗招,我下得時候沒看見,如果我重新下,我走對了,我就能贏了」的幻想,因為你這裡走對了,其他地方也還是不行。這是實力上的壓制,不存在「我能贏」的偶然性,——棋的進程可能有一定偶然,結果是必然的。
在很多小細節上,狗哥能夠精細地積攢優勢。哪怕只是一點點細微的出入,積少成多。1%的優勢看似不多,但如果有5步、10步這種小優勢,累積起來就可怕了。為什麼幾乎與AlphaGo的對局,人類棋手差不多沒有撐過100手的,大多前50手之後就不太行了?因為即便沒有大的戰鬥,沒有明顯的失誤,僅僅是被積累了幾個1%的小優勢,那也是很難撈回來了,而且這種差距後面還可能繼續積累。
這次三盤棋的講解比預想中的要簡短,可能是因為76.5KG時間比較緊張,很難在繁忙的賽程中抽出太多的時間。看視頻,這三盤棋的講解是一氣錄下來的,不是一天錄一盤,講得很細的那種。在開局和主要的勝負決定處(往往比人們意識到的更早)用了比較多的時間,後面就比較簡略了。如果換成與人下,76.5KG在後半盤還是有大把機會逆轉的。
具體這三局棋進程中的勝率變化如下(百分比為勝率,前面的數字n表示第n手):
這裡可以有一個補充,樊麾二段這次透露,AlphaGo在勝率沒有超過70%時,是不會保守退縮的,還是會繃得很緊。
這確實是個新說法,以前大家可能都有種錯覺。不過po主或多或少還是覺得,如果優勢比較明顯,狗哥大概還是會採取偏保守和穩健的下法。很臭的保守是不會的。但一般性的保守,或者差不多的情況下選擇一種穩健的下法,這應該是存在的。當然,從某種角度來看,這種優勢之下穩健的下法也的確是當前局面下理所當然的最佳招法(或之一),無可厚非。
同時,當勝率掉到比較低(如30%以下)之後,AlphaGo是會下一些拼命招法的。但這種拼命不是早期版本中的亂下死一片的胡搞,而是有一定合理性地拼搏。
這就意味著,AlphaGo是會下讓子棋的。那些覺得AlphaGo落後了就不會下棋的猜想並不成立。當AlphaGo判定勝率低到一定程度,比如20%以下,逆轉無望,便會認輸。不會等到完全塵埃落定,無子可落再認。這一點與人類棋手比較像了。
根據我們現在看到的AlphaGo表現出來的水準,TA與「圍棋之神」的差距恐怕已經不太大了。換句話說,照現有思路進化的AlphaGo提升到頂點後,仿照吳清源時代的十番棋規則,圍棋之神應無法讓AlphaGo先,雙方執黑不貼目地情況下進行十番棋對決,大致五五開。(當然,如果執黑大貼目進行十番棋大戰,「圍棋之神」應該能贏)
但無論如何,早前人們認為只有窮舉才能找到圍棋極高境界的判斷是不準確的。深度學習的理論已經基本解決了圍棋問題。
弈客圍棋原創整理!更多精彩賽事直播,棋文弈事,盡在弈客圍棋,下載弈客APP,和熱愛圍棋的棋友對弈手談!