阿爾法圍棋(AlphaGo)簡單來說就是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人。
AlphaGo與柯潔的對決好像已經過去了一年半。
那場傳奇的交手不知道大家是否看過,
那次比賽中體現AI智能的巔峰之作與人類智慧的頂點的終極對決,
那時對抗中Alpha的冰冷與人類人性中的脆弱與柔軟,
那項以算法代碼堆砌出的智慧結晶中蔚為大觀的通略全局中的睿智光芒,
那種比拼中柯寶體現出的人類的雖然有弱點但永不服輸的精神,
真的很值得我們思考,
這個科技與人性背後的故事。
1.AlphaGo的輝煌戰績
2016.3
韓國
阿爾法圍棋與圍棋世界冠軍、職業九段棋手李世石交手,以4比1的總比分獲勝。
(最傳奇的第四場:人類唯一一次戰勝AlphaGo,AlphaGo當時犯了一個很低級的錯誤)
2016-2017
中國棋類網站
以大師(Master)為註冊帳號與中日韓數十位圍棋高手進行快棋對決,連續60局無一敗績(柯潔也包括在內,屬實太殘酷了)
2017.5
中國烏鎮圍棋峰會
它與排名世界第一的世界圍棋冠軍柯潔對戰,以3比0的總比分獲勝。
(看到柯潔哭的時候真的是心有不甘啊)
賽後圍棋界公認阿爾法圍棋的棋力已經超過人類職業圍棋頂尖水平。
在Go Ratings網站公布的世界職業圍棋排名中,其等級分曾超過排名人類第一的棋手柯潔。
2.AlphaGo如何運行?
阿爾法狗的三大核心技術:蒙特卡洛樹搜索,機器學習算法,深度神經網絡。由於篇幅限制這裡僅介紹一下蒙特卡洛樹搜索。
蒙特卡洛樹搜索(MCTS)實質是一種增強學習,簡單地說就是隨機抽樣或同級實驗方向。分為四部並反覆迭代。
1.選擇
從根節點,也就是從該自己落子時候的局面R出發向下選擇一個走法;
局面R是第一個被檢查的節點,被檢查的節點如果存在一個沒有被預想過的招式m,那麼被檢查的節點在執行m後得到的新局面(棋局狀況)就是我們所需要展開的T;
如果被檢查的局面所有可行的招式已經都被預算過了,那麼利用公式得到一個擁有最大ucb值(有限的可行的時間內找到較優解)的可行招式,並且對這個招式產生的新局面再次進行檢查;
如果被檢查的局面是一個遊戲已經結束的遊戲局面,那麼直接執行步驟4;
通過反覆的進行檢查,最終得到一個在樹的最底層的最後一次被檢查的局面c和它的一個沒有被評價過的招式m,執行步驟2。
2.拓展
對於此時存在於內存中的局面c,添加一個它的子節點。這個子節點由局面c執行招式m而得到,也就是T。
3.模擬
從局面T出發,雙方開始隨機的落子。最終得到一個結果(win/lost),以此更新T節點的勝利率。
4.反向傳播
在T模擬結束之後,它的父節點c以及其所有的祖先節點依次更新勝利率。一個節點的勝利率為這個節點所有的子節點的平均勝利率。並從T開始,一直反向傳播到根節點R,因此路徑上所有的節點的勝利率都會被更新。
之後,重新從第一步開始,不斷地進行迭代。使得添加的局面越來越多,則對於R所有的子節點的勝利率也越來越準。最後,選擇勝利率最高的招式。
3.柯潔vs AlphaGo
柯潔徹夜難眠
在烏鎮對決的那天晚上柯潔在微博中寫道:
決戰前夕,感慨萬千.……
在這個特殊的時間,我有些話想和熱愛圍棋、關注圍棋、關注我的朋友們說:
無論輸贏,這都將是我與人工智慧最後的三盤對局。
很多人可能會問為什麼?
其實私底下我已經與朋友家人說了很多次這樣的想法,現在的AI進步之快遠超我們的想像。像國產的絕藝、日產的ZEN雖然和AlphaGo還有著較大差距,但已經表現出超強的實力了……
我相信未來是屬於人工智慧的。
可它始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛。對它而言……它的熱情——也只不過是運轉速度過快導致CPU發熱罷了
我會用所有的熱情去與它做最後的對決,不管面對再強大的對手——我也絕不會後退!至少這……最後一次……
拼盡全力後,無論結果……管他口中是是非非,來一首《滄海一聲笑》……豈不美哉、快意?我淡然笑到……
不眠夜,且看且珍惜,請大家欣賞我最後的三盤人機大戰。
小編非常喜歡柯潔,
不僅喜歡他比賽時精湛的棋藝和有大局觀的氣度,
更欣賞他的狂與傲。
是他讓更多人了解到圍棋,
了解到圍棋不是老古董,
了解到圍棋也是可以很生動很好玩的。
他的狂傲不僅是因為性格,
更是因為那份與生俱來的對圍棋的熱愛吧。
賽後
結局大家也因該已經知道,柯潔完敗。
0-3收場
柯潔之後說:「我自己可能做的不好,昨晚也沒睡好,很緊張,最後一局能用什麼辦法對AlphaGo,其實都是庸人自擾。其實下棋是很快樂的,我以後下棋也應該更快樂,讓大家感覺到圍棋的魅力。離開勝負也感受不到圍棋的快樂,可能我和人下棋才能感受到。AlphaGo對我而言沒有任何失誤,所以我也特別痛苦,之前說這是我與人工智慧的最後三盤棋,這是一個正確的決定。」
柯潔再次強調,和AlphaGo下棋感覺實在太痛苦,AlphaGo太冷靜,感受不到希望。
「今天比賽最後也很有意思,我本以為AlphaGo會慢慢收官讓我輸一點點,沒想到他這麼不給面子,把我大龍全吃了。我能做的只有改變自己,超越自己,希望能讓張揚的柯潔、自信的柯潔一如既往保持下去。也希望能讓大家理解,圍棋並非深奧、不接地氣,也是很簡單有趣的。」
AlphaGo只是一段代碼
不會懂柯潔淚灑棋場時內心作為一個人的脆弱,
更不會懂柯潔在慢慢向世界第一邁進的心酸與喜悅,
不懂得他和連笑的cp情誼,
不懂柯潔的「狂」,不懂他的「傲」。
未來機器會取代人類嗎?小編認為,不會的。
在生活中有時你可能也和小編一樣,感到諸多不適,感到自己仿佛缺少了點什麼,缺少對自己的理解與定位。
而今天借這次機會,
又再次想到了柯潔,
那個敢愛敢恨敢拼敢闖的少年,
那個狂傲的棋士,
還有那句「人不輕狂枉少年。」
記憶中的一切都那麼親切那麼值得回憶,
因為過去是安全的,她只留在你的記憶裡靜靜地等待著。
但是也要學會走出記憶,看到更廣更大的世界,
去學一學柯潔那份專屬於自己的狂傲與少年豪氣。
走出流光,願你我歸來仍是少年。