今天
給大家介紹一部關於圍棋的紀錄片
《 ALPHAGO 》
阿爾法圍棋
Chapter 1
什麼是圍棋?
一種策略型二人棋類遊戲,中國古時稱「弈」,西方名稱「Go」。
Ta既讓人聚精會神,又令人如醉如夢。
那就像是把你的手放到宇宙的禁區上。
如果你認真地下圍棋,那麼你就可能獲得在地球上獨一無二的那種體驗。
人們下圍棋已經有好幾千年的歷史,他們不只是想領悟圍棋,他們還想明白什麼才是領悟。
也許這才是作為人類的真正意義。
Chapter 2
阿爾法圍棋(AlphaGo)
是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人。
由谷歌(Google)旗下DeepMind公司
戴密斯·哈薩比斯Demis Hassabis
領銜的團隊開發。
戴密斯·哈薩比斯小時候很喜歡玩遊戲,
他開始玩的是象棋之類的棋盤遊戲。
他在8歲時買了自己的第一臺電腦,用的正是一場象棋比賽的獎金。
從那以後,他就覺得電腦是能夠拓展思想力量的神奇設備。
遊戲裡的虛擬環境是研發和測試人工智慧算法的絕佳平臺。
圍棋大概是人類所設計的最複雜的遊戲了
在圍棋上打敗職業棋手是人工智慧研究的一個長期而巨大的挑戰。
Chapter 3
機制原理
樊麾 (二段) 是一名職業圍棋手,也是2013年至2015年的歐洲圍棋冠軍。
他一生所學的一切都繞不開圍棋,就像是面鏡子。
他看到圍棋就好像看到了自己。
對他而言,圍棋就是真正生命。
一家名叫DeepMind的人工智慧公司邀請樊麾去到他們倫敦的辦公室一同分享他們正在研究的一個激動人心的圍棋項目。
出於對圍棋的熱愛,樊麾如約而至。
圍棋遊戲就像是人工智慧裡的聖杯,又像人工智慧進步程度的試金石。
要攻克圍棋需要人類的直覺,若能攻下圍棋,那就非同凡響了。
圍棋是世界上最古老、最持久的棋盤遊戲。
某種程度上講,它也是最簡單的,最為抽象的遊戲之一。
他只有一種棋子,一種移動,只需要把棋子落到棋盤上,你的目標就是要用自己的棋子連結圈起一片空的領域。當你圍住對手的棋子後,你就能俘虜它們,把它們撤下棋盤。
你要靠圈地來得分,到遊戲的最後,圈地最多的一方就獲勝了。
圍棋對計算機而言也是非比尋常的挑戰。
因為相對象棋來說,圍棋每一步的下法都有著更多的可能性。
象棋的每一步約有20種下法,而圍棋每一步約有200種下法。
棋盤上可能出現的棋局數量比宇宙中的原子數量還要多。
所以就算用上全世界的電腦,
讓它們運行100萬年也無法產生足夠的計算能力來算出所有的可能性。
如果你問圍棋高手某一步為什麼要那樣下,一般得到的答案便是直覺。
所以團隊必須研究出一種聰敏的算法來模擬人類的直覺行為。
自信滿滿的樊麾與AlphaGo進行對弈,意料之外,他五局連敗輸給AlphaGo。
受到挫敗的樊麾開始日夜與AlphaGo對弈,試圖找到它的弱點。
在反覆試錯、討論、改進之後,AlphaGo終於更新到了第18代,
並即將迎接屬於它的世紀之戰。
Chapter4
人機大戰
韓國職業圍棋棋手李世石(九段)對陣人工智慧程序AlphaGo。
他有信心能贏得5:0的結果,他認為人類的直覺仍然是人工智慧難以企及的。
全韓國大約有800萬人玩圍棋,即便你不認識李世石,他也已經是國家級人物。
全世界都注視著李世石,在此之前,他為國家,為自己而戰,但這次他是為人類而戰!
歡迎來到深思挑戰賽DeepMind Challenge,本次比賽使用中國規則 貼7.5目。
每人各有2小時,3次60秒的讀秒。
全世界的焦點全部聚焦在李世石身上,他選擇了黑棋。
代替AlphaGo執子的是——黃士傑(深思公司首席程式設計師)
他有些緊張,這是他第一次坐在世界級圍棋手面前,他能感受到李世石這偉大圍棋手的精神與禮節,他想這也是李世石第一次面對一個陌生的對手——它不是人類,沒有情感。
它很冷漠,但它很鎮定。
Game One
第一局
解說人員發現這局棋一開始就在交鋒,AlphaGo下得非常好,就像是個頂尖棋手,非常具有進攻性,它竟然擋了,這會讓李世石緊張起來。
因為AlphaGo在任何情況下都會思考1到1.5分鐘。這一步完全不像是人類的走法。
不管比賽變得多麼複雜,Alphago都像是早已知曉了一切。
李世石看了下對手的臉龐,這只是一種習慣性思維,
棋手會有這種本能去看棋盤另一邊的對手。
他想知道對手有何感受,這是一種習慣,只是黃士傑臉上透露不出任何信息。
因為黃士傑不是AlphaGo。
李世石有些疲憊了,或許是需要思考的事情太多,他驚慌了,他仿佛陷入了自我懷疑。。。
所有人類具備的情感開始幹擾他的判斷。
跟人類下棋的時候,你可以跟對手交流感覺。但面對AlphaGo時,你什麼都感覺不到。
當你在下棋時什麼都感覺不到,你就會越來越懷疑自己。
白子(AlphaGo執棋)想要從厚勢這裡大舉入侵。這一打嚇到了李世石。
他不敢相信眼前的一切,AlphaGo這一很有進攻性的一步,讓李世石開始落後,局面變得非常複雜。若李世石在精神上沒準備好的話,他會奔潰。這對人類棋手來說是難以想像的。
AlphaGo好像洞悉了接下來會發生的一切。這得益於AlphaGo的搜索深度,它正在搜索後面的50到60步。這也是AlphaGo對目前比賽能搜索預測出的最多步數。它通常能預測50多步,經常預測60多步。團隊在以前的遊戲裡經常看到走了150步左右,AlphaGo就能進行絕殺了。
72目!他輸了,李世石輸了。李世石無法相信,他接受不了,他需要時間來接受這結果,
也許AlphaGo已經很強了,但他不願意相信自己會輸。他是職業的圍棋棋手。
他非常禮貌地放棄了,李世石本來執黑子,但他落了白子。
計時停止!
人類當然會希望人類自己獲勝,這是很自然的反應。
但AlphaGo也是人類創造的。它是人類創造力和智慧力的終極象徵。
AlphaGo所做的每一件事都是因為人類創造了供它學習的數據,創造了從數據中得來的學習算法。創造了搜索算法。所有的這一切都來自於人類。
在這場人機大戰中,一臺電腦剛剛勝出,深思DeepMind讓它的電腦程式試著去挑戰世界上最厲害的大腦並獲勝了。
AlphaGo擊敗了一名職業棋手,對方曾獲得18次世界圍棋冠軍。
這次勝利在人工智慧領域開創了一次突破。
賽後李世石表示他曾獲得過很多次世界冠軍,也積累了很多經驗,所以輸掉這一局並不會影響他後續的比賽發揮。他認為現在的勝率是50/50
在這場人機大戰中誰能勝出呢?
在韓國首爾,人工智慧電腦在中國傳統棋盤遊戲圍棋上擊敗了世界冠軍,
李世石輸掉了第一局比賽,但他還有四次機會。
Game Two
第二局
李世石執白,他先前低估了Alphago,現在他要變換戰術。
下手變慢,出棋速度只有上局的一半。
賽場外,深思研究專家索爾·格雷佩爾(Thore Graepel)分享了AlphaGo是如何運作的:
AlphaGo有著3個主要部分:
1.策略網絡:它經過高水平的比賽棋譜訓練並模仿那些棋手。
2.估值網絡:它可以評估棋盤上的各個位置,算出各個位置的勝率。
3.樹狀搜索:它會通過比賽裡的各種變量,找出接下來可能出現的局面。
AlphaGo要最大化自己的勝率,它不關心自己具體贏了多少子多少目。
所以當它下緩手時,那可能表示說AlphaGo覺得自己很有希望獲勝。
這是一個歷史性的時刻,李世石是眾人關注的焦點,他承受了巨大的壓力。
李世石去中途出去吸菸了,AlphaGo還在繼續下棋。
它不管對手有沒有在場,黃士傑看到AlphaGo下了第37手,於是黃士傑在棋盤上落子了。
第37步,完全意想不到的一步,完全出乎意料的一步。
當眾人還以為是它失誤了的時候,樊麾看到這步大吃一驚,
因為正常人都不會走這一步棋,正常人不會在第五行肩衝的。
所以下在第4行的上面是非常少見的。
這是AlphaGo的一步原創下法。
我們下圍棋追求的就是這種創新性下法。
專業的解說員幾乎都一致認為不太會有哪個人類棋手會去選擇第37手這種下法。
程式設計師看了AlphaGo的後臺分析也同意這樣的評估。
AlphaGo說只有在萬分之一的機率下,人類棋手才有可能下出第37手這一步。
這確實是非常罕見的走法。
它超越了人類對它的指導,它萌生了一些新穎獨特富有創意的東西。
這是個有趣的時刻,幾乎所有的解說員都困惑不解了。。。
每個人都疑惑,可能不困惑的也只有機器了。。。
當李世石休息片刻回來後看到這一步,他也費解了。
他認為AlphaGo都是基於可能性的計算。
它僅僅是臺機器。但當李世石看到這37步時,他就不這麼想了。
顯然,AlphaGo很有創造力。這是很有創意的一步,也是很美妙的一步。
李世石一般都只需要思考一兩分鐘,但這次他思考了12分鐘之久。
可能人類覺得這步不好,但AlphaGo覺得這樣才對。
圍棋就像是地緣政治。這邊發生了一點小變動,在幾個小時後的棋盤另一邊就可能產生連鎖反應。比賽在那時就像是繞軸自轉了一樣。這一步非常特別,因為有了這一步,之前所下的全部棋子就都共同起作用了。它們連接了起來,看著就像是網絡一樣,連接起了每一處地方。
這非常特別的一步令李世石對AlphaGo有了新的思考。在圍棋裡究竟什麼才是創造力。
這比賽對李世石來說很艱難,AlphaGo就是不讓李世石自行其道。
黑子幾乎有了60目,黑子領先。
一般人這時早就放棄了,但李世石還想繼續下,他就是不想放棄,然而大勢已去。
他沒想到會輸得這麼慘,整個樓層裡都籠罩著一股凝重的悲傷。
賽後李世石承認他自己輸的很明顯,從比賽的一開始,他就沒有一刻感覺到自己還掌握著這局比賽。
人們還是很害怕有這麼一臺能夠自我學習的機器。
對團隊而言,AlphaGo就是電腦程式,但網絡上已經有人開始稱呼AlphaGo為他或她。
這是完全下意識的稱呼。
AlphaGo真的只是簡單的電腦程式,還不是完全的人工智慧。
人工智慧系統人格化的趨勢是理解人工智慧在未來對世界影響的一大難題。
Game Three
第三局
李世石這名圍棋大師深陷困境,他已經連敗兩局了。他今天必須得扳回一局來維持希望。
然而一開始戰鬥就很激烈了,AlphaGo下的很好並早早領先。
到第50手時,勝率就已經很高了,並一直在攀向100%。
當人太過求勝時,你就可能落敗。
他在比賽中一直試著直接交戰,這並非是李世石的一貫風格。
當我們改變自己的風格來跟對手下棋時,通常結果會很糟很糟。
此時執黑的李世石已經無處可走了,當你要輸的時候,就沒必要下完收官了。
又一次,李世石放棄了。
AlphaGo又贏了,連勝三局。連贏三局就贏得了整場比賽。
圍棋是所有棋盤遊戲中最難的。
如果AlphaGo贏了,也許人類就能開始真正明白圍棋是什麼。
賽後,李世石陷入了自我懷疑,他為他的無能為力向人類道歉。
Game Four
第四局
時間來到第四局,已經連輸三局的李世石反倒如釋重負了,因為這已無關尊嚴。
李世石開始找回自我,白子需要在黑子的領地內找到突破。
李世石非常地耐心,他在等待自己的時機。等時機一到,他就乘機出擊。
第78步,改變了比賽的天平,因為現在黑子無法逃脫了。勝率也急劇下降。
AlphaGo錯亂了,或許是搜索太深而迷失了。它知道自己失誤了,評估也開始轉向。
李世石的第78步「挖」打了AlphaGo一個措手不及。
他設法把局面變得非常複雜,使得人工智慧也沒法正確計算出來。
最終,AlphaGo放棄了,最為驚人的一局比賽。李世石殺了回來,扳回一局。
人們覺得既無助又害怕,我們人類看起來是那麼的渺小和脆弱。
這次勝利意味著我們仍可以堅守自我。
賽後,李世石露出了久違的笑容。
第78手,被中國頂尖圍棋手古力稱為神之一手。
只有萬分之一的人類才能下出那一步。
在看似絕境中找到出路。
Game Five
第五局
Alphago出現了錯亂,所有人都覺得Alphago在棋盤上下錯了地方。
當程序團隊都擔心它會下的很差,可能會輸得非常難看。
所有人都覺得AlphaGo的有些走法太奇怪了,甚至可能是下錯了,
但它那些看似失誤的走法,其實是緩著。
即便有其他更好的走法,可AlphaGo就是不用。
人類一直都用分數來衡量輸贏的機率。
而AlphaGo並不在乎贏了多少,它只需要贏一目就夠了。
這是AlphaGo給人類上的一課。
這也許會影響未來幾千年圍棋的遊戲方式。
最終,李世石以2.5目落敗給AlphaGo。
賽後,李世石感言通過這次經歷成長了,他會從中汲取經驗,學有所獲。
這場比賽雖然結束了,但就所有事情而言,可能才剛剛開始。。。
Chapter 5
未來
機器不僅能處理大量數據,它們還能智能地分析數據。
就拿這場圍棋比賽為例,機器的舉動甚至驚豔了職業棋手們。最終機器會獲得人類的信任。
因為在很多時候,機器會比人類做出更好的預判。
Alphago的根基很強大,Alphago把人類的創意下法變成了常規路數。
這給圍棋帶來新的示範。
卡斯帕羅夫(Kasparov)說過,一個好人加上一臺機器才是最佳的組合。
以上圖文資料均來自於紀錄片《AlphaGo》,如有侵權,敬請告知。
看到這裡,你是否對圍棋的世界也充滿了好奇,準備躍躍欲試了呢?
小小卡麥龍誠邀楊傑老師在以下時間點開設棋局,
歡迎大家前來學習和挑戰!
楊傑,年幼時作為區隊圍棋棋手,參加校區大小比賽,榮獲成績,曾榮幸受教於陳祖德和聶衛平等大師的指導棋,師從陸永和、邱鑫,同門師兄吳耀宇、邱俊為國家職業棋手,原上海本格圍棋任職,有著超過10年的圍棋教學經驗,和原上海市少年隊主教練培育出不少段位棋手,對孩子非常有耐心和親和力,用心教棋,用愛教棋,善於用講故事和遊戲的形式引起孩子對圍棋的興趣,深受喜愛。
聯繫我們
Tel:021-5466-6319
Email:info@petitchameleon.com