柯潔是如何被阿法狗超越的?關鍵在於這3點!

2020-12-16 中公教育IT優就業

在2017年5月23日，一場舉世矚目的「圍棋人機對抗賽」在浙江桐鄉打響，參賽雙方分別是當時等級分排名世界第一的中國棋手柯潔九段，以及谷歌公司研製的人工智慧程序AlphaGo（國內網友親切地稱之為「阿法狗」）。

當時柯潔執黑子，阿法狗執白子，在激戰3個半小時之久後，AlphaGo執白1/4子戰勝柯潔，世人沸騰。

在一局圍棋中，平均每一步的下法大約有200種可能，棋盤上可能出現的局面總數到了遠大於宇宙中原子總數的地步。

因此，通過暴力窮舉手段預測所有的可能情況，並從中篩選中最優勢走法的思路，不適用於圍棋AI。

AlphaGo選擇了別的下棋方式：支撐AlphaGo提高棋力，打敗人類選手的「秘訣」有三個：深度神經網絡、監督強化學習、蒙特卡羅樹搜索。

深度神經網絡是包含超過一個認知層的計算機神經網絡。對於人工智慧而言，世界是被用數字的方式呈現的。人們將人工智慧設計出不同的「層」，來解決不同層級的認知任務。這種具備許多「層」的神經網絡，被稱為深度神經網絡。

AlphaGo包含兩種深度神經網絡：價值網絡和策略網絡。價值網絡使得AlphaGo能夠明晰局勢的判斷，左右全局「戰略」，拋棄不合適的路線；策略網絡使得AlphaGo能夠優化每一步落子，左右局部「戰術」，減少失誤。兩者結合在一起，使得AlphaGo不需要過於龐大的計算也能夠走出精妙的棋局，就像人類一樣。

監督學習和強化學習是機器學習方式的不同種類。監督學習是指機器通過人類輸入的信息進行學習，而加強學習是指機器自身收集環境中的相關信息作出判斷，並綜合成自己的「經驗」。在初始階段，AlphaGo收集研究者輸入的大量棋局數據，學習人類棋手的下法，形成自己獨特的判斷方式。之後，在不計其數的自己與自己模擬對弈，以及每一次與人類棋手對弈中，AlphaGo都能並根據結果來總結並生成新的範式，實現自我提高。

最後，蒙特卡洛樹是一種搜索算法。AI在利用它進行決策判斷時，會從根結點開始不斷選擇分支子結點，通過不斷的決策使得遊戲局勢向AI預測的最優點移動，直到模擬遊戲勝利。AI每一次的選擇都會同時產生多個可能性，它會進行仿真運算，推斷出可能的結果再做出決定。

相關焦點

當全國網友和「阿發狗」組隊,「阿法狗」表示壓力很大?

2016年，人工智慧程序「阿法狗」與代表人類聰明大腦的圍棋世界冠軍、職業九段棋手李世石對戰，最終「阿法狗」以4比1的總比分獲勝；2017年初，「阿法狗」與中、日、韓數十位圍棋高手進行快棋對決，連續60局無一敗績；
AlphaGo Zero 橫空出世,無師自通完爆阿法狗

今年 5 月的人機對局中，柯潔 9 段以 0:3 不敵 AlphaGo，隨後 Deepmind 在圍棋上進一步探索。
曝人機大戰目的:檢測阿法狗漏洞逼出失誤為成功

廣州日報訊（全媒體記者施紹宗）日前，世界第一高手柯潔與最新版「阿法狗」的三番棋較量，雙方第一局以柯潔的完敗而結束。外界對此疑問重重，既然比賽毫無懸念，為何還要搞這次人機大戰？
像「阿法狗」一樣去交易

前言像「阿法狗」一樣去交易「阿法狗」，英文名：AlphaGo。相信很多人都不陌生。2016年，谷歌開發出圍棋機器人「阿法狗」，之後橫掃人類，保持不敗，被阿法狗完虐的，還包括世界圍棋冠軍韓國的李世石，中國的柯潔。
阿法狗團隊:Master只是測試版人機決戰在今年

阿法狗幕後團隊——谷歌DeepMind接受了成都商報記者獨家專訪。「人類注意了，Master只是其中一個。還有更多的人工智慧化身網絡帳號正在挑戰世界棋壇……」1月4日晚，隨著古力認輸，阿法狗(AlphaGo)新版Master對人類頂尖高手的戰績停留在60勝0負1和，而令人尷尬的是這唯一一場和棋還是因為棋手掉線系統自動判和。
《棋魂》阿法狗和褚嬴對局誰會贏?

那我們就看褚嬴和阿法狗對局誰會贏？（AlphaGo是第一個擊敗人類職業圍棋選手的的人工智慧機器人）阿法狗是一個具有學習技能的人工智慧，阿法狗在圍棋方面的學習和計算能力遠超人類。雖然褚嬴活了上千年，但是他的進步空間還是有限這一千多年中所下過產生的對局，褚嬴不可能都去學習看過，而對於阿法狗來說，這件事情就能簡單。所以在知識儲備上，阿爾狗具有絕對的優勢。
人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo

AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo(1769字)。公號由秦隴紀發起，未覆蓋各領域科普及簡化，期待大家參與~】人工智慧從0到1：阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo(1736字)2016年底AlphaGo阿法狗4-1打敗世界冠軍Lee Sedol
iH5 3.0上線,這是H5行業的阿法狗和柯潔之戰

和微信對社交相關的什麼都想做很像，iH5是和網頁相關的什麼都想做，尤其3.0還加入很多便攜開發組件，更進一步地靠近這個目標。專業H5頁面製作工具，究竟有多少市場？一個全家桶式的創作型產品，會顛覆網際網路製造業嗎？一個工具功能這麼龐雜，如何擁有較高的易用性？
AI圍棋的千層套路①:精彩棄子轉換—阿法狗是如何顛覆傳統定式的

ノ本期給大家帶來的是Master(阿法狗)與柯潔九段的網絡對局之一。柯潔執黑，阿法狗執白。本局中，狗子在人類棋手的常識邊緣反覆橫跳，把一眾高手秀得頭皮發麻。（實戰圖一）行至11，是雙方正常的布局。（實戰圖二）實戰阿法狗扳，著實令人吃了一驚。因為按照以往的思維，徵子不利的前提下，白棋是絕對不能扳的——（變化圖二）徵子不利的情況下，白棋大虧（實戰圖三）狗子當然不會自己坑自己，14打吃棄角，18再樸實無華的粘上。下至黑21，白棋勝率已經達到70%。
創造出「阿法狗」的是怎樣的人

在Deepmind公司公布的一段視頻中，有人就留意到，在「阿法狗」與樊麾對弈時，「阿法狗」的介紹標籤上貼著一個英國國旗。而這一次「阿法狗」挑戰韓國的世界冠軍李世石，現場的選手信息介紹中，也同樣給「阿法狗」貼上了一個英國國旗。
關於阿法狗教學工具的若干疑問

各位好，在連續擺了兩天阿法狗老師的布局的變化後，小編和同仁都深感自己已經中了「重度狗毒」，頗有難以自拔之感。然而中毒歸中毒，在學習阿法圍棋布局理論過程中依然浮現了一些「難解之謎」，並困擾著小編們，拿來與大家分享——上圖的結果公然反對一直以來人類教科書中點角方向的結論，且勝率差達3個點之多，讓人費解。
如果阿法狗這樣的AI來打LOL,會不會和職業選手根本不是一樣的套路?

柯潔和阿法狗下完棋狗，感到絕望的不是棋力下不過狗，而是「人類千年的實戰演練進化，計算機卻告訴我們，人類全都是錯的……」。同樣如果讓AI復盤LOL該版本的所有的職業比賽，再模擬訓練幾百萬局後，他們會不會打法思路和人類完全不一樣？比如ADC不應該走下路雙人路，而是應該走上路單人路？
圖解:「阿法狗」勝出預示大數據成為軍事武器?

「阿法狗」的出現，預示著未來由軟體定義的軍隊與戰爭將成為現實，數位化的戰例、訓練、演習將成為核心戰鬥力，物聯網、雲計算、作戰計算實驗將成為軍事行動的「新常態」，我們必須建立自己相應的智慧國防軍事理論與體系。3月15日，在舉世矚目的人機圍棋大戰中，谷歌的人工智慧程序（軟體機器人）「阿法狗」以4:1戰勝韓國世界冠軍李世乭，令人類瞠目結舌。
人機大戰時間敲定5.23-27 柯潔領銜團戰阿法狗

2017年4月10日，中國圍棋協會和浙江省體育局攜手Google共同宣布，三方將聯合主辦「中國烏鎮•圍棋峰會」，屆時，AlphaGo（谷歌人工智慧阿爾法圍棋）將再度與最頂尖的人類棋手進行對弈，這場為期五天，有關圍棋與人工智慧的賽事將於5月23日-27日在中國最負盛名的水鄉古鎮
愛迪生為何拒絕特斯拉,阿法狗如何戰勝李世石?背後的原因是一樣的

已知的未知這部分就是那些你不懂，但是你知道自己不懂的部分。還是拿我講課當例子，我很清楚哪些知識是我沒掌握的，我不擅長的。3.這一部分有多大呢？可能有無限大。為什麼要講這個模型，因為在商業中，很有優秀的乃至偉大的作品都是瞄準了以上的領域2和領域3。叔本華說過一句話「優秀的人能射中別人射不中的靶子，而天才能射中別人看不到的靶子」，這句話的意思就是，真正的高手對事情的理解遠遠超出一般人的理解範疇，他們進入了未知的未知這裡領域裡了。
阿法狗的詭異思路,完全難以捉摸的棋步

阿法狗（虛擬圖像）基本圖局面，1—13手。參考圖一：白1跳，按照棋手的正常思路，黑2刺了以後粘，白棋飛的時候黑6夾擊（也可以走A，B位）。阿法狗的詭異思路：黑2碰。如果初學者這樣走，會被老師認為不適合下圍棋，但阿法狗不走尋常路，這樣的棋步令人匪夷所思。參考圖二：白棋1位扳，黑2大概也扳，然後黑棋走4位拐然後6—8強行拉出二子作戰嗎？人類棋手在此局面下肯定一頭霧水。
我們該恐懼的不是阿法狗是身後的谷歌與美國

這不是李世石的與阿法狗的博弈，而是美國的高科技與全球其他國家科技實力的博弈。　　我們該恐懼的，不是阿法狗，而是阿法狗身後的Google與美國　　一、　　不出意外，李世石又輸了.　　如果說第一盤輸，還有點自身失誤的內心鬱結，那麼，今天李世石几乎是滿盤被碾壓，完全沒脾氣。
比柯潔輸棋更絕望的是,人類已經找不到AlphaGo的弱點

在這場對弈中柯潔輸了1/4子，一度引發現場質疑，因為在中盤期，AlphaGo的優勢十分明顯，估算其贏了超過20目，對比最終的1/4子，有人認為AlphaGo有「放水」嫌疑。在賽後的新聞發布會上有記者就此問題提問稱，阿法狗是否可以控制輸贏比例？從某種角度看，這是一個有點兒可怕的猜測。
3比0,「阿法狗」又贏了,為啥會讓學校很鬧心?|校長說升學

它的名字叫「阿法狗」（AlphaGo），一隻會下圍棋的機器狗。今天，它和人類圍棋冠軍李世石剛下成了3:0。這個比分，不但讓圍棋高手們坐不住了，據說連校長們也不大開心。比如，本期「校長說升學」的嘉賓，安吉路良渚實驗學校校長駱玲芳。
柯潔退網:從自負的天才棋手到自縛的「厭女符號」

而在微博上，@柯潔大棋渣對此「大放厥詞」：「就算阿法狗贏了李世石，但它贏不了我。」在狗粉絲群體的內部，柯潔作為一名公眾人物理所應當地是群體中的「偶像」，他的微博也被視作粉絲團建和作戰的場域。在選擇了「抽象話」這一符號系統後，柯潔逐漸被這一亞文化群體的思路、立場所馴化，到最後，他本身也成為了「狗粉絲」的一個符號。

柯潔是如何被阿法狗超越的?關鍵在於這3點!

相關焦點

當全國網友和「阿發狗」組隊,「阿法狗」表示壓力很大?

AlphaGo Zero 橫空出世,無師自通完爆阿法狗

曝人機大戰目的:檢測阿法狗漏洞 逼出失誤為成功

像「阿法狗」一樣去交易

阿法狗團隊:Master只是測試版 人機決戰在今年

《棋魂》阿法狗和褚嬴對局誰會贏?

人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo

iH5 3.0上線,這是H5行業的阿法狗和柯潔之戰

AI圍棋的千層套路①:精彩棄子轉換—阿法狗是如何顛覆傳統定式的

創造出「阿法狗」的是怎樣的人

關於阿法狗教學工具的若干疑問

如果阿法狗這樣的AI來打LOL,會不會和職業選手根本不是一樣的套路?

圖解:「阿法狗」勝出預示大數據成為軍事武器?

人機大戰時間敲定5.23-27 柯潔領銜團戰阿法狗

愛迪生為何拒絕特斯拉,阿法狗如何戰勝李世石?背後的原因是一樣的

阿法狗的詭異思路,完全難以捉摸的棋步

我們該恐懼的不是阿法狗 是身後的谷歌與美國

比柯潔輸棋更絕望的是,人類已經找不到AlphaGo的弱點

3比0,「阿法狗」又贏了,為啥會讓學校很鬧心?|校長說升學

柯潔退網:從自負的天才棋手到自縛的「厭女符號」

曝人機大戰目的:檢測阿法狗漏洞逼出失誤為成功

阿法狗團隊:Master只是測試版人機決戰在今年

我們該恐懼的不是阿法狗是身後的谷歌與美國