柯潔是如何被阿法狗超越的?關鍵在於這3點!

2020-12-16 中公教育IT優就業

在2017年5月23日,一場舉世矚目的「圍棋人機對抗賽」在浙江桐鄉打響,參賽雙方分別是當時等級分排名世界第一的中國棋手柯潔九段,以及谷歌公司研製的人工智慧程序AlphaGo(國內網友親切地稱之為「阿法狗」)。

當時柯潔執黑子,阿法狗執白子,在激戰3個半小時之久後,AlphaGo執白1/4子戰勝柯潔,世人沸騰。

在一局圍棋中,平均每一步的下法大約有200種可能,棋盤上可能出現的局面總數到了遠大於宇宙中原子總數的地步。

因此,通過暴力窮舉手段預測所有的可能情況,並從中篩選中最優勢走法的思路,不適用於圍棋AI。

AlphaGo選擇了別的下棋方式:支撐AlphaGo提高棋力,打敗人類選手的「秘訣」 有三個:深度神經網絡、監督強化學習、蒙特卡羅樹搜索

深度神經網絡是包含超過一個認知層的計算機神經網絡。對於人工智慧而言,世界是被用數字的方式呈現的。人們將人工智慧設計出不同的「層」,來解決不同層級的認知任務。這種具備許多「層」的神經網絡,被稱為深度神經網絡。

AlphaGo包含兩種深度神經網絡:價值網絡和策略網絡。價值網絡使得AlphaGo能夠明晰局勢的判斷,左右全局「戰略」,拋棄不合適的路線;策略網絡使得AlphaGo能夠優化每一步落子,左右局部「戰術」,減少失誤。兩者結合在一起,使得AlphaGo不需要過於龐大的計算也能夠走出精妙的棋局,就像人類一樣。

監督學習和強化學習是機器學習方式的不同種類。監督學習是指機器通過人類輸入的信息進行學習,而加強學習是指機器自身收集環境中的相關信息作出判斷,並綜合成自己的「經驗」。在初始階段,AlphaGo收集研究者輸入的大量棋局數據,學習人類棋手的下法,形成自己獨特的判斷方式。之後,在不計其數的自己與自己模擬對弈,以及每一次與人類棋手對弈中,AlphaGo都能並根據結果來總結並生成新的範式,實現自我提高。

最後,蒙特卡洛樹是一種搜索算法。AI在利用它進行決策判斷時,會從根結點開始不斷選擇分支子結點,通過不斷的決策使得遊戲局勢向AI預測的最優點移動,直到模擬遊戲勝利。AI每一次的選擇都會同時產生多個可能性,它會進行仿真運算,推斷出可能的結果再做出決定。

相關焦點

  • 當全國網友和「阿發狗」組隊,「阿法狗」表示壓力很大?
    2016年,人工智慧程序「阿法狗」與代表人類聰明大腦的圍棋世界冠軍、職業九段棋手李世石對戰,最終「阿法狗」以4比1的總比分獲勝;2017年初,「阿法狗」與中、日、韓數十位圍棋高手進行快棋對決,連續60局無一敗績;
  • AlphaGo Zero 橫空出世,無師自通完爆阿法狗
    今年 5 月的人機對局中,柯潔 9 段以 0:3 不敵 AlphaGo,隨後 Deepmind 在圍棋上進一步探索。
  • 曝人機大戰目的:檢測阿法狗漏洞 逼出失誤為成功
    廣州日報訊 (全媒體記者 施紹宗) 日前,世界第一高手柯潔與最新版「阿法狗」的三番棋較量,雙方第一局以柯潔的完敗而結束。外界對此疑問重重,既然比賽毫無懸念,為何還要搞這次人機大戰?
  • 像「阿法狗」一樣去交易
    前言像「阿法狗」一樣去交易「阿法狗」,英文名:AlphaGo。相信很多人都不陌生。2016年,谷歌開發出圍棋機器人「阿法狗」,之後橫掃人類,保持不敗,被阿法狗完虐的,還包括世界圍棋冠軍韓國的李世石,中國的柯潔。
  • 阿法狗團隊:Master只是測試版 人機決戰在今年
    阿法狗幕後團隊——谷歌DeepMind接受了成都商報記者獨家專訪。「人類注意了,Master只是其中一個。還有更多的人工智慧化身網絡帳號正在挑戰世界棋壇……」1月4日晚,隨著古力認輸,阿法狗(AlphaGo)新版Master對人類頂尖高手的戰績停留在60勝0負1和,而令人尷尬的是這唯一一場和棋還是因為棋手掉線系統自動判和。
  • 《棋魂》阿法狗和褚嬴對局誰會贏?
    那我們就看褚嬴和阿法狗對局誰會贏?(AlphaGo是第一個擊敗人類職業圍棋選手的的人工智慧機器人)阿法狗是一個具有學習技能的人工智慧,阿法狗在圍棋方面的學習和計算能力遠超人類。雖然褚嬴活了上千年,但是他的進步空間還是有限這一千多年中所下過產生的對局,褚嬴不可能都去學習看過,而對於阿法狗來說,這件事情就能簡單。所以在知識儲備上,阿爾狗具有絕對的優勢。
  • 人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo
    AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo(1769字)。公號由秦隴紀發起,未覆蓋各領域科普及簡化,期待大家參與~】 人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo(1736字)2016年底AlphaGo阿法狗4-1打敗世界冠軍Lee Sedol
  • iH5 3.0上線,這是H5行業的阿法狗和柯潔之戰
    和微信對社交相關的什麼都想做很像,iH5是和網頁相關的什麼都想做,尤其3.0還加入很多便攜開發組件,更進一步地靠近這個目標。 專業H5頁面製作工具,究竟有多少市場?一個全家桶式的創作型產品,會顛覆網際網路製造業嗎?一個工具功能這麼龐雜,如何擁有較高的易用性?
  • AI圍棋的千層套路①:精彩棄子轉換—阿法狗是如何顛覆傳統定式的
    ノ本期給大家帶來的是Master(阿法狗)與柯潔九段的網絡對局之一。柯潔執黑,阿法狗執白。本局中,狗子在人類棋手的常識邊緣反覆橫跳,把一眾高手秀得頭皮發麻。(實戰圖一)行至11,是雙方正常的布局。(實戰圖二)實戰阿法狗扳,著實令人吃了一驚。因為按照以往的思維,徵子不利的前提下,白棋是絕對不能扳的——(變化圖二)徵子不利的情況下,白棋大虧(實戰圖三)狗子當然不會自己坑自己,14打吃棄角,18再樸實無華的粘上。下至黑21,白棋勝率已經達到70%。
  • 創造出「阿法狗」的是怎樣的人
    在Deepmind公司公布的一段視頻中,有人就留意到,在「阿法狗」與樊麾對弈時,「阿法狗」的介紹標籤上貼著一個英國國旗。而這一次「阿法狗」挑戰韓國的世界冠軍李世石,現場的選手信息介紹中,也同樣給「阿法狗」貼上了一個英國國旗。
  • 關於阿法狗教學工具的若干疑問
    各位好,在連續擺了兩天阿法狗老師的布局的變化後,小編和同仁都深感自己已經中了「重度狗毒」,頗有難以自拔之感。然而中毒歸中毒,在學習阿法圍棋布局理論過程中依然浮現了一些「難解之謎」,並困擾著小編們,拿來與大家分享——上圖的結果公然反對一直以來人類教科書中點角方向的結論,且勝率差達3個點之多,讓人費解。
  • 如果阿法狗這樣的AI來打LOL,會不會和職業選手根本不是一樣的套路?
    柯潔和阿法狗下完棋狗,感到絕望的不是棋力下不過狗,而是「人類千年的實戰演練進化,計算機卻告訴我們,人類全都是錯的……」。 同樣如果讓AI復盤LOL該版本的所有的職業比賽,再模擬訓練幾百萬局後,他們會不會打法思路和人類完全不一樣? 比如ADC不應該走下路雙人路,而是應該走上路單人路?
  • 圖解:「阿法狗」勝出預示大數據成為軍事武器?
    「阿法狗」的出現,預示著未來由軟體定義的軍隊與戰爭將成為現實,數位化的戰例、訓練、演習將成為核心戰鬥力,物聯網、雲計算、作戰計算實驗將成為軍事行動的「新常態」,我們必須建立自己相應的智慧國防軍事理論與體系。3月15日,在舉世矚目的人機圍棋大戰中,谷歌的人工智慧程序(軟體機器人)「阿法狗」以4:1戰勝韓國世界冠軍李世乭,令人類瞠目結舌。
  • 人機大戰時間敲定5.23-27 柯潔領銜團戰阿法狗
    2017年4月10日,中國圍棋協會和浙江省體育局攜手Google共同宣布,三方將聯合主辦「中國烏鎮•圍棋峰會」,屆時,AlphaGo(谷歌人工智慧阿爾法圍棋)將再度與最頂尖的人類棋手進行對弈,這場為期五天,有關圍棋與人工智慧的賽事將於5月23日-27日在中國最負盛名的水鄉古鎮
  • 愛迪生為何拒絕特斯拉,阿法狗如何戰勝李世石?背後的原因是一樣的
    已知的未知這部分就是那些你不懂,但是你知道自己不懂的部分。還是拿我講課當例子,我很清楚哪些知識是我沒掌握的,我不擅長的。3.這一部分有多大呢?可能有無限大。為什麼要講這個模型,因為在商業中,很有優秀的乃至偉大的作品都是瞄準了以上的領域2和領域3。叔本華說過一句話「優秀的人能射中別人射不中的靶子,而天才能射中別人看不到的靶子」,這句話的意思就是,真正的高手對事情的理解遠遠超出一般人的理解範疇,他們進入了未知的未知這裡領域裡了。
  • 阿法狗的詭異思路,完全難以捉摸的棋步
    阿法狗(虛擬圖像)基本圖局面,1—13手。參考圖一:白1跳,按照棋手的正常思路,黑2刺了以後粘,白棋飛的時候黑6夾擊(也可以走A,B位)。阿法狗的詭異思路:黑2碰。如果初學者這樣走,會被老師認為不適合下圍棋,但阿法狗不走尋常路,這樣的棋步令人匪夷所思。參考圖二:白棋1位扳,黑2大概也扳,然後黑棋走4位拐然後6—8強行拉出二子作戰嗎?人類棋手在此局面下肯定一頭霧水。
  • 我們該恐懼的不是阿法狗 是身後的谷歌與美國
    這不是李世石的與阿法狗的博弈,而是美國的高科技與全球其他國家科技實力的博弈。  我們該恐懼的,不是阿法狗,而是阿法狗身後的Google與美國  一、  不出意外,李世石又輸了.  如果說第一盤輸,還有點自身失誤的內心鬱結,那麼,今天李世石几乎是滿盤被碾壓,完全沒脾氣。
  • 比柯潔輸棋更絕望的是,人類已經找不到AlphaGo的弱點
    在這場對弈中柯潔輸了1/4子,一度引發現場質疑,因為在中盤期,AlphaGo的優勢十分明顯,估算其贏了超過20目,對比最終的1/4子,有人認為AlphaGo有「放水」嫌疑。在賽後的新聞發布會上有記者就此問題提問稱,阿法狗是否可以控制輸贏比例?從某種角度看,這是一個有點兒可怕的猜測。
  • 3比0,「阿法狗」又贏了,為啥會讓學校很鬧心?|校長說升學
    它的名字叫「阿法狗」(AlphaGo),一隻會下圍棋的機器狗。今天,它和人類圍棋冠軍李世石剛下成了3:0。這個比分,不但讓圍棋高手們坐不住了,據說連校長們也不大開心。比如,本期「校長說升學」的嘉賓,安吉路良渚實驗學校校長駱玲芳。
  • 柯潔退網:從自負的天才棋手到自縛的「厭女符號」
    而在微博上,@柯潔大棋渣對此「大放厥詞」:「就算阿法狗贏了李世石,但它贏不了我。」在狗粉絲群體的內部,柯潔作為一名公眾人物理所應當地是群體中的「偶像」,他的微博也被視作粉絲團建和作戰的場域。 在選擇了「抽象話」這一符號系統後,柯潔逐漸被這一亞文化群體的思路、立場所馴化,到最後,他本身也成為了「狗粉絲」的一個符號。