柯潔是如何被阿法狗超越的?關鍵在於這3點!

2020-12-22 中公教育IT優就業

在2017年5月23日,一場舉世矚目的「圍棋人機對抗賽」在浙江桐鄉打響,參賽雙方分別是當時等級分排名世界第一的中國棋手柯潔九段,以及谷歌公司研製的人工智慧程序AlphaGo(國內網友親切地稱之為「阿法狗」)。

當時柯潔執黑子,阿法狗執白子,在激戰3個半小時之久後,AlphaGo執白1/4子戰勝柯潔,世人沸騰。

在一局圍棋中,平均每一步的下法大約有200種可能,棋盤上可能出現的局面總數到了遠大於宇宙中原子總數的地步。

因此,通過暴力窮舉手段預測所有的可能情況,並從中篩選中最優勢走法的思路,不適用於圍棋AI。

AlphaGo選擇了別的下棋方式:支撐AlphaGo提高棋力,打敗人類選手的「秘訣」 有三個:深度神經網絡、監督強化學習、蒙特卡羅樹搜索

深度神經網絡是包含超過一個認知層的計算機神經網絡。對於人工智慧而言,世界是被用數字的方式呈現的。人們將人工智慧設計出不同的「層」,來解決不同層級的認知任務。這種具備許多「層」的神經網絡,被稱為深度神經網絡。

AlphaGo包含兩種深度神經網絡:價值網絡和策略網絡。價值網絡使得AlphaGo能夠明晰局勢的判斷,左右全局「戰略」,拋棄不合適的路線;策略網絡使得AlphaGo能夠優化每一步落子,左右局部「戰術」,減少失誤。兩者結合在一起,使得AlphaGo不需要過於龐大的計算也能夠走出精妙的棋局,就像人類一樣。

監督學習和強化學習是機器學習方式的不同種類。監督學習是指機器通過人類輸入的信息進行學習,而加強學習是指機器自身收集環境中的相關信息作出判斷,並綜合成自己的「經驗」。在初始階段,AlphaGo收集研究者輸入的大量棋局數據,學習人類棋手的下法,形成自己獨特的判斷方式。之後,在不計其數的自己與自己模擬對弈,以及每一次與人類棋手對弈中,AlphaGo都能並根據結果來總結並生成新的範式,實現自我提高。

最後,蒙特卡洛樹是一種搜索算法。AI在利用它進行決策判斷時,會從根結點開始不斷選擇分支子結點,通過不斷的決策使得遊戲局勢向AI預測的最優點移動,直到模擬遊戲勝利。AI每一次的選擇都會同時產生多個可能性,它會進行仿真運算,推斷出可能的結果再做出決定。

相關焦點

  • 《棋魂》阿法狗和褚嬴對局誰會贏?
    (AlphaGo是第一個擊敗人類職業圍棋選手的的人工智慧機器人) 阿法狗是一個具有學習技能的人工智慧,阿法狗在圍棋方面的學習和計算能力遠超人類。
  • 柯潔苦戰終結AI41連勝 稱其實力已遠超阿法狗一代
    柯潔說「符合預期」的實力已經遠超去年3月的李世石版的AlphaGo。但是有網友在微博中隨即評論道:「別吹了,你的成就還遠不及李世石。你也永遠不可能第一個代表人類對戰電腦狗。」柯潔本人也毫不介意的回覆道瀟灑自在過一生。喜歡柯潔的人都知道兩天前柯潔在LG杯半決賽中輸給日本第一人井山裕太,賽後曾情緒低落地表示自己不適合下圍棋,而這次的勝利顯然又讓柯潔重拾了一些對於下棋的信心。
  • AI圍棋的千層套路①:精彩棄子轉換—阿法狗是如何顛覆傳統定式的
    ノ本期給大家帶來的是Master(阿法狗)與柯潔九段的網絡對局之一。柯潔執黑,阿法狗執白。本局中,狗子在人類棋手的常識邊緣反覆橫跳,把一眾高手秀得頭皮發麻。(實戰圖一)行至11,是雙方正常的布局。(實戰圖二)實戰阿法狗扳,著實令人吃了一驚。因為按照以往的思維,徵子不利的前提下,白棋是絕對不能扳的——(變化圖二)徵子不利的情況下,白棋大虧(實戰圖三)狗子當然不會自己坑自己,14打吃棄角,18再樸實無華的粘上。下至黑21,白棋勝率已經達到70%。
  • [微利說]阿法狗zero:主觀交易者是多餘的?
    僅僅用了3天,AlphaGo Zero就從一個僅僅會基本規則的初學者,成長到了具備超一流棋手的水平。此後的AlphaGo Zero並未停下追趕的腳步,到了第40天,它以壓倒性的優勢戰勝了此前3:0完勝柯潔的AlphaGo Master,勝率達到90%。
  • 棋人棋事:上世紀80年代愛下阿法狗招法的人
    有意思的是,二間跳守角這種上個世紀出現(甚至是更早時候出現)的這個「陳流」定式,居然是當下阿法狗慣用的招法之一,也如是,二間跳守角,也就成為當下許多人向阿法狗學習後可以掌握的一種招法了。對這種招法還有不少新的研究呢:包括如何更好地運用這種過去稱陳流,現在所謂的AI新定式,包括採取了二間跳守角定式後如何應對對手常用的招法;也包括提出了破解這種定式的多種辦法;還包括一種觀點的提出:二間跳守角實際上已經被人們「玩壞了」等等。二間跳守角一時如此熱鬧,不免讓人產生一種古老當時興的感覺,一如當下有人穿唐裝漢服逛街,許多少不更事的少男少女會覺得非常新鮮十分時髦一樣,呵呵!
  • 如果阿法狗這樣的AI來打LOL,會不會和職業選手根本不是一樣的套路?
    柯潔和阿法狗下完棋狗,感到絕望的不是棋力下不過狗,而是「人類千年的實戰演練進化,計算機卻告訴我們,人類全都是錯的……」。 同樣如果讓AI復盤LOL該版本的所有的職業比賽,再模擬訓練幾百萬局後,他們會不會打法思路和人類完全不一樣? 比如ADC不應該走下路雙人路,而是應該走上路單人路?
  • 愛迪生為何拒絕特斯拉,阿法狗如何戰勝李世石?背後的原因是一樣的
    已知的未知這部分就是那些你不懂,但是你知道自己不懂的部分。還是拿我講課當例子,我很清楚哪些知識是我沒掌握的,我不擅長的。3.這一部分有多大呢?可能有無限大。為什麼要講這個模型,因為在商業中,很有優秀的乃至偉大的作品都是瞄準了以上的領域2和領域3。叔本華說過一句話「優秀的人能射中別人射不中的靶子,而天才能射中別人看不到的靶子」,這句話的意思就是,真正的高手對事情的理解遠遠超出一般人的理解範疇,他們進入了未知的未知這裡領域裡了。
  • 請你告訴我:柯潔拿什麼超越李昌鎬?
    李昌鎬然而,最近老是有人問我「柯潔能超越李昌鎬嗎?」「柯潔會超越李昌鎬的對不對?」這樣的話題。甚至某些打著「天朝上國」思想的無知棋迷說「柯潔超越李昌鎬根本不是事」這樣的話。今天,我想我有必要站出來說說這件事了。
  • 阿法狗的詭異思路,完全難以捉摸的棋步
    阿法狗(虛擬圖像)基本圖局面,1—13手。參考圖一:白1跳,按照棋手的正常思路,黑2刺了以後粘,白棋飛的時候黑6夾擊(也可以走A,B位)。阿法狗的詭異思路:黑2碰。如果初學者這樣走,會被老師認為不適合下圍棋,但阿法狗不走尋常路,這樣的棋步令人匪夷所思。參考圖二:白棋1位扳,黑2大概也扳,然後黑棋走4位拐然後6—8強行拉出二子作戰嗎?人類棋手在此局面下肯定一頭霧水。
  • 阿法狗贏了李世石,贏得了棋王王一生嗎?
    韓國職業九段選手李世乭對陣阿法狗1:4的敗績,宣告了人類終歸丟掉了圍棋的陣地。
  • 柯潔送祝福李世石哽咽 「懷念過去有你的日子」
    令李世石感到意外的是,節目中柯潔竟然出現了!柯潔在這段提前錄製的視頻中表示:李世石前輩是一位偉大的棋士,也是我們從小就崇拜的偶像。隨後柯潔又真誠地向李世石說道:「我想念和您下圍棋的時光」。聽到這句話時,李世石的眼中突然泛起了淚光。李世石坦誠柯潔的真心話出乎了他的預料,所以哽咽。
  • 柯潔23歲豪取第八冠 他超越了同期的李昌鎬、李世石嗎?
    剛剛結束的三星杯上,柯潔九段在決賽中2:0乾淨利落地擊敗了韓國第一人申真諝九段,獲得個人第四座三星杯冠軍獎盃,這也是柯潔個人的第八個世界冠軍,追平前輩古力九段,並列成為中國獲得世界冠軍數量最多的棋手。
  • 盤點柯潔花樣2020:從女權罵戰到"大明皇帝",幾百萬獎金夠還房貸了嗎?
    柯潔還打進LG杯決賽,無論明年決戰結果如何,亞軍也能分到30萬人民幣。圍甲7勝1負,有國內媒體報導柯潔在圍甲每贏一盤能收穫15萬獎金,光獎金賺到105萬,算上基本工資,也是一筆不菲收入。從針對奚夢瑤生子的「下蛋」言論到退博,不過才255天,也許柯潔自己都未能預料到,他把自己拖入到四方罵戰的萬丈深淵。養了十年的狗和交了一年男朋友,誰更重要?柯潔回答:「這還用問嘛?當然是狗重要!」
  • 「阿爾法狗」變成「阿老師」 柯潔學到啥?
    因為賽前沒有幾個人看好世界第一的中國棋手柯潔,而昨天他首盤失利也印證了這一點。在這一背景下,「阿爾法狗」贏得了越來越多人的尊重,以至於更多人開始稱它「阿老師」。  ■本報記者 常明  四分之一子的強與弱  四分之一子是圍棋比賽中最小的取勝優勢,而昨天「阿老師」正是以這個最小優勢擊敗了賽前精心備戰的柯潔,且用時只是柯潔的一半。
  • 主播柯潔,在線教棋
    而在昨晚的課堂上,正就讀於清華大學的世界圍棋比賽「七冠王」柯潔成為了主講人,在廣大網友面前來了一次直播首秀。第一次用這樣的形式開課,柯潔坦言自己十分緊張。尤其在直播設備操作不熟練的情況下,對於音量的調整和鏡頭的切換,柯老師都花了點時間才完成了調整和適應。
  • 如何區分泰迪狗是否純種?關鍵是看這五點
    泰迪狗是最受歡迎的狗之一,如何判斷泰迪狗是否純種?這是很多寵物主人想說清楚的一點,主要看這五點。1、高度是38cm左右純種泰迪犬的肩高有自己的標準,應該非常對稱,一般來說,他在38釐米左右,如果可以,寵物可以自己測量肩高。
  • 《吐槽大會3》柯潔調侃王思聰 王楠東北話吐槽張繼科
    原標題:《吐槽大會3》柯潔調侃王思聰 王楠東北話吐槽張繼科 張繼科   王牌喜劇脫口秀節目《吐槽大會3》於上周日歡樂播出,張繼科擔任主咖,柯潔、王楠、曾軼可、袁成傑以及李誕、程璐、Rock幽默助陣。
  • 柯潔苦戰終結AI41連勝 深夜失眠發文感慨
    柯潔  騰訊體育訊 北京時間11月18日凌晨,世界圍棋第一人柯潔發微博,慶祝自己在網絡上下棋擊敗已經41連勝的新銳圍棋AI「符合預期」,柯潔判斷這個「符合預期」的實力已經遠超去年3兩天前柯潔在LG杯半決賽中輸給日本第一人井山裕太,賽後曾情緒低落地表示自己不適合下圍棋,而這次戰勝「符合預期」顯然讓他自信心大漲。  兩天前在LG杯半決賽上輸棋後,柯潔在社交平臺上貼出那一局的棋譜,並寫道:「記不清這是今年第幾次大意了?雖說勝負世界輸輸贏贏在所難免,但是在這種只要多算一會,就不太可能被逆轉的棋,大意輸掉,太痛苦了...或許我根本就不適合下圍棋。」
  • 《競然如此》第六期搶先看:柯潔斑斑「學霸戰爭」棋逢對手,高能...
    本期節目將迎來兩位「全能學霸」:一位是前皇室戰爭職業選手斑斑,另一位是圍棋世界冠軍柯潔。他們是來自復旦和清華的名校「學霸」,同時也都曾經在電競領域斬獲不俗成績。本期兩位嘉賓同臺分享,聊一聊照進他們人生的電競之光。兩位嘉賓都有競技選手與高校學子的雙重身份,他們如何看待學業與電競事業之間的關係?面對茫茫學海,圍棋領域裡的「學霸」柯潔如何勇敢破圈前行?
  • 對比這兩本寫作書,我總結出寫好文章的3個關鍵點
    其中《一本小小的紅色寫作書》廣受好評,這本書分別從結構、風格和可讀性三個方面講解文章的基礎寫作技巧。《一本小小的紅色寫作書》與《金字塔原理》有「異曲同工之妙」,這兩本書都是講關於寫作技巧,書中的觀點不謀而合,這更讓我們確信,基本的寫作技巧是一以貫之,常用常新的道理。今天我通過對比這兩本書中的觀點,跟大家總結分享寫好文章的3個關鍵點。