谷歌人工智慧首次破解圍棋比賽:完勝歐洲冠軍

2021-02-14 中科院物理所

  谷歌今日宣布在人工智慧領域的重要進展:開發出一款能夠在圍棋中擊敗職業選手的程序——AlphaGo,該程勳能夠通過機器學習的方式掌握比賽技巧。

  

人工智慧挑戰圍棋有多難?

  計算機和人類競賽在棋類比賽中已不罕見,在三子棋、跳棋和西洋棋等棋類上,計算機都先後完成了對人類的挑戰。但對擁有2500多年歷史的圍棋而言,計算機在此之前從未戰勝過人類。圍棋看起來棋盤簡單、規則不難,縱橫各19九條等距離、垂直交叉的平行線,共構成19×19(361)個交叉點。比賽雙方交替落子,目的是在棋盤上佔據儘可能大的空間。

  在極簡主義的遊戲表象之下,圍棋具有令人難以置信的深度和微妙之處。當棋盤為空時,先手擁有361個可選方案。在遊戲進行當中,它擁有遠比西洋棋更多的選擇空間,這也是為什麼人工智慧、機器學習的研發者們始終希望在此取得突破的原因。

  就機器學習的角度而言,圍棋的計算最大有3361種局面,大致的體量是10170,而已經觀測到的宇宙中,原子的數量才1080。西洋棋最大只有2155種局面,稱為香農數,大致是1047。

  

「機器學習」預測人類行為

  傳統的人工智慧方法是將所有可能的走法構建成一棵搜索樹 ,但這種方法對圍棋並不適用。此次谷歌推出的AlphaGo,將高級搜索樹與深度神經網絡結合在一起。這些神經網絡通過12個處理層傳遞對棋盤的描述,處理層則包含數百萬個類似於神經的連接點。

  其中一個神經網絡「決策網絡」(policy network)負責選擇下一步走法,另一個神經網絡「值網絡」(「value network)則預測比賽勝利方。谷歌方面用人類圍棋高手的三千萬步圍棋走法訓練神經網絡,與此同時,AlphaGo也自行研究新戰略,在它的神經網絡之間運行了數千局圍棋,利用反覆試驗調整連接點,這個流程也稱為鞏固學習(reinforcement learning)。通過廣泛使用Google雲平臺,完成了大量研究工作。

AlphaGo所使用的神經網絡結構示意圖

  徵服圍棋對於谷歌來說有重要意義。AlphaGo不僅是遵循人工規則的「專家」系統,它還通過「機器學習」自行掌握如何贏得圍棋比賽。谷歌方面希望運用這些技術解決現實社會最嚴峻、最緊迫的問題——從氣候建模到複雜的災難分析。

  在具體的機器訓練上,決策網絡的方式是輸入人類圍棋專家的比賽,到系統可以預測57%人類行動為止,此前最好成績是44%。此後AlphaGo通過在神經網絡內部進行比賽的方式(可以簡單理解成和自己下棋),開始學習自主探索新的圍棋策略。目前AlphaGo的決策網絡可以擊敗大多數具有龐大搜尋樹的最先進的圍棋程序。

  值網絡也是通過自己和自己下棋的方式來訓練。目前值網絡可以評估每一步棋能夠有多大勝算。這在此前被認為是不可能的。

  

AlphaGo戰績驚人

  實際上,目前AlphaGo已經成為最優秀的人工智慧圍棋程序。在與其他程序的對弈中,AlphaGo用一臺機器就取得了500場的勝利,甚至有過讓對手4手後獲勝的紀錄。去年10月5日-10月9日,谷歌安排AlphaGo與歐洲圍棋冠軍Fan Hui(樊麾:法國國家圍棋隊總教練)閉門比賽,谷歌以5-0取勝。

AlphaGo與歐洲圍棋冠軍樊麾的5局較量

  公開的比賽將在今年三月舉行,AlphaGo將在韓國首爾與韓國圍棋選手李世石九段一決高下,李世石是近10年來獲得世界第一頭銜最多的棋手,谷歌為此提供了100萬美元作為獎金。李世石表示很期待此次對決,並且有信心獲得勝利。

傑米斯·哈薩比斯(Demis Hassabis) 是Google DeepMind 的CEO。圖片來源:Nature Video

  此外,AlphaGo的發布,也是Deep MInd在2014年1月被谷歌收購以來首次發聲。在被收購之前,這家位於倫敦的人工智慧領域的公司還獲得了特斯拉和SpaceX創始人馬斯克的投資。

人機對弈誰將勝?

  值得一提的是,上一次著名的人機對弈要追溯到1997年。當時IBM公司研發的超級計算機「深藍」戰勝了西洋棋冠軍卡斯巴羅夫。不過西洋棋的算法要比圍棋簡單得多。西洋棋中取勝只需「殺死」國王,而圍棋中則用數子或比目的方法計算勝負,並不是簡單地殺死對方棋子。此前,「深藍」計算機的設計人2007年發表文章指出,他相信十年內能有超級電腦在圍棋上戰勝人類。

  該項目並未給IBM帶來可以銷售的產品,但卻讓我們意識到:基礎科學研究所面臨的巨大挑戰是值得我們去迎接的,雖然企業在這方面的收益還無法量化。

  隨著頂級科技公司爭相在產品中融入智能技術,谷歌並不是唯一一家研究圍棋AI的公司,Facebook對圍棋人工智慧的研究整合此前也亮相最新的計算技術:深卷積神經網絡(deep convolutional neural networks)和蒙特卡洛樹搜索(Monte Carlo tree search),前者利用類似於大腦的算法來學習和識別棋盤上各種模式的重要性,而後者相當於一種超前思維,用於計算詳細的戰略步驟。

    Facebook和谷歌在圍棋人工智慧方面的研究具有極大的代表意義。與西洋棋相比,圍棋更具深度。要讓計算機掌握相關技巧,需要更多類似於人類的模式識別和直覺判斷技巧,計算機象棋軟體越來越優秀,已將揭開了這項遊戲的神秘面紗;相比之下,圍棋目前更加神秘。但將來,圍棋的神秘色彩也可能不復存在。(李根 周峰 邊策 郭禕 )


來源:新浪科技

相關焦點

  • 電腦再贏人機大戰 谷歌人工智慧擊敗歐洲圍棋冠軍
    谷歌人工智慧擊敗歐洲圍棋冠軍  昨天谷歌宣布,其人工智慧研究團隊近期取得了一項重要突破:谷歌團隊構建的AlphaGo系統通過計算機學習掌握了圍棋這項古老的技藝,近期AlphaGo挑戰了三度問鼎歐洲圍棋桂冠的職業棋手樊麾二段,成績是5比0。
  • 人工智慧AlphaGo首局贏了圍棋冠軍李世石,對於他們你了解多少?
    北京時間3月9日下午消息,今天下午谷歌人工智慧AlphaGo與韓國棋手李世石的第一場比賽結束,AlphaGo獲得今日比賽的勝利。雙方在較量3個半小時後,李世石宣布認輸。今日比賽結束後,雙方還將分別在3月10日(周四)、12日(周六)、13日(周日)、15日 (周二)的北京時間中午12點進行剩餘4場比賽。本次比賽用時每方2小時,1分鐘讀秒三次。比賽採用中國規則,黑貼3又3/4子(黑貼7目半)。
  • 谷歌人工智慧能否打敗世界圍棋冠軍 就看這個人了
    》,介紹了DeepMind公司創始人的故事,DeepMind是谷歌人工智慧公司,本月將挑戰韓國圍棋高手李世石。下面是文章的主要內容。德米斯·哈薩比斯(Demis Hassabis)有著溫和的風度和謙遜的面容,但當他告訴我說,他正在致力於這樣一個使命——「解答智能問題,然後用它來解答一切問題」,他顯得很嚴肅。
  • 如何看待谷歌電腦圍棋挑戰世界冠軍
    此前的圍棋人工智慧則通不過,雖時有精彩之筆,也總會露出馬腳。 ——BetterRead  1月28日曝出了谷歌人工智慧圍棋擊敗歐洲冠軍的消息,隨後是谷歌拿出100萬美元作為獎金挑戰李世石。當日谷歌股價大幅上漲,漲幅4.42%,換算成市值漲了200億美元。從宣傳效果是看,谷歌這次的「廣告」做得太值。
  • 圍棋電腦1:0李世石(附人工智慧概念股)
    AlphaGo是谷歌Google DeepMind實驗室出品的一款機器人。去年10月,AlphaGo就在沒有讓子的情況下以5:0的成績戰勝了歐洲圍棋冠軍、職業圍棋二段樊麾。是1997年IBM深藍計算機在西洋棋上戰勝人類之後,人工智慧追趕人類的又一重大裡程碑。AlphaGo機器人除了戰勝過圍棋大師之外,也曾戰勝過同類型的圍棋軟體。
  • 電腦圍棋軟體與人工智慧
    電腦圍棋的發展歷史  電腦圍棋是人工智慧(AI)的一個領域,該領域致力於開發出可以下圍棋的電腦程式。自古以來,棋類遊戲一直被視為頂級人類智力試金石,人工智慧(AI)挑戰棋類大師的也被看做人工智慧發展的裡程碑。
  • 谷歌戰勝圍棋冠軍幕後的臺灣人-黃士傑每天寫16小時程序
    去年十月,Google(谷歌)旗下公司DeepMind開發的人工智慧程序AlphaGo,在圍棋賽五戰完勝棋力達二段(編按:職業級最高九段)的歐洲冠軍職業棋士樊麾,首創人類以計算機勝過職業棋士的紀錄;今年三月,AlphaGo更進一步挑戰韓國十八度獲得世界棋王頭銜的圍棋九段李世石,以四勝一敗作收。在這幾場全球關注的「人機對弈」賽事中,都有一隻手,替計算機下棋,他就是來自臺灣的黃士傑。
  • 李世石首賽認輸,谷歌AlphaGo成就人工智慧「登月事件」
    圍棋世界冠軍李世石與谷歌人工智慧程序AlphaGo首戰打響!
  • 劃時代的圍棋大爆炸嗎? 谷歌圍棋AI分先攻陷職業棋手!
    這個群裡都是世界各地華人精英,也都是圍棋愛好者,大家在熱烈討論的是——計算機已經在圍棋領域戰勝人腦了!  這可不是個新鮮話題,但之前的「戰勝」都是建立在計算機被人讓若干子的基礎上。世界計算機圍棋冠軍受四子、五子戰勝日本老牌超一流已經被認為是了不起的成績,而分先取勝職業高手……大量專家估計,五十年吧,算短的了……  但是——就在這中國的夜深時分,國際頂級期刊《自然》發出報導,谷歌研究的人工智慧「阿爾法圍棋」(AlphaGo)在分先情況下5比0大勝歐洲冠軍、原中國職業二段樊麾!
  • 《財經》人工智慧專家質疑谷歌圍棋AI大勝是有策劃的營銷
    編輯PS :關於谷歌圍棋AI屬於過度營銷更重要的參考意見是圍棋界專業人士的看法,總體上,認為歐洲圍棋冠軍存在很大可能放水的可能。
  • 重磅|谷歌發表Nature封面論文破解圍棋難題,Facebook卻說「是我們先做到的」
    團隊在最新一期《Nature》上發表論文稱,他們研發的人工智慧算法擊敗了歐洲圍棋冠軍Fan Hui,同時也擊敗了目前最好的圍棋程序中99.8%的對手。谷歌DeepMind團隊發表Nature封面論文,贏得圍棋人工智慧挑戰在邁向搭建具有更類似人類直覺的人工智慧道路上,谷歌取得了出乎意料的輝煌一步;他們研發出能夠在極其複雜的圍棋遊戲中擊敗專家級人類選手的計算機。他們將論文發表在了《Nature》上。谷歌團隊已經表明,掌握圍棋所需技能並不為人類獨享。
  • 超級人生|歐洲圍棋冠軍樊麾:沒有金立對圍甲10年的贊助,就沒有中國圍棋的今天
    多年以後,當樊麾職業二段與谷歌人工智慧AlphaGo面對面坐在19路棋盤兩側時,他怎麼也不會想到這一堆冰冷的鐵塊和雜亂無章的電線,竟承載著圍棋發展的未來。樊麾走上圍棋之路的故事,頗似天才圍棋少年的成長曆程:6歲學棋,16歲進入職業段位,同年進入中國國家少年隊,20歲到法國留學,25歲出任法國圍棋協會總教練至今。
  • 人工智慧攻克圍棋 你有理由不信e道航智能後視鏡?
    在3月9日~3月12日,李世石對陣谷歌AlphaGo的圍棋大戰中,谷歌AlphaGo執白戰勝韓國棋手李世石,在5番棋大戰中以3-0完勝人類。五番棋比賽中谷歌AlphaGo已贏得勝利,剩下的比賽中李世石智能寄希望「贏一局」了。
  • 面對谷歌圍棋AI,人類最後的智力驕傲崩塌了……
    就在今天,國際頂尖期刊《自然》報導了谷歌研究者開發的新圍棋AI。這款名為「阿爾法圍棋」(AlphaGo)的人工智慧,在沒有任何讓子的情況下以5:0完勝歐洲冠軍,職業圍棋二段樊麾。AlphaGo與歐洲圍棋冠軍樊麾的5局較量。圖片來源:參考文獻[1]這是人類歷史上,圍棋AI第一次在公平比賽中戰勝職業選手。此次比賽和以往不同。
  • 「關鍵」一步 臉書谷歌圍棋技術解密!
  • 2020世界人工智慧圍棋大賽在福州收官,衛冕冠軍星陣完勝登頂
    昨日(3日),備受關注的「福建海峽銀行杯」2020世界人工智慧圍棋大賽在福州鼓樓區吳清源圍棋會館結束了決賽的爭奪,衛冕冠軍星陣圍棋在七番棋決賽中4比0完勝採薇圍棋,再次成功登頂。第三屆「吳清源杯」世界女子圍棋賽三番棋決賽的第二局也於昨日進行,周泓餘扳回一城,今日將進行終極決戰。
  • 如果圍棋已被人工智慧完全破解 那它的意義在哪?
    據 棋牌大師頭條號報導  近期,圍棋與人工智慧的話題逐漸熱門。柯潔在某節目上的一席話「我這輩子也打敗不了AI」,更是發人深思。根據如今的貼目規則,如果AI破解了每一步後得出結論:按照現在的貼目(7.5)規則,白棋必勝,若修改到6.5則又是黑棋必勝。如果僅僅在選色時便能知曉勝負,那麼這樣圍棋還有什麼意義?
  • 2020世界人工智慧圍棋大賽在福州收官
    央廣網福州12月3日消息(記者張子亞)12月3日,備受關注的「福建海峽銀行杯」2020世界人工智慧圍棋大賽在福州吳清源圍棋會館結束了決賽的爭奪,衛冕冠軍星陣圍棋在七番棋決賽中4比0完勝採薇圍棋,再次成功登頂。
  • 柯潔三次喊話人機大戰背後,人工智慧正飛速進步
    柯潔是圍棋冠軍,曾長期佔據世界圍棋排行榜第一的位置,在圍棋方面說的話有很強的權威性。至於其他方面,就難說了。圍棋被認為是神秘的藝術今天,在網上看到柯潔又談到人類與人工智慧的比拼,新聞後面罵聲一片,忍不住想回顧一下。
  • 谷歌圍棋AI有科學欺詐表現的三個重要原因,關於大象關進冰箱要幾步?
    谷歌在這篇論文中 對其他圍棋程序選取了眾多測試對象,並進行了495次實驗,但對人類測試者,卻只選取了一位曾經獲得歐洲圍棋冠軍的棋手,並籤署嚴格的保密協議,原本可以很容易邀請更多選手,但卻沒有按照科學規範進行多次實驗。先不談谷歌和棋手之間有無利益交易,就這一點,谷歌在Nature發表的論文從實驗角度是不合格的。