柯潔對戰阿爾法狗首場告負 圍棋人機對弈的五十年

2020-11-24 北晚新視覺網

2017年5月23日訊,AlphaGo2.0來到中國, 「人機大戰第二季」激戰正酣。但事實上,AlphaGo已經是圍棋人工智慧的第三代。在開發圍棋人工智慧的道路上,人類已經艱難地探索了將近五十年。

第一代圍棋人工智慧
是中國教授發明

圍棋的英譯名Go是日語的發音譯來的,圍棋在日語裡寫成「碁」(即GO的發音),把圍棋譯成Go或者The game of go大概是最蹩腳的翻譯了,尤其是在網際網路時代,把圍棋譯成Go非常不利於圍棋的推廣,但AlphaGo的出現或能改變這個事實。

棋類遊戲是人類智能的挑戰,自然也成了人工智慧的標誌之一。而圍棋一直被認為是人工智慧領域裡的非常困難的挑戰。二戰還沒結束,圖靈就研究計算機下棋,他1947年編了第一個西洋棋下棋程序,但直到1968年,最早的電腦圍棋程序才被編寫出來。它是由阿爾伯特·索伯特開發的,引入了一個評估函數對棋局進行分析,來估算雙方佔空的大小。然而,在相當長的一段時間裡,業界的普遍觀點是電腦圍棋只能達到業餘棋手的水準。

陳志行

真正意義上的第一代圍棋AI(人工智慧)——「手談」,是由已故中山大學化學系教授陳志行研發的圍棋程序,從1993年到2002年共10次獲得電腦圍棋世界冠軍,而「手談」這個名字也是圍棋除「弈」之外的別稱。

陳志行教授原本研究的是量子化學,但同時也是圍棋業餘高手。在1991年退休後,他才開始潛心研發電腦圍棋軟體,雖然當時的電腦軟體技術水平還非常低,而圍棋棋盤大(19*19,一共有361點),空間狀態多,打劫、終局規則複雜,一般程式設計師至少需要設計一兩年才可能讓電腦學會下圍棋。但量子化學專業出身的陳志行,使用速度快但不太常用的彙編程序語言搭建圍棋框架和編寫圍棋對弈引擎,他潛心編寫的「Alpha-Beta搜尋引擎」速度非常快,在當時領先其他同行幾個數量級,達到了13層搜索深度,也就是說「手談」可以算清後面的13步棋,而其他程序通常只能算七八步。陳志行編寫的「模式識別」專家系統在當時也是無人能及。

陳志行潛心研發「手談」3年後,終於在世界比賽中斬獲首個圍棋人工智慧世界冠軍。當時的「手談」以戰鬥力超強著稱,智能水平遙遙領先國際同行。之後「手談」對弈水平不斷進步,在國際性的電腦圍棋對弈比賽上連續奪冠,奪得了該時期大部分世界比賽的冠軍。

當時個人電腦系統剛在世界範圍內普及,許多圍棋愛好者還專門購買電腦安裝「手談」軟體,用作學習圍棋和訓練的工具,「手談」軟體在世界範圍內銷售量排名第一。可以說,「手談」軟體的成功在國內掀起了一波圍棋人工智慧研究的熱潮。

「蒙特卡洛樹」算法開啟
二代圍棋人工智慧

當如IBM深藍那樣的超級電腦,已經能夠擊敗世界上最好的西洋棋棋手時,圍棋軟體卻仍然無法擊敗業餘圍棋高手。

但是,從2006年開始,隨著應用蒙特卡洛方法的樹搜索即蒙特卡洛樹搜索和機器學習在圍棋上的應用,電腦圍棋水平有了突飛猛進的增長,棋力普遍提升到業餘高段的水準。

圍棋的棋子多,組合可能性也多。蒙特卡洛算法是一種基於「隨機數」的計算方法,這一方法源於美國在二戰中研製原子彈的「曼哈頓計劃」。頻率決定概率,圍棋對弈軟體將最常見的對弈定式及棋形輸入其中,從而達到較短時間提高棋力的功效。用通俗的語言解釋這種算法:「簡單來說,人腦下圍棋靠的是邏輯思維,而蒙特卡洛算法就是一個抽樣調查的方法。其實就是一個賭博概率式的方法,如果電腦下100盤棋,用這種下法贏了60盤,用另一種下法只贏了50盤,那麼,它就會認定第一種下法,而淘汰另一種下法。」

蒙特卡洛樹搜索算法的出現,可以看作是人工智慧取得突破性進展的標誌:計算機的思考方式,已經有點接近人類的思維方式了。目前使用蒙特卡洛樹搜索的圍棋對弈軟體有瘋石圍棋(CrazyStone)、銀星圍棋(SilverStar)、天頂圍棋(ZEN)等,都取得了不錯的成績。

2011年8月歐洲圍棋大會,電腦圍棋軟體ZEN在19路盤上被讓五子擊敗日本職業棋手林耕三六段。2012年3月,ZEN被讓四子擊敗了日本超一流棋手武宮正樹九段,這是圍棋程序首次在被讓四子的情況下戰勝第一流職業選手。2013年,CrazyStone被讓四子擊敗日本石田芳夫九段,2014年,CrazyStone被讓四子擊敗日本依田紀基九段。可見圍棋軟體進步迅速,至少比起十年前對弈水平已經提高一大截,受讓四子優勢明顯。

2015年10月,同樣基於蒙特卡洛樹搜索的Google旗下人工智慧公司DeepMind開發的AlphaGo,在沒有任何讓子的情況下,以五戰全勝的成績擊敗了歐洲圍棋冠軍:職業圍棋二段樊麾,這也是電腦圍棋程序首次擊敗圍棋職業棋手,當然也意味著圍棋AI新時代的來臨。

AlphaGo、絕藝
以及人機協作

圍棋AI之難,難在這項運動本身的多重複雜性——「最簡單的規則,最複雜的變化」。在AlphaGo及其開發團隊DeepMind出現之前,幾乎所有研究者都認為在十年內人工智慧戰勝圍棋大師的機會是渺茫的。而在它出現以後,幾乎所有人都在驚呼人工智慧已破解了圍棋這一歷史難題,甚至在極短的時間內兩次讓研究成果上了《自然》雜誌的封面。

據AlphaGo官方介紹,AlphaGo採用了一種更加「通用」的人工智慧方法,即採用將改進的蒙特卡洛決策樹算法與深度神經網絡算法相結合的方法構建最終的學習系統。其包括兩個部分:策略網絡與價值網絡。策略網絡在當前給定的棋局中,負責預測下一步的走棋,並對下一步走棋的好壞進行打分,策略網絡的作用好比「模仿」人類棋手的各種走法,以達到預測的效果。然而僅憑模仿無法擊敗最頂級的人類高手,AlphaGo又增加了價值網絡來判斷當前的局面,到底對哪一方有利,但圍棋程序的局勢評估相當困難,只能通過深度學習網絡之間自我訓練的方法來達到良好的效果。

2016年3月,AlphaGo以4:1戰勝世界圍棋名將李世石,AlphaGo的實力首次被世人真正認可。AlphaGo 2.0版本的升級亮點是——摒棄人類棋譜,即僅通過監督學習和強化學習,再度進化出新的「圍棋機器人」。

事實上,除了AlphaGo,現在還有其他圍棋AI程序也已被證明達到甚至超過了人類棋手的一流水平,比如騰訊AI Lab(騰訊人工智慧實驗室)研發的圍棋人工智慧程序「絕藝」(Fine Art),它在今年首次參加UEC杯計算機圍棋大賽,就以11連勝奪得了本屆UEC杯冠軍,在隨後的人機大戰後完勝日本先鋒棋手一力遼。

AI作為工具,被人類棋手「餵招」不斷進化後,它也能「反哺」人類,棋手使用圍棋AI開展人機協同,AI為人類棋手「蓄力」,1+1>2的進化成為了新看點。隨著數據量的高速增長,AI可以分析總結、自我學習,人則可以通過善用AI、人機協作,開啟智慧時代,改變現在以及未來一切。

姜姝姝 作者為《機器人產業》雜誌副總編

(原標題:圍棋人機對弈的五十年)

來源:微信公眾號 猜你會好奇

相關焦點

  • 柯潔對戰阿爾法狗首場1/4子告負 稱「阿爾法狗越來越像圍棋上帝」
    在剛剛結束的柯潔對戰阿爾法狗(Alphago)比賽中,柯潔以1/4子負於對方,在雙方的三番棋大戰中暫時0-1落後。按照中國圍棋規則,1/4子已經是最小的差距。另外在賽後的採訪中,柯潔認為,Alphago已經接近圍棋上帝。
  • 柯潔對戰阿爾法狗什麼時候?柯潔vsAlphaGo圍棋比賽日期時間
    柯潔對戰阿爾法狗時間什麼時候?相信很多棋友對於這場經常對弈很期待,下文帶來阿爾法狗vs柯潔日期介紹,一起和小編來了解下吧!  柯潔 vs AlphaGo圍棋比賽日期時間介紹:  這場被認為是「人類頂尖棋手與人工智慧程序的終極對抗」,讓人們期待了足足一年有餘。
  • 騰訊絕藝對戰谷歌阿爾法狗,中美人工智慧的對弈
    打開APP 騰訊絕藝對戰谷歌阿爾法狗,中美人工智慧的對弈 發表於 2018-01-26 13:55:13 至此,谷歌開始大肆收購人工智慧創新性公司,包括橫掃圍棋界的阿爾法狗(AlphaGo),這個AI系統由DeepMind締造,是谷歌於2014年花4億美元天價收歸麾下,在2016年阿爾法狗對戰李世石後成名,一躍成為AI 技術最強的團隊。隨後升級版在圍棋網站上以神秘身份「Master」 ,以60勝0負1和橫掃中日韓圍棋高手,並擊敗了圍棋冠軍柯潔,落敗後的柯潔聲稱與人工智慧下棋太痛苦。
  • 圍棋人機大戰第二季4月烏鎮開打,中國柯潔將挑戰阿爾法狗
    圍棋人機大戰第二季4月烏鎮開打,中國柯潔將挑戰阿爾法狗 自去年李世石挑戰阿爾法狗失敗後,人類一直期待當今圍棋第一人柯潔與阿爾法狗進行一場終極較量。
  • 人機對弈戰事再起!這次柯潔能獲勝?人工智慧還是阿爾法狗三代?
    不知道各位還記不記得在2017年的人機對決?當時的主角就是現如今的圍棋七冠王柯潔,同他對戰的就是人工智慧阿爾法狗。當時一共比賽三盤,但是柯潔沒有一局獲勝,賽後接受採訪,柯潔表示對其心服口服,但事實上真的如此嗎?如今「人狗大戰2.0」戰事或將再起,究竟是怎麼一回事?
  • 【AlphaGo2.0烏鎮首局擊敗柯潔】人機最偉大對弈剖解,超級AI阿老師將圍棋3維化
    【新智元發自中國烏鎮】在圍棋峰會開幕式致辭中,DeepMind CEO Demis 表示,樊麾已經成為 AlphaGo 開發團隊中的一位重要成員。柯潔與 AlphaGo 對戰將以全新並且激動人心的方式共同探索圍棋的奧秘。Demis 還說,圍棋不止是一種遊戲,是一種藝術。這場比賽也不止是一場比賽,有些東西是專門設計來探索這個世界上最複雜而美麗的棋盤遊戲——圍棋的真理(perfection & truth),這是人類自己單獨下棋再下 1 萬年也無法實現的。Demis 表示,這場比賽將檢測計算機能否展現出創造力和直覺。
  • 比不過阿爾法狗, 為什麼還要學圍棋?
    2017年5月27日,中國烏鎮,棋盤一端是柯潔,另一端是阿爾法狗(AlphaGo)。聚光燈下,意料之中,柯潔零比三輸掉了這場人機對弈。   可曾記得二十二年前,還是人機對戰,同樣地,人類輸。1997年,棋王加裡·卡斯帕羅夫與電腦程式「深藍」對弈西洋棋,最終棋王以2.5:3.5(1勝2負3平)的戰績輸掉了比賽。   圍棋的複雜性要遠大於西洋棋,也曾被認為是人類最後的智慧堡壘,現在卻因人工智慧的侵入變得搖搖欲墜。
  • 人工智慧「阿爾法狗」橫掃圍棋高手
    央視網消息:過去一周,一個註冊名為「大師」的神秘網絡棋手一路擊敗數十位圍棋高手,實現了快棋戰的60場不敗。這個「大師」就是去年「人機大戰」當中擊敗韓國棋手李世石的人工智慧程序「阿爾法狗」。去年12月29號上線後,「大師」在短短一周裡連續擊敗目前世界排名第一的柯潔、韓國目前第一人樸廷桓等多位擁有世界冠軍頭銜的棋手。「棋聖」聶衛平也 輸給了「大師」。4號,「大師」終於透露,自己正是「阿爾法狗」的最新版本,代為落子的則是「阿爾法狗」團隊的黃士傑博士。當天與中國棋手古力的一盤棋是本次網絡公測的最後一戰。結果古力告負,「大師」實現了60場不敗。
  • 柯潔5月對戰阿爾法狗,誰將棋開得勝?
    4月10日下午,中國圍棋協會、浙江省體育局和谷歌(Google)在京共同宣布,三方將聯合主辦「中國烏鎮·圍棋峰會」,屆時人工智慧圍棋程序AlphaGo將與包括柯潔在內的最頂尖的人類棋手進行對弈。
  • AI橫掃圍棋,期待上演騰訊絕藝對弈谷歌,看誰更強?
    至此,谷歌開始大肆收購人工智慧創新性公司,包括橫掃圍棋界的阿爾法狗(AlphaGo),這個AI系統由DeepMind締造,是谷歌於2014年花4億美元天價收歸麾下,在2016年阿爾法狗對戰李世石後成名,一躍成為AI 技術最強的團隊。
  • 柯潔vs阿爾法狗結果:2017alphago對陣柯潔誰贏了(最新)
    柯潔vs阿爾法狗結果:2017alphago對陣柯潔誰贏了(最新)  4月10日報導,Google在中國棋院召開發布會,宣布5月23日-27日在烏鎮主辦「中國烏鎮·圍棋峰會」,去年戰勝韓國職業棋手李世石的圍棋人工智慧AlphaGo將挑戰目前世界排名第一的柯潔九段。
  • 圍棋人機大戰第二季柯潔VS阿爾法狗AlphaGo比賽時間地點
    4月10日,谷歌在中國棋院召開發布會,宣布5月23日-27日在烏鎮主辦「中國烏鎮o圍棋峰會」,屆時AlphaGo將再度與柯潔等為代表的中國頂尖棋手進行為期對弈。  AlphaGo是一款圍棋人工智慧程序,由谷歌旗下DeepMind公司的戴密斯o哈薩比斯、大衛o席爾瓦、黃士傑與他們的團隊開發。
  • 「阿爾法狗」圍棋對戰勝55局?誰是這場營銷的贏家?
    人機圍棋比賽獲得全民關注,這不是第一次,但不得不承認,這是持續時間最長的一次,從2016到2017,居然凌駕其他熱點順利跨年了。 2016年底的最後幾天,圍棋世界裡出現了一個專門向高手約戰的「怪物」。
  • 「零」一出手天下無敵 阿爾法狗四個版本回顧
    更為厲害的是,隨著訓練的深入,阿爾法零還獨立發現了遊戲規則,並走出了新策略,為圍棋這項古老遊戲帶來了新的見解。 棋手感嘆,20年抵不過3天 阿爾法零橫空出世的消息迅速點燃了圍棋界,和阿爾法狗交手的中國棋手柯潔在微博感嘆:「對於阿爾法狗的自我進步來講……人類太多餘了」。
  • 創始人宣布阿爾法狗「退役」:50份自我對戰棋譜獻給人類
    圍棋人機終極大戰柯潔全場被壓制,無奈「安樂死」【點擊圖片查看詳情】 5月27日,升級後的AlphaGo所向披靡,最終以3:0贏下了這次烏鎮人機大戰。這也將是人機大戰的最後3局比賽了。
  • 圍棋人機大戰柯潔哭了 機器卻沒有笑
    新華社發  浙江在線5月28日訊(浙江在線記者 張峰)5月27日,人機大戰的最後一局在烏鎮開始,要求再次執白的柯潔沒有創造奇蹟,在行棋至209手時,柯潔將兩顆棋子擺上棋盤,向裁判表示投子認輸。至此,人機大戰第二季以柯潔0:3被人工智慧AlphaGo橫掃告終。
  • 阿爾法狗團隊宣布「阿狗」退役 獻50份自我對戰棋譜給人類
    據澎湃新聞5月27日報導,當天,升級後的AlphaGo所向披靡,最終以3:0贏下了這次烏鎮人機大戰。這也將是人機大戰的最後3局比賽了。 ,是AlphaGo作為一個競賽系統能夠對弈的最高級別對手。因此,本次中國烏鎮圍棋峰會是AlphaGo參加的最後對弈比賽。」 不過,哈薩比斯宣布,人類棋手與AlphaGo的故事並不會就此結束。AlphaGo的啟蒙老師、歐洲圍棋冠軍樊麾隨後表示:「AlphaGo團隊將與柯潔合作,對此次的棋局進行分析,根據AlphaGo內部的數據,與柯潔研究此次的對局,展現比賽的過程並做成視頻,與全世界的圍棋愛好者共同分享。
  • 柯潔暗藏絕招應對「阿爾法狗」
    《全體育》供圖     圍棋人機大戰再度上演□本報記者 錢晞  4月10日,中國棋院舉行新聞發布會宣布:中國棋手柯潔九段將與圍棋人工智慧程序AlphaGo(直譯為阿爾法狗)於5月23日至27日在浙江烏鎮展開三番棋對決,勝者獎金高達150萬美元。
  • 柯潔對戰阿爾法狗人機大戰第三局棋譜圖文講解完整版
    柯潔對戰阿爾法狗人機大戰第一局雖然只輸了半目,卻全盤無勝機;第二局雖然死了大龍,但卻長時間保持僵持狀態。究其原因,是第一局柯潔過於刻意,非要走三-三、點三-三,結果點完三-三就處於劣勢了,一直到終局都沒有翻身的機會。第二局回歸自然,結果前半盤一直是「緊棋」。
  • 李世石退役,真的是因為走不出輸給阿爾法狗的陰影?
    2016年,李世石與谷歌圍棋AI程序AlphaGo(阿爾法狗)進行人機大戰,以1比4告負,成為第一個被阿爾法狗擊敗的人類圍棋世界冠軍。 「就算我排名第一,也會有臺電腦是無法被擊敗的。隨著AI在圍棋比賽的登場,我意識到就算通過努力成為第一名,我也不會是最頂尖的……」李世石說。