阿爾法狗閉關5月後歸來秒殺所有人類棋手,下個對手是誰?

2020-12-03 AI財經社

文| AI財經社 王鴻宇

編|楊舒芳

10月19日,谷歌旗下的DeepMind團隊公布了進化後的最強版「阿爾法狗」 ,代號AlphaGo Zero。DeepMind聯合創始人兼CEO 、阿爾法狗之父戴密斯·哈薩比斯稱,「升級後的阿爾法狗更為強大,可以一爭史上最強圍棋手。」

阿爾法狗上一次出現在公眾視野中,還是今年5月在浙江烏鎮圍棋峰會的現場。阿爾法狗直落三盤戰勝世界排名第一的中國棋手柯潔,這位年僅20歲的天才少年曾被認為是狙擊阿爾法狗的唯一可能。

「我輸得沒什麼脾氣。」在賽後新聞發布會上,柯潔說,「AlphaGo跟去年比完全是兩個『人』,第一次時很接近人,現在越來越像上帝了。」

就連戴密斯·哈薩比斯都沒有想到阿法爾狗能達到這樣的高度,「寫出圍棋的評估函數是一件不可能的事情」。因為更多時候,圍棋與棋手的一些類似於「直覺」的東西有關,「圍棋遊戲更像是藝術,而非科學」。

不少網友嘲笑柯潔,因為他曾經此前說過「阿爾法狗能贏下李世石,但是未必能贏我」,「和阿爾法狗下棋,我的勝率在六成」類似的話語。但在與阿爾法狗戰敗後,柯潔豪取22連勝,大家才意識到不是柯潔說大話,而是阿爾法狗太強了。

第一次升級後,就未嘗敗績

正如柯潔所言,阿爾法狗的確換了一個「人」——系統升級後,AlphaGoLee變成了AlphaGoMaster。

在野狐圍棋網橫掃中日韓多位人類圍棋高手後,它取得了60勝0負1平的恐怖戰績。其中的1平,還是因為在與陳耀燁的快棋賽中,陳耀燁意外掉線,系統自動判和。

2016年3月,AlphaGoLee以4:1的比分了戰勝韓國名將李世石九段,引發了圍棋圈的震驚。此前,阿爾法狗的成名戰是5:0戰勝歐洲冠軍、法國國家隊主教練樊麾,但當時,樊麾和外界都認為阿爾法狗並沒有那麼強,至少他是有機會拿下一盤的。

「圍棋有很多不確定的因素,機器的局限性是很多的,在下棋過程中也會出現漏洞,因此之前觀看阿爾法狗跟樊麾的比賽,讓我以為計算機達不到圍棋選手的最高水平。結果大家都知道,我輸了。」慘敗讓李世石改變了他對阿爾法狗的看法。

《南方周末》的報導中提到:阿爾法狗對陣樊麾時,「吃過」的棋譜是3000萬個,但到了挑戰世界棋壇16冠王李世石的時候,嚼進肚子裡的棋譜已經達到1億。

「吃棋譜」正是AlphaGo的主要訓練模式之一,開發者能做的就是儘可能多地把棋譜塞給程序。

此外,Deep Mind團隊在AlphaGo程序中加入了「策略網絡」和「值網絡」的技術。所謂策略網絡,是指程序在吃下過億棋譜後,能夠分析出下一步棋在不同下法時得出的不同勝率。值網絡則是對盤面優勢的判斷機制,以便及時止損和改變下法。

學習3天打之前版本,比分高達100比0

在輸給阿爾法狗後,柯潔豪取22場連勝,拿下全運會圍棋比賽冠軍。但再次升級的阿法爾狗,已經不需要柯潔的棋譜了。

根據《自然》雜誌的最新介紹,Alpha Zero的設計理念和系統配置和Lee/Master完全不同。

此前,Lee/Master都是用上千盤人類業餘和專業棋手的棋譜進行訓練,而升級後的阿爾法狗不依託於人類的先驗成果,不靠「吃棋譜」進步,完全靠自我對弈學習下棋。

AlphaGo Zero之所以能當自己的老師,是用了一種叫強化學習的新模式。系統從一個對圍棋一無所知的神經網絡開始,將該神經網絡和一個強力搜索算法結合,自我對弈。在對弈過程中,神經網絡不斷調整、升級,預測每一步落子和最終的勝率。

僅僅經過3天的訓練,這套系統已經可以擊敗AlphaGoLee,也就是去年擊敗韓國頂尖棋手李世石的那套系統,而且比分高達100比0。

40天訓練後,AlphaGo Zero總計運行了大約2900萬次自我對弈,使得AlphaGoZero得以擊敗AlphaGoMaster,比分為89比11。

在系統配置方面,AlphaGoZero也比前幾代系統更加節能,AlphaGoLee需要使用幾臺機器和48個谷歌TPU機器學習加速晶片,AlphaGoZero只需要使用一臺配有4個TPU的機器即可。

阿爾法狗贏了李世石後,哈薩比斯說,「阿爾法狗從來都不是我們的唯一,甚至不是我們最重要的研發,我們希望將此應用於更大的真實世界的問題。」升級過後融入了Deep Mind最新技術的新阿爾法狗,目標已經不再只是打敗人類棋手,而是將目光轉向了實際應用方面。

相關焦點

  • 「阿爾法狗」5月戰中國棋手!人類或可得勝利
    柯潔資料圖據新華社等多家媒體報導,圍棋人工智慧程序「阿爾法狗」(AlphaGo,直譯阿爾法圍棋)將於今年5月下旬在浙江烏鎮與包括柯潔在內的中國頂尖棋手進行對決。有了官媒的確切消息,這一沸沸揚揚炒了大半年的賽事終於可以確定了。
  • 別了,人類對手!中國圍棋人工智慧要「逼出」阿爾法狗
    我們是人類,人類會犯錯誤兩年前的絕藝還只是業餘五段的水平,如今古力已用「不可思議」來解說昔日對手的戰術了。就在4個月前,古力在個人微博上曬出「絕藝正式成為中國國家圍棋隊訓練專用AI」畫面,並配文「國家隊的訓練方式跟上了時代步伐」,而此前的中國國家隊並沒有專用AI。
  • 柯潔5月對戰阿爾法狗,誰將棋開得勝?
    4月10日下午,中國圍棋協會、浙江省體育局和谷歌(Google)在京共同宣布,三方將聯合主辦「中國烏鎮·圍棋峰會」,屆時人工智慧圍棋程序AlphaGo將與包括柯潔在內的最頂尖的人類棋手進行對弈。
  • 阿爾法狗2017年復出 棋力大增欲再演人機大戰
    新華社北京11月7日體育專電(記者王恆志)AlphaGo(阿爾法狗)團隊成員、歐洲圍棋冠軍樊麾7日通過社交媒體表示,「阿爾法狗」的棋力在過去半年裡有巨大的進步,預計將在2017年初復出下棋,該團隊近期會公布更多訊息。
  • 聶衛平稱許多棋手不理解卻學阿爾法狗,結果下得臭極了
    >人工智慧超越頂尖高手是好事 人工智慧是目前圍棋界的熱點話題,谷歌開發的「阿爾法狗」目前一騎絕塵,而第二梯隊的幾個軟體,包括騰訊的「絕藝」和日本的「深禪」,還有最近水平突飛猛進的中國臺北的一個軟體,它們還未能百分百贏人類頂尖高手,離「阿爾法狗」的水平很遠。
  • 前世界冠軍棋手李世石退役,是因為走不出輸給阿爾法狗的陰影?
    2015年10月,阿爾法狗和樊麾對戰,以5比0的戰績戰勝樊麾,這是有史以來AI程序第一次在不讓子的情況下,擊敗人類職業圍棋高手,而這原本被認為是人工智慧在10年後才能達到的成就。「我們選擇了李世石,因為我們想找一名兼具傳奇和歷史的棋手,找一個在過去十年被公認為最強棋手的人。選擇李世石進行對戰,對於人工智慧領域和圍棋世界來說都是一個重大的時刻,此前阿爾法狗已經攻克了給它的所有挑戰,但要等它跟李世石這樣的世界頂尖棋手對弈後,大家才能知道阿爾法狗的真正實力。」哈薩比斯曾說過選擇李世石的原因。
  • 中國絕藝要「逼出」阿爾法狗
    我們是人類,人類會犯錯誤兩年前的絕藝還只是業餘五段的水平,如今古力已用「不可思議」來解說昔日對手的戰術了。就在4個月前,古力在個人微博上曬出「絕藝正式成為中國國家圍棋隊訓練專用AI」畫面,並配文「國家隊的訓練方式跟上了時代步伐」,而此前的中國國家隊並沒有專用AI。
  • 「阿爾法狗」化名Master對戰人類高手 59勝1和震撼棋壇
    1月4日下午1點多,一場關注度空前的圍棋比賽在野狐網上展開,64歲的聶衛平對陣Master,「棋聖」最終以7目半的較大劣勢落敗。聶老是近一周內,又一位被Master斬落馬下的職業棋手。
  • 柯潔暗藏絕招應對「阿爾法狗」
    上一次,「阿爾法狗」擊敗了韓國名將李世石;這一次,頂尖棋手柯潔能否為人類挽回一城呢?人機大戰第二季敲定  去年3月,李世石和「阿爾法狗」的人機大戰震動全球,而李世石最終告負使人們意識到,不斷迭代的人工智慧程序,已經開始強勢挑戰人類引以為豪的智力遊戲了。
  • Master挑戰人類高手60連勝 承認是阿爾法狗
    李世石這位曾經的人類最強圍棋選手在5場對弈中只贏下了一場,最終以1:4的大比分敗給了人工智慧。  在比賽之前,大多數人還是看好李世石,畢竟他是這個星球上最會下圍棋的人之一。然而比賽結果讓人大跌眼鏡。當時就有人驚呼:在圍棋這個項目上,人工智慧要全面碾壓人類了。  不過,仍然有人不服氣。  最不服氣的就是世界排名第一的中國棋手———柯潔。
  • 「阿爾法狗」圍棋對戰勝55局?誰是這場營銷的贏家?
    延續1個多小時的圍棋對戰,在神秘帳號Master的一句「謝謝聶老師」中結束,今天下午,中國「棋聖」聶衛平也未能在對戰中阻止Master連勝的腳步。 與的聶老的這一戰後,Master單挑世界知名的棋手,拿下了全勝紀錄(55勝1平,平局是對方選手斷線,系統判定為和棋),並且還在繼續挑戰,儼然一副「孤獨求敗」的模樣。
  • 職業生涯奪得過14個世界冠軍 迄今唯一戰勝過「阿爾法狗」的人...
    」,宣布退役,今年36歲的他結束了在韓國棋院24年零7個月的職業圍棋生涯。14個世界冠軍,奪冠次數僅次於李昌鎬;中國棋手古力「一生之敵」,目前唯一戰勝過「阿爾法狗」的棋手……只是,棋壇再無「小李飛刀」了。奪冠次數僅次於李昌鎬1995年7月,李世石入段,2003年他成為韓國棋院的一名九段棋手。2000年12月,連續奪得天元戰和倍達王戰冠軍,是他稱霸韓國棋壇的開始。
  • 天元賽棋手布局遭網友吐槽,人工智慧讓圍棋失去精彩?
    2016年3月,阿爾法狗(AlphaGo)與李世石九段進行了圍棋人機大戰,最終阿爾法狗獲勝,成為了第一個戰勝圍棋世界冠軍的人工智慧機器人。一年後之後,擁有「深度學習」能力的阿爾法狗在完勝柯潔,人類遭遇完全「碾壓」……如今,阿爾法狗早已退出了棋壇,但人工智慧已經滲透進了圍棋世界。
  • 「零」一出手天下無敵 阿爾法狗四個版本回顧
    AlphaGo(阿爾法狗)的故事在烏鎮以失敗告終;昨日,阿爾法狗重出江湖,不過,它不是與人對弈,而是「講述」自我學習,左右互搏,3天自學成材,擊敗了此前所有版本的阿爾法狗的故事,它的名字叫 AlphaGoZero(暫譯:阿爾法零)。
  • 柯潔vs阿爾法狗結果:2017alphago對陣柯潔誰贏了(最新)
    柯潔vs阿爾法狗結果:2017alphago對陣柯潔誰贏了(最新)  4月10日報導,Google在中國棋院召開發布會,宣布5月23日-27日在烏鎮主辦「中國烏鎮·圍棋峰會」,去年戰勝韓國職業棋手李世石的圍棋人工智慧AlphaGo將挑戰目前世界排名第一的柯潔九段。
  • 創始人宣布阿爾法狗「退役」:50份自我對戰棋譜獻給人類
    圍棋人機終極大戰柯潔全場被壓制,無奈「安樂死」【點擊圖片查看詳情】 5月27日,升級後的AlphaGo所向披靡,最終以3:0贏下了這次烏鎮人機大戰。這也將是人機大戰的最後3局比賽了。
  • 揚大版「阿爾法狗」誕生 跟它下象棋會是啥感覺?
    揚大版「阿爾法狗」誕生啦跟它下盤象棋,會是啥感覺?&nbsp&nbsp&nbsp&nbsp去年,圍棋人工智慧程序「阿爾法狗」以4:1戰勝了韓國名將李世石九段,讓人機圍棋世紀之戰轟動一時,一時間,人工智慧成為人類關注重點。
  • 阿爾法狗圍棋戰勝柯潔後,並沒有善罷甘休,已確認進軍各大行業!
    但其實人工智慧早在1956年已經被提出,而當人們正在意識到受到人工智慧的威脅則是從阿爾法狗戰勝圍棋天才柯潔開始。一位一年獲得過3次圍棋世界冠軍的95後。那麼,阿爾法狗真的這麼厲害嗎?阿爾法狗確實非常厲害,它有「2個大腦」,一個用來下棋,一個則是用來上網分析對弈的數據。
  • 如果阿爾法狗是傳說中的範洪,那人類已試不出它的真實水平
    無論對手有國手之名還是才止登堂入室,無論是王孫貴胄還是茶樓棋客,範洪都只勝半子。當然,今天關於古代棋手生平的記載,都有誇大成分。如果關於範洪的記載毫無水分,只能說範洪高出同輩棋手太多,以至於任何人都無法挑戰範洪對棋局的控制力。不多不少,只贏你半個子,不僅給你留足了顏面,更讓人感到絕望——沒有誰可以摸到範洪棋藝的邊。
  • 阿爾法狗團隊宣布「阿狗」退役 獻50份自我對戰棋譜給人類
    據澎湃新聞5月27日報導,當天,升級後的AlphaGo所向披靡,最終以3:0贏下了這次烏鎮人機大戰。這也將是人機大戰的最後3局比賽了。 圖片來源:澎湃新聞 在最後一局比賽結束後的發布會上,AlphaGo之父、DeepMind創始人戴密斯·哈薩比斯(Demis Hassabis)說:「本周的比賽聚集了圍棋起源地最優秀的棋手參與