騰訊「絕藝」全勝戰績奪世界圍棋AI冠軍,曾對柯潔13連勝

2020-12-15 澎湃新聞

3月19日,第10屆日本UEC杯計算機圍棋大賽在日本東京都日本電氣通信大學(UEC)落幕,騰訊人工智慧實驗室(騰訊AI Lab)研發的圍棋人工智慧程序「絕藝」(英文名:FineArt) 在最終的決賽中,戰勝了日本「棋手」DeepZenGO,以11戰全勝戰績獲得這次比賽冠軍。

「絕藝」戰勝DeepZenGO

UEC杯始創於2007年,與普通圍棋賽不同,參賽選手不是人類,而是人工智慧,每年在日本舉行,是最具傳統和權威的計算機圍棋大賽。UEC杯每年邀請各國高水平AI齊聚東京比賽,促進相關學術及科技的交流。日本的DeepZenGo、法國的「瘋石」(Crazy Stone)、美國Facebook公司的「黑暗森林」(Dark Forest)等著名計算機圍棋程序曾先後在UEC杯折桂獲獎。

比賽現場

說到圍棋AI比賽,必定繞不開曾戰勝過人類棋手李世石的AlphaGo。不過,據澎湃新聞了解,此次DeepMind公司的AlphaGo團隊與去年一樣,並未選擇參賽。

「絕藝」背後的人工智慧

據騰訊介紹,「絕藝」的名字取自唐代詩人杜牧的送別詩《重送絕句》:「絕藝如君天下少,閒人似我世間無。別後竹窗風雪夜,一燈明暗覆吳圖。」為了開發圍棋人工智慧,騰訊人工智慧實驗室組建了一支13人的團隊,花了近一年的時間打造「絕藝」。

「絕藝」現場比賽圖

「很高興絕藝能夠在UEC杯奪冠,這是非常難得的寶貴經驗。絕藝不同於其他實驗室AI,它得益於世界超一流棋手的指導,通過不斷與高手交流及學習,一步步成長起來。我們希望,通過絕藝能夠讓更多人關注、喜愛進而傳承圍棋這一傳統文化。」騰訊公司副總裁、騰訊AI Lab負責人姚星在賽後接受媒體採訪時說。

騰訊AI Lab負責人姚星在賽後接受媒體採訪

「絕藝」的研發始於2016年1月。當時姚星在騰訊內部給工程師發了一條消息:有沒有信心做圍棋AI,如果圍棋不行,先做象棋AI也行。

隨後,騰訊人工智慧實驗室高級總監、專家工程師劉永升經過調研,在2016年3月做出了第一個DEMO(測試版)。到2016年3月下旬,騰訊內部圍棋AI正式立項,項目名稱weigo。不過那時,AlphaGo已經以4:1的成績戰勝了韓國棋手李世石。

關於AlphaGo背後的算法,Facebook「黑暗森林」圍棋軟體的開發者田淵棟曾介紹過,AlphaGo這個系統主要由四個部分組成:一是走棋網絡,給定當前局面,預測/採樣下一步的走棋;二是快速走子,目標和第一步一樣,但在適當犧牲走棋質量的條件下,速度要比第一步快1000倍;三是估值網絡,給定當前局面,估計是白勝還是黑勝;四是蒙特卡洛樹搜索,研發者將遊戲中所有的可能性表示成一棵樹,樹的第N層就代表著遊戲中的第N步。樹的node(節點)數是隨著樹的深度成指數增長的,不考慮剪枝,每個node都需要進行估值。把以上這4個部分連起來,形成一個完整的系統。

AlphaGo之後,Crazy Stone、DeepZenGo等紛紛在自己的程序中加入了深度學習模塊。騰訊推出的「絕藝」也採用了相似的策略。據騰訊官方介紹,「絕藝」的算法基於策略網絡與價值網絡兩大核心,並提升了價值網絡的精度。

除了背後算法相似外,「絕藝」也採取了AlphaGo曾經使用的訓練策略,即學習了大量的人類棋譜,又進行了自我博弈學習,以及通過與人類選手對戰,增加自己的「戰鬥經驗值」。

2016年11月,「絕藝」正式登錄騰訊圍棋(野狐圍棋)平臺,在與多名人類一線頂尖棋手過招後,絕藝曾閉關過一段時間,在大幅度提升了價值網絡的精度後,一度以刑天的ID再度亮相。

「絕藝」在騰訊圍棋平臺上的戰績。 騰訊 圖

根據騰訊圍棋(野狐圍棋)提供的數據,截至2017年3月9日,「絕藝」與柯潔、古力、聶衛平、範廷鈺、時越、井山裕太、樸廷桓、元晟溱等共計超過100位知名人類棋手有過交鋒,在509局對局中「絕藝」388勝121負,勝率達76.23%。「絕藝」執白的對局有259局,其勝率達到71.43%,「絕藝」執黑的對局有250局,其勝率達81.2%。

具體到個人對弈結果,「絕藝」與柯潔對弈21局,「絕藝」取得16勝5負的戰績。其中柯潔曾拿到過4連勝,而「絕藝」則取得過對柯潔的13連勝,其中「絕藝」執白7局取得5局勝利,「絕藝」執黑14場取得11局的勝利。「絕藝」與第18屆農心杯的終結者、中國名將範蘊若共對弈38局,範蘊若勝12局負26局,勝率為31.6%。

「絕藝」與人類棋手的對弈結果。 騰訊 圖

結束UEC杯比賽後,3月26日,「絕藝」還將參加由UEC杯衍生出的「電聖戰」。「電聖戰」是由UEC杯的勝出者,對陣人類頂尖棋手,由日本棋院與電氣通信大學於2013年創辦。屆時,「絕藝」將挑戰日本新銳棋手一力遼。

冠軍背後是計算資源的較量

在今年的UEC杯比賽中,共有30位人工智慧「棋手」參賽。3月18日預賽,採用循環積分賽制,「絕藝」以7局全勝戰績進入16強。3月19日決賽,採用淘汰制,「絕藝」以4連勝的成績戰勝日本DeepZenGo獲冠軍。

「絕藝」預賽戰績

UEC杯比賽用時每方30分鐘,平均下來20秒左右就要落子,因此參賽程序的計算能力對比賽成績有著至關重要的作用。根據賽制,UEC杯對硬體配置沒有強制性要求,比賽時並不是所有的程序都使用統一的硬體配置。雖然要求參賽者必須報告機器功耗,但特別說明功率在1000W以上的,可以通過特別許可參賽。

比賽過程中,各家人工智慧「棋手」通過手裡的筆記本電腦,把比賽數據發送到各自的伺服器計算平臺上進行比賽。有意思的是,因為需要聯網發送數據,在3月18日的比賽過程中,還發生了因為斷網而導致比賽暫停的情況。

UEC杯的快棋賽制其實是對人工智慧「棋手」背後計算資源的考驗。「絕藝」的背後是騰訊,而DeepZenGo由日本公司DWANGO提供背後支持,DWANGO也是日本著名視頻網站NICONICO動畫的母公司。得益於各自團隊的強大支持,「絕藝」和DeepZenGo兩者在預賽中一路過關斬將,並沒有遭遇什麼抵抗就打進了決賽。決賽中兩位對手的交鋒成為此屆比賽的最大看點。

下圍棋並非AlphaGo的最終目的

2016年年初,DeepMind在《自然》雜誌上發表的關於AlphaGo的論文,介紹了圍棋人工智慧背後的算法。此後,許多人工智慧圍棋程序的開發都基於AlphaGo的研究。換句話說,「絕藝」、DeepZenGo等都是去年那個AlphaGo的跟隨者。

不過,現在的AlphaGo已經不再是當初的那個AlphaGo了。從2016年12月29日晚起,升級後的AlphaGo改名為「Master」、接連「踢館」著名在線圍棋網站弈城網和野狐網。截至2017年1月4日,Master斬獲了60連勝,擊敗15位世界冠軍,其中包括中國、韓國、日本各自的「當今第一人」柯潔、樸廷桓和井山裕太。

斬獲60連勝後,DeepMind聯合創始人之一戴密斯·哈撒比斯(Demis Hassabis)更是在推特上激動發聲:「在非正式測試結束後,我們期待在今年安排一些標準時長的正式比賽」。此前有媒體報導,今年4月份,中國棋手柯潔將有機會在烏鎮與AlphaGo進行比賽。

但對於AlphaGo的母公司DeepMind而言,參加圍棋比賽並不是其開發AlphaGo的最終目的。DeepMind公司曾公布過自己2017年的三大目標:實現算法突破,提升社會影響,建立倫理規範。利用AlphaGo背後的算法發掘出可以運用於社會福祉的新科學知識,由此來解決人類的氣候、能源和醫療健康等問題。

(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)

相關焦點

  • Master連虐職業棋手30盤 柯潔:人類全都是錯的
    2016到2017這個跨年夜,是包括柯潔在內的很多圍棋世界冠軍的不眠夜。一個網名ID為「Master」的用戶,在某圍棋網絡對戰平臺上挑戰中韓世界冠軍。在眾人「他是人還是人工智慧」的猜測聲中,「Master」留下超過30盤連勝零負的成績後,絕塵而去。
  • 多了三五根白髮學會自黑 柯潔:替未來人類感知威脅
    幫柯潔九段突圍,工作人員的方式別出心裁,可也符合圍棋的風格:精確計算,又留有餘地。2017年12月26日,20歲零146天的柯潔拿下本年度最後一個世界冠軍「新奧杯」,成為圍棋歷史上最年輕的五冠王。頒獎儀式結束後,棋迷們圍上來以各種組合求合影。柯九段微笑到臉都有點僵了。回房間的路上,贏棋的得意勁兒寫在這位年輕人的臉上。
  • 世界圍棋棋王戰中韓隔空對決 柯潔強勢屠龍昂首晉級
    世界圍棋棋王戰中韓隔空對決 柯潔強勢屠龍昂首晉級 發布時間:2020-06-03 來源:中國體育報 作者:葛會忠/文 楊爍/圖
  • 軟博會之海澱軟體嘉年華 騰訊帶來的「企鵝範兒」
    本屆博覽會上,騰訊公司入駐嘉年華現場,通過主題展位「南極企鵝樂園」向大家全面展示了騰訊業務、文化及發展歷程,通過豐富的體驗與互動,為廣大參與者帶來了科技而有趣的「企鵝範兒」體驗。騰訊北京分公司總經理劉勇詳細介紹了騰訊安全聯合實驗室騰訊反詐騙實驗室、騰訊AI Lab(騰訊人工智慧實驗室)研發的圍棋人工智慧「絕藝」、以及作為小微硬體開放平臺的典型合作案例——騰訊雲聯合數字家圓出品的新一代AI產品「親見H2家庭語音助手」。騰訊展位「南極企鵝樂園」,由登陸碼頭、科考基地、企鵝集市及拍照冰川組成。
  • 2018中國圍棋大事件盤點:輝煌、遺憾與革新
    韓國的三星杯第三次被中國棋手柯潔捧起、剛滿20歲的謝爾豪奪得LG杯成為目前最年輕世界冠軍和九段棋手、第20屆農心杯中國先鋒範廷鈺再創七連勝……我們為這些輝煌戰績歡呼;春蘭杯20年後再度被韓國棋手包攬冠亞、第19屆農心杯中國隊五位世界冠軍出戰卻只有黨毅飛一人贏棋……這些遺憾也讓我們銘記;中國圍棋協會換屆,這屆圍棋協會肩負著協會成立以來最深刻改革的重任,新任主席林建超的專著《圍棋與國家》系列叢書發行……
  • 谷歌AI宣戰柯潔 醉翁之意不在酒?
    摘要:4月10日,谷歌與中國圍棋協會等宣布,今年烏鎮峰會AlphaGo迎戰柯潔九段,柯潔出席發布會。中國人工智慧學會副理事長、清華大學計算機系教授馬少平認為,「AlphaGo採用的是蒙特卡洛樹搜索框架,加上深度學習和深度強化學習。
  • 柯潔:職業棋手與AI的差距沒那麼大 頂多讓三子
    【網易智能訊 1月26日消息】1月24日深夜,圍棋冠軍柯潔在微博上發表文章,談到了職業棋手與人工智慧的差距。柯潔認為,職業棋手與人工智慧的真正差距在於心態,「和人類下棋的時候是英勇無畏的,」柯潔表示,和AI下棋,自己的心態是「棋未先行心態已崩」。柯潔同時表示,如果以一個平和的心態去面對,差距不會有想像中那麼大,差距「絕對不會超過三子」。柯潔表示,希望有AI真的到了AlphGo Zero的水平,可以放下尊嚴去下正式的讓子棋,給愛好者們看看到底又多大差距。
  • 中國創造:全球第1個圍棋10段選手,直逼阿爾法狗。
    2017年全球頂尖高手雲集的圍棋對弈網站上,突然殺出了一位名叫絕藝的黑馬,這位神秘高手接連將柯傑等100多位職業棋手一一擊敗。這個戰績讓絕藝一舉成為全球第1個圍棋10段選手,10段代表著圍棋的最高境界,這位絕藝就像阿爾法狗那樣的人工智慧。
  • 聶衛平:Master顛覆圍棋定式 上帝派來給人類引路
    從去年12月29日出現在網絡圍棋對戰平臺上後,這位用戶名叫「Master」的神秘棋手就展現出了極為強勁的實力——先後在超快棋模式的比賽中,完勝了包括韓國第一人樸廷桓、新科百靈杯冠軍陳耀燁、中國名人戰冠軍連笑,
  • 圍棋界「最強碰撞」昨上演 柯潔屠龍大勝樸廷桓
    當今圍棋界的「最強碰撞」  柯潔屠龍大勝樸廷桓  昨天,第二屆百靈杯世界圍棋公開賽半決賽進行了三番棋的首盤較量,在一場強強對話中,中國小將柯潔屠龍大勝韓國九段樸廷桓,在晉級決賽的道路上佔據了主動。
  • 打敗柯潔的AlphaGo有了繼任者AlphaZero 西洋棋/圍棋/將棋通殺
    AlphaZero 是一款能夠從頭學習圍棋、象棋等棋子遊戲的新型人工智慧平臺。在三款棋類比賽中,AlphaZero獲得三局全勝的結果 。  Stockfish:西洋棋 AI 世界冠軍;elmo:2017 年度世界計算機將棋錦標賽冠軍;AlphaGo:戰勝柯潔的AI高手。
  • Master承認是AlphaGo:真理被顛覆 AI並非神話
    ,從去年12月29日開始,它在幾個知名圍棋對戰平臺上輪番挑戰中日韓圍棋高手,並在1月3日晚間贏了中國頂級圍棋手柯潔,取得了50勝0負的驚人戰績。截止今日(2017年1月4日),Master已經在圍棋對戰平臺現身六天,挑戰了幾十位圍棋頂尖高手,其中包括連續37個月排名韓國等級分第一樸廷桓九段、有「當今世界圍棋第一人」之稱的中國頂級棋手柯潔九段、拿了八次世界冠軍的中國頂級棋手古力、新科百靈杯冠軍陳耀燁九段、2016年三冠王羋昱廷九段等等,Master均獲勝。
  • 柯潔:串燒韓國兩大剋星晉級四強,卻還是輸給了老冤家樸廷桓
    中國隊10人中有柯潔、檀嘯(上屆春蘭杯冠軍)、唐韋星、陳耀燁、辜梓豪、謝爾豪和黨毅飛七位世界冠軍,其中僅有連笑、謝科和彭力堯三位棋手非為世冠,這樣的陣容堪比強大無比。 韓國雲集了樸廷桓、樸永訓(上屆春蘭杯亞軍)、李世石、姜東潤、金志錫和申真諝六員大將。
  • 第21屆農心辛拉麵杯世界圍棋團體錦標賽在京揭幕
    10月15日下午,第21屆農心辛拉麵杯世界圍棋團體錦標賽在北京揭幕。首局較量中,韓國棋手元晟溱擊敗日本棋手村川大介,將在次局比賽中迎來中國隊先鋒楊鼎新的挑戰。擂臺賽制的農心杯,是世界圍棋界水平最高、競爭最激烈的團體賽事。
  • master是什麼意思,為何能改變圍棋的靈魂
    在這個圍棋高手出現的時候,其通過網絡對戰平臺,橫掃世界上的很多圍棋冠軍,成功吸引了世界上人的眼球,因此很多人猜測這個master其實不是一個人,而是和阿帕奇狗一樣的人工智慧,不過在這種對戰之後,人類也開始反思圍棋的精神,因為從雙方的對戰情況來看,master的對戰完全打破了圍棋的對戰形式,本文小編就帶大家來認識一下master的相關信息。
  • 日韓各剩獨苗中國仍坐擁四大王牌 農心杯是世界圍棋格局縮影嗎?
    至此,日本、韓國只剩主將各一人,分別是井山裕太與樸廷桓,而中國隊還有黨毅飛、辜梓豪、時越、柯潔四員大將,奪冠前景仍一片光明。農心杯的特殊之處,就在於他的賽制為團體賽,代表了世界棋壇的縮影,本屆賽事的進程雖有一定偶然性,卻也反映出中日韓三國棋界的現狀。
  • 柯潔2017年收入超420萬 仍穩居國內獎金王寶座
    柯潔獎金收入國內第一騰訊體育訊 北京時間12月26日,柯潔在新奧杯決賽中3-2戰勝彭立堯獲得個人第五個世界冠軍。柯潔本年度只獲得一項世界冠軍頭銜,圍甲戰績也僅為15勝11負,不過柯潔5月參加圍棋人機大戰收入30萬美元,6月柯潔獲得首屆圍棋汽車拉力賽冠軍收入200萬人民幣,這兩個賽事的獎金幾乎與世界大賽持平。柯潔本年度保守估計年收入超過420萬人民幣,依然是國內職業棋手的獎金王。
  • 手握14個世界冠軍,李世石之後再無李世石
    韓國圍棋棋手李世石昨天正式向韓國棋院遞交辭呈,宣布結束長達24年零7個月的職業棋手生涯。李世石是世界頂尖棋手,曾拿到過14個世界冠軍和32個韓國冠軍。2016年與AlphaGo一戰儘管1比4失利,但也拿下人類迄今對AlphaGo的唯一一局勝利。年初,李世石已萌生退意,稱已越來越難戰勝柯潔這樣的年輕棋手。李世石宣布退役。
  • 阿爾法狗改變圍棋,柯潔的霸主地位難做久:應該專心幾年多奪冠了
    知名體育記者賀曉龍發文稱:身為當今棋壇第一人的柯潔,現在只有23歲,有棋迷認為:他應該還能維持霸主地位好幾年時間。但這位記者卻以為:大錯特錯!——人工智慧阿法狗改變了圍棋,如今圍棋運動員的巔峰期,比足球選手還要更加低齡化!
  • 吳清源圍棋會館圍甲聯賽 世界冠軍之戰柯潔勝謝爾豪
    2019年08月13日 10:12:57 來源:中新網福建 中國圍棋男子甲級聯賽第十三輪廈門隊與天津隊的比賽在福州吳清源圍棋會館舉行。