3月19日,第10屆日本UEC杯計算機圍棋大賽在日本東京都日本電氣通信大學(UEC)落幕,騰訊人工智慧實驗室(騰訊AI Lab)研發的圍棋人工智慧程序「絕藝」(英文名:FineArt) 在最終的決賽中,戰勝了日本「棋手」DeepZenGO,以11戰全勝戰績獲得這次比賽冠軍。
「絕藝」戰勝DeepZenGOUEC杯始創於2007年,與普通圍棋賽不同,參賽選手不是人類,而是人工智慧,每年在日本舉行,是最具傳統和權威的計算機圍棋大賽。UEC杯每年邀請各國高水平AI齊聚東京比賽,促進相關學術及科技的交流。日本的DeepZenGo、法國的「瘋石」(Crazy Stone)、美國Facebook公司的「黑暗森林」(Dark Forest)等著名計算機圍棋程序曾先後在UEC杯折桂獲獎。
比賽現場說到圍棋AI比賽,必定繞不開曾戰勝過人類棋手李世石的AlphaGo。不過,據澎湃新聞了解,此次DeepMind公司的AlphaGo團隊與去年一樣,並未選擇參賽。
「絕藝」背後的人工智慧據騰訊介紹,「絕藝」的名字取自唐代詩人杜牧的送別詩《重送絕句》:「絕藝如君天下少,閒人似我世間無。別後竹窗風雪夜,一燈明暗覆吳圖。」為了開發圍棋人工智慧,騰訊人工智慧實驗室組建了一支13人的團隊,花了近一年的時間打造「絕藝」。
「絕藝」現場比賽圖「很高興絕藝能夠在UEC杯奪冠,這是非常難得的寶貴經驗。絕藝不同於其他實驗室AI,它得益於世界超一流棋手的指導,通過不斷與高手交流及學習,一步步成長起來。我們希望,通過絕藝能夠讓更多人關注、喜愛進而傳承圍棋這一傳統文化。」騰訊公司副總裁、騰訊AI Lab負責人姚星在賽後接受媒體採訪時說。
騰訊AI Lab負責人姚星在賽後接受媒體採訪「絕藝」的研發始於2016年1月。當時姚星在騰訊內部給工程師發了一條消息:有沒有信心做圍棋AI,如果圍棋不行,先做象棋AI也行。
隨後,騰訊人工智慧實驗室高級總監、專家工程師劉永升經過調研,在2016年3月做出了第一個DEMO(測試版)。到2016年3月下旬,騰訊內部圍棋AI正式立項,項目名稱weigo。不過那時,AlphaGo已經以4:1的成績戰勝了韓國棋手李世石。
關於AlphaGo背後的算法,Facebook「黑暗森林」圍棋軟體的開發者田淵棟曾介紹過,AlphaGo這個系統主要由四個部分組成:一是走棋網絡,給定當前局面,預測/採樣下一步的走棋;二是快速走子,目標和第一步一樣,但在適當犧牲走棋質量的條件下,速度要比第一步快1000倍;三是估值網絡,給定當前局面,估計是白勝還是黑勝;四是蒙特卡洛樹搜索,研發者將遊戲中所有的可能性表示成一棵樹,樹的第N層就代表著遊戲中的第N步。樹的node(節點)數是隨著樹的深度成指數增長的,不考慮剪枝,每個node都需要進行估值。把以上這4個部分連起來,形成一個完整的系統。
AlphaGo之後,Crazy Stone、DeepZenGo等紛紛在自己的程序中加入了深度學習模塊。騰訊推出的「絕藝」也採用了相似的策略。據騰訊官方介紹,「絕藝」的算法基於策略網絡與價值網絡兩大核心,並提升了價值網絡的精度。
除了背後算法相似外,「絕藝」也採取了AlphaGo曾經使用的訓練策略,即學習了大量的人類棋譜,又進行了自我博弈學習,以及通過與人類選手對戰,增加自己的「戰鬥經驗值」。
2016年11月,「絕藝」正式登錄騰訊圍棋(野狐圍棋)平臺,在與多名人類一線頂尖棋手過招後,絕藝曾閉關過一段時間,在大幅度提升了價值網絡的精度後,一度以刑天的ID再度亮相。
「絕藝」在騰訊圍棋平臺上的戰績。 騰訊 圖根據騰訊圍棋(野狐圍棋)提供的數據,截至2017年3月9日,「絕藝」與柯潔、古力、聶衛平、範廷鈺、時越、井山裕太、樸廷桓、元晟溱等共計超過100位知名人類棋手有過交鋒,在509局對局中「絕藝」388勝121負,勝率達76.23%。「絕藝」執白的對局有259局,其勝率達到71.43%,「絕藝」執黑的對局有250局,其勝率達81.2%。
具體到個人對弈結果,「絕藝」與柯潔對弈21局,「絕藝」取得16勝5負的戰績。其中柯潔曾拿到過4連勝,而「絕藝」則取得過對柯潔的13連勝,其中「絕藝」執白7局取得5局勝利,「絕藝」執黑14場取得11局的勝利。「絕藝」與第18屆農心杯的終結者、中國名將範蘊若共對弈38局,範蘊若勝12局負26局,勝率為31.6%。
「絕藝」與人類棋手的對弈結果。 騰訊 圖結束UEC杯比賽後,3月26日,「絕藝」還將參加由UEC杯衍生出的「電聖戰」。「電聖戰」是由UEC杯的勝出者,對陣人類頂尖棋手,由日本棋院與電氣通信大學於2013年創辦。屆時,「絕藝」將挑戰日本新銳棋手一力遼。
冠軍背後是計算資源的較量在今年的UEC杯比賽中,共有30位人工智慧「棋手」參賽。3月18日預賽,採用循環積分賽制,「絕藝」以7局全勝戰績進入16強。3月19日決賽,採用淘汰制,「絕藝」以4連勝的成績戰勝日本DeepZenGo獲冠軍。
「絕藝」預賽戰績UEC杯比賽用時每方30分鐘,平均下來20秒左右就要落子,因此參賽程序的計算能力對比賽成績有著至關重要的作用。根據賽制,UEC杯對硬體配置沒有強制性要求,比賽時並不是所有的程序都使用統一的硬體配置。雖然要求參賽者必須報告機器功耗,但特別說明功率在1000W以上的,可以通過特別許可參賽。
比賽過程中,各家人工智慧「棋手」通過手裡的筆記本電腦,把比賽數據發送到各自的伺服器計算平臺上進行比賽。有意思的是,因為需要聯網發送數據,在3月18日的比賽過程中,還發生了因為斷網而導致比賽暫停的情況。
UEC杯的快棋賽制其實是對人工智慧「棋手」背後計算資源的考驗。「絕藝」的背後是騰訊,而DeepZenGo由日本公司DWANGO提供背後支持,DWANGO也是日本著名視頻網站NICONICO動畫的母公司。得益於各自團隊的強大支持,「絕藝」和DeepZenGo兩者在預賽中一路過關斬將,並沒有遭遇什麼抵抗就打進了決賽。決賽中兩位對手的交鋒成為此屆比賽的最大看點。
下圍棋並非AlphaGo的最終目的2016年年初,DeepMind在《自然》雜誌上發表的關於AlphaGo的論文,介紹了圍棋人工智慧背後的算法。此後,許多人工智慧圍棋程序的開發都基於AlphaGo的研究。換句話說,「絕藝」、DeepZenGo等都是去年那個AlphaGo的跟隨者。
不過,現在的AlphaGo已經不再是當初的那個AlphaGo了。從2016年12月29日晚起,升級後的AlphaGo改名為「Master」、接連「踢館」著名在線圍棋網站弈城網和野狐網。截至2017年1月4日,Master斬獲了60連勝,擊敗15位世界冠軍,其中包括中國、韓國、日本各自的「當今第一人」柯潔、樸廷桓和井山裕太。
斬獲60連勝後,DeepMind聯合創始人之一戴密斯·哈撒比斯(Demis Hassabis)更是在推特上激動發聲:「在非正式測試結束後,我們期待在今年安排一些標準時長的正式比賽」。此前有媒體報導,今年4月份,中國棋手柯潔將有機會在烏鎮與AlphaGo進行比賽。
但對於AlphaGo的母公司DeepMind而言,參加圍棋比賽並不是其開發AlphaGo的最終目的。DeepMind公司曾公布過自己2017年的三大目標:實現算法突破,提升社會影響,建立倫理規範。利用AlphaGo背後的算法發掘出可以運用於社會福祉的新科學知識,由此來解決人類的氣候、能源和醫療健康等問題。
(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)