轉自:AI世代(微信:tencentai)
作者:韓依民 騰訊科技
張 蕾 騰訊體育
第10屆UEC杯計算機圍棋大賽3月19日在東京落幕,騰訊AI Lab(騰訊人工智慧實驗室)研發的圍棋人工智慧程序「絕藝」(Fine Art)首次參加比賽便一路過關斬將,繼18日的積分賽七連勝進入16強後,19日決賽又四連勝戰績奪得本屆UEC杯冠軍,日本「DeepZenGo」獲亞軍。3月26日,「絕藝」還將在東京與日本先鋒棋手一力遼在「電聖戰」中進行人機對弈。
絕藝決勝局
UEC杯2007年始於日本,是最具傳統和權威的計算機圍棋大賽,每年邀請各國高水平AI齊聚東京比賽,促進相關學術及科技的交流。日本的DeepZenGo、法國的「瘋石」(Crazy Stone)、美國Facebook公司的「黑暗森林」(Dark Forest)等世界著名計算機圍棋程序先後在UEC杯折桂獲獎,今年共有30支軟體參賽。本次大賽還請到曾獲日本圍棋四大家之首「本因坊」頭銜的王銘琬九段進行現場解說,也體現了日本棋院方面對於此次賽事的重視。
「很高興『絕藝』能夠在UEC杯奪冠,這是非常難得的寶貴經驗。『絕藝』不同於其他實驗室AI,它得益於世界超一流棋手的指導,通過不斷與高手交流及學習,一步步成長起來。我們希望,通過『絕藝』能夠讓更多人關注、喜愛進而傳承圍棋這一傳統文化。」騰訊公司副總裁、騰訊AI Lab負責人姚星表示,「『絕藝』在研究價值上也不止於圍棋AI本身,我們在深度學習和強化學習上進行了非常有價值的探索與創新,之後將通過論文公開這些技術創新和資料庫的細節,為推動圍棋AI的技術進步出一份力。騰訊AI Lab的發展願景是,讓AI未來無處不在(Make AI Everywhere),因此我們將以開放合作的態度,與業界一起共同推進全球AI技術的發展。」
「絕藝」名字,源自唐代杜牧的送別詩「絕藝如君天下少,閒人似我世間無」。「絕藝」曾先後使用多個ID,在騰訊圍棋(野狐圍棋)平臺與業餘和職業高手切磋,多次戰勝中日韓三國一眾頂尖棋手,成為騰訊圍棋首個晉級「十段」的棋手。截至3月9日,「絕藝」對局數量達534盤,戰績是406勝128負,勝率76%,與柯潔、古力、常昊、範蘊若、範廷鈺、樸廷桓等超過100位知名人類棋手有過交鋒。
「絕藝」由騰訊AI Lab一個13人團隊花了近一年時間自主研發,涵蓋了人工智慧最熱門的研究領域——深度學習和強化學習。「絕藝」的學習主要包括人類棋譜資料庫和機器自對弈,它的算法基於策略網絡與價值網絡兩大核心,並創新性地大幅提升了價值網絡的精度,使其大局觀表現更好。
通俗的說,「策略」指每一步博弈時,各種選擇的取捨,選好棋棄差棋,這是偏微觀評估;而「價值」則指能看懂棋局,判斷給定棋局是不是能贏,這是偏宏觀的評估。「『絕藝』背後『精準決策』的AI能力,應用前景非常廣闊,如無人駕駛、量化金融、輔助醫療等。如果AI從圍棋AI進化到不完美對稱博弈系統,也就是能處理現實中更常見的不確定性問題時,想像空間非常巨大。」騰訊公司副總裁、AI Lab負責人姚星表示。
騰訊AI Lab於2016年成立,專注於人工智慧的基礎研究及應用探索,不斷提升AI的決策、理解及創造能力,同時為騰訊各產品業務提供AI技術支撐。騰訊AI Lab的基礎研究包括計算機視覺、語音識別、自然語言處理和機器學習,其應用探索包括遊戲AI、內容AI、社交AI及平臺AI,產品已應用在微信、QQ及天天快報等上百個產品。目前實驗室有超過50餘位世界知名學院的AI科學家(90%為博士)、及200多位經驗豐富的工程師,力求做到「學術有影響,工業有產出」。
為了參加第十屆UEC比賽,未滿周歲的絕藝第一次出了國。
UEC杯是世界權威的圍棋大賽,每年在日本舉行,與普通圍棋賽不同,參賽選手不是人類,全是AI。
身為參賽隊員之一的絕藝由騰訊AI Lab研發,打造這款圍棋AI出來的團隊,由13位年輕人組成。
年輕是絕藝以及絕藝團隊的一個顯著特徵。
將絕藝與千裡之外的日本UEC比賽現場連接起來只需一臺電腦,通過筆記本電腦將絕藝接入對戰系統,絕藝就能在圍棋機器人的世界裡與各方來賓一較高下了。
絕藝在UEC比賽現場
今年第10屆大賽共有30支軟體參賽。在18日的循環積分賽中,「絕藝」以七局全勝戰績進入16強,並在今天決賽又四連勝戰績奪得本屆UEC杯冠軍,日本「DeepZenGo」獲亞軍。3月26日,「絕藝」還將在東京與日本先鋒棋手一力遼在「電聖戰」中進行人機對弈。
UEC 3月18日循環積分賽結果
對大部分人而言,絕藝是一個顯得有些陌生的名字,這源於它從誕生到成長一直保持的低調狀態。
儘管在它展露頭角的野狐圍棋對戰平臺上,絕藝的成長速度已經被外界注意到;而在UEC上取得優異成果獲得更多關注後,絕藝及其背後的團隊依然神秘,為此我們對絕藝團隊進行了專訪,以期還原絕藝的成長路。
絕藝英文名FineArt,名出唐朝詩人杜牧的《重送絕句》——絕藝如君天下少,閒人似我世間無。別後竹窗風雪夜,一燈明暗覆吳圖。頗具中國風的名字,契合圍棋起源於中國的歷史。
一年前,絕藝還只是一個存在於團隊頭腦中的想法。
2016年1月28日,騰訊AI Lab高級總監、專家工程師劉永升在內部IM上收到一條來自騰訊副總裁姚星的消息:有沒有信心做圍棋AI,如果圍棋不行,先做象棋AI也行。
姚星之所以萌生做圍棋AI的想法,源於他認為做這個對鍛鍊團隊的研發能力有幫助,而且跟騰訊相關的應用前景很大。
彼時劉永升對圍棋AI還沒有太清晰的概念,於是答覆姚星好好調研。在當年春節假期,劉永升找了一些圍棋的書籍、論文閱讀,對圍棋AI有了基本了解。春節回來後,2月17日,姚星問圍棋AI有沒有在做,劉回答:還在調研,並承諾一個月後出DEMO。
2016年3月4日,第一個DEMO完成,棋力在業餘5級左右,到3月下旬,圍棋AI正式立項,項目名稱weigo,團隊也隨之搭建起來。
到2016年6月下旬,絕藝棋力突破業務6段,意即突破業餘高手水平,這是絕藝的一個重要發展節點。
2016年8月,絕藝以「虎虎有生氣」的ID首次在野狐平臺(騰訊旗下圍棋對弈平臺)下棋,8月23日首次戰勝職業棋手,9月4日,絕藝以「野狐掃地僧」ID連贏 ID為tby的網友8局,tby是聶衛平長子孔令文的帳號。
在不斷的學習中,絕藝的能力不斷增強。
11月1日,絕藝正式以「絕藝」ID亮相野狐,11月2日第一次戰勝世界冠軍江維傑(野狐ID若水雲寒)。
11月19日晚,「絕藝」首次和柯潔交手,一勝一負;11月28日,「絕藝」對韓國第一人樸廷桓5勝1負。2017年2月14日以後,絕藝對野狐帽子(世界冠軍和全國冠軍)的勝率,已經能夠穩定在90%以上。
這個數據意味著,絕藝長大了。
人工智慧究竟是如何學習怎樣下圍棋的?回顧絕藝從0到1的過程能夠得到解答。
據絕藝團隊介紹,絕藝的學習方式包含兩部分,一部分來自人類棋譜,通過深度卷積網絡的訓練,得到一個策略網絡;第二部分為自對弈棋譜,也通過深度卷積網絡訓練,得到一個估值網絡。
怎樣把人類的棋譜「餵」給絕藝,而絕藝又是如何理解人類棋譜的?首先絕藝團隊會把人類過往棋譜轉化為若干二維矩陣,作為深度卷積網絡的輸入,輸出成果是一個策略網絡。策略網絡的作用在於,當你再輸入一個從來沒有存在過的新棋局時,策略網絡可以返回若干候選點,並且為每個候選點計算相應的概率值。
在絕藝的成長過程中,與人類棋手對弈是絕藝強大起來的重要原因,絕藝的突破性進展總是伴隨其戰勝某一實力水平的棋手出現。
「我們在6月底戰勝業餘強豪,8月初首次戰勝職業初級選手,9月首次戰勝職業普通選手,11月首次戰勝職業高級選手。」
在11月份輸給煉心(時越)之後,絕藝閉關了一段時間,主要是大幅度提升了價值網絡的精度,隨後以刑天的ID再次亮相。
在絕藝團隊看來,與人類棋手對弈的意義在於,在研發過程中,如何評估棋力以及存在哪些問題是非常困難的,並且隨著絕藝棋力提升,普通的棋手基本無法戰勝的時候更難暴露其不足。所以,絕藝的研發過程中得益於世界超一流棋手的指導,非常難能可貴,對研發進度有非常大的幫助。
儘管身為絕藝的研發人員,在開發絕藝的過程中,團隊成員依然對AI的強大感到驚喜。
「我們從來沒有想像AI可以這麼強,很多很複雜的棋,真不知道它為什麼可以正確應對,只能說深度神經網絡真的很神奇。」
在不斷的學習中,絕藝的棋力已經成長到足夠讓一流棋手另眼相看的程度。2016年11月19日晚上,絕藝和柯潔下了兩局,第一局絕藝第一次戰勝圍棋第一人柯潔,第二局惜敗。下完,柯潔發了一個朋友圈,內容是:「下的全是汗…\冷汗」。
團隊愛把絕藝比作一個可愛的小孩。
在3月17日絕藝與crazystone的對弈中,下到19手時,團隊成員看了絕藝的表現忍不住評價:絕藝又要動粗,要直接一本(柔道術語,意思是直接結束戰鬥)。
絕藝與crazystone對弈第19手
「這就是絕藝可愛的地方,明明很強,偏偏要跟個孩子似的,愛用蠻力。」
AI在圍棋上的成就已經得到普遍認可,但圍棋AI的存在並不意味著會成為人類棋手終結者。
絕藝團隊認為,絕藝是帶動人類認識圍棋的新力量,它與其他AI不是競爭對手,而是共同推動人類對圍棋的認知。
事實上,圍棋AI確實能給人類棋手帶來一些新角度的啟發。
在一手打造了絕藝的團隊成員看來,經過多次人機對弈後,他們發現,人類棋手與圍棋AI各有特點:「人類比較狡猾,但人類容易犯錯;機器比較老實,但幾乎不犯錯。」
同時,絕藝的大局觀,以及對一些定式的變換是能夠給人類棋手不少啟發的。
而開發圍棋AI的意義並不局限於圍棋領域。
從團隊角度看來,研發絕藝促使團隊過去幾年在AI算法研究、大規模計算平臺以及工程能力得到一次檢閱,並對深度學習和強化學習等AI熱門研究領域有了很多有價值的探索與創新。
從技術角度看,絕藝背後的人工智慧技術是「精準決策」的能力,有非常廣闊的應用場景,如無人駕駛、量化金融、輔助醫療等。
對絕藝團隊而言,絕藝當前取得的成果一方面完善了騰訊AI基礎設施,鍛鍊了團隊,也大大提升了技術視野,強化了團隊的信心。另一方面,絕藝給了他們向更廣闊AI領域積極進軍的信心,隨著團隊對AI的研究不斷深入,AI在其他領域的更多可能將被逐漸挖掘。
事實上,絕藝只是騰訊人工智慧戰略的一個體現。
2016年4月,騰訊成立AI Lab(騰訊人工智慧實驗室),致力於人工智慧基礎科學的開放研究,以及應用領域的深入探索,做到「學術有影響,工業有產出」。
實驗室的願景是打造騰訊全面AI競爭力,讓人工智慧未來無處不在(Make AI Everywhere)。
目前實驗室有50餘位世界知名學院的AI科學家(90%為博士)、及200多位經驗豐富的工程師進行基礎研究與應用探索。
AI Lab聚焦四大領域的基礎研究,包括:計算機視覺、語音識別、自然語言處理與機器學習,力求全面覆蓋並深層次拓展AI的前沿技術能力。同時發展AI在具有騰訊特色的四大業務場景中的應用能力:內容 AI、社交AI、遊戲AI和平臺工具AI。
目前產品已應用在上百個騰訊產品上,在絕藝之後,騰訊於AI領域的布局、研究和應用,已經進入加速時代。