新智元報導
來源:騰訊野狐圍棋、微信派
編輯:克雷格
【新智元導讀】昨天,騰訊AI Lab開發的「絕藝」意外輸給了自家兄弟Phoenix Go。Phoenix Go是微信翻譯團隊開發的人工智慧圍棋,算是「絕藝」的小弟,它們兩個都出自騰訊,可謂「同根生」。它基於AlphaGo Zero論文實現,同時做了若干提高訓練效率的創新,並利用微信伺服器的閒時計算資源進行自我對弈。
本自同根生,相煎就是這麼急。
在昨天結束的世界人工智慧圍棋大賽上,騰訊AI Lab開發的「絕藝」意外輸給了Phoenix Go,屈居第二。
Phoenix Go是微信翻譯團隊開發的人工智慧圍棋,算是「絕藝」的小弟,它們兩個都出自騰訊,可謂「同根生」。
不同的是,Phoenix Go的優勢在於,它基於AlphaGo Zero論文實現,同時做了若干提高訓練效率的創新,並利用微信伺服器的閒時計算資源進行自我對弈。
目前,PhoenixGo已經戰勝過200多位人類棋手,這次戰勝「絕藝」倒是出乎所有人的意外。
認識PhoenixGo:曾被認為是百度、阿里、Zero養的「金毛」
2018年初,PhoenixGo以Bensondarr等帳號在騰訊野狐圍棋上進行實戰,目前已經戰勝200多位棋手。
在公布正式身份之前,社區、貼吧等上面關於BensonDarr的猜測眾多。
有的說BensonDarr的首字母縮寫是「BD」,就是百度的狗,也有的注意到BensonDarr從來沒有和絕藝指導下過棋,這很難解釋。正常的話,其它AI應該都是非常渴望挑戰絕藝,因此可能是阿里的狗。
看到Bensondarr這麼強大,也有人說是Zero。
而Bensondarr換了金毛的頭像後,就被棋友稱為金毛。
這隻金毛在野狐圍棋上名氣越來越大,直到世界人工智慧圍棋大賽在今年4月20日公布參賽陣容時候,它的身份首次公開:就是「絕藝」的自家兄弟PhoenixGo。
PhoenixGo是微信的幾名工程師在開發機器翻譯引擎「之餘」抽空研發的AI程序。它基於AlphaGo Zero論文實現,同時做了若干提高訓練效率的創新,並利用微信伺服器的閒時計算資源進行自我對弈,緩解了Zero版本對海量資源的苛刻需求。
微信團隊沒有公布如何基於AlphaGo Zero論文實現,不過去年10月,DeepMind在Nature的一篇論文中,描述了AlphaGo Zero 的技術細節。
AlphaGo Zero完全不依賴於人類數據,因此,這一系統的成功也是朝向人工智慧研究長期以來的目標——創造出在沒有人類輸入的條件下,在最具挑戰性的領域實現超越人類能力的算法——邁進的一大步。
作者在論文中寫道,AlphaGo Zero 證明了即使在最具挑戰的領域,純強化學習的方法也是完全可行的:不需要人類的樣例或指導,不提供基本規則以外的任何領域知識,使用強化學習能夠實現超越人類的水平。此外,純強化學習方法只花費額外很少的訓練時間,但相比使用人類數據,實現了更好的漸進性能(asymptotic performance)。
AlphaGo Zero 在其他方面也與之前的版本有所不同:
AlphaGo Zero 只使用圍棋棋盤上的黑子和白子作為輸入,而上一版本的 AlphaGo 的輸入包含了少量人工設計的特徵。
它只使用一個神經網絡,而不是兩個。以前版本的 AlphaGo 使用一個「策略網絡」(policy network)來選擇下一個落子位置和一個「價值網絡」(value network)來預測遊戲的贏家。這些在 AlphaGo Zero 中是聯合進行的,這使得它能夠更有效地進行訓練和評估。
AlphaGo Zero 不使用「走子演算」(rollout)——這是其他圍棋程序使用的快速、隨機遊戲,用來預測哪一方將從當前的棋局中獲勝。相反,它依賴於高質量的神經網絡來評估落子位置。(詳細細節請閱讀新智元文章《【21天完虐Master】AlphaGo Zero橫空出世,DeepMind Nature論文解密不使用人類知識掌握圍棋》)
PhoenixGo對戰絕藝:騰訊自家兄弟的遊戲
在世界人工智慧圍棋大賽半決賽,PhoenixGo和絕藝分別順利擊敗Leela Zero和天算圍棋,令決賽成為騰訊兩兄弟的對決。
28日中午12:30,決賽首局開戰。
八冠王古力九段受邀為棋迷解說。猜到白棋的絕藝一出手就有創新,左下面對金毛的託扳定式,絕藝沒有採納人類耳熟能詳的打完粘上,而是走出二路倒虎的新手。
隨後的進程,絕藝一直保持著大貼目下白方的後發優勢。不過雙方差距並未拉大。
進入官子,執黑的金毛在下方二路大跳,入侵白空。絕藝出人意料的脫先跑到右上扳角。嗅到機會的PhoenixGo出手狠辣,147凌空一擠,左上一隊白棋突然面臨生死之危。
突然而至的危機,並不會讓AI慌亂。
實戰絕藝順利將大隊人馬完整連回,但是勝負的重點仍在他處。繼續掌控先手的PhoenixGo回到下邊,令白棋目數大幅縮水。絕藝弈出一路「金雞獨立」經典手筋,PhoenixGo177妙手一靠還以顏色。此處戰罷黑棋徹底完成逆轉。
又進行了40手,絕藝中盤認輸。
發球局被破,絕藝的決賽之旅頓生坎坷。
第2局拿到白棋的PhoenixGo發揮出色,始終保持著貼目優勢,弈至159手絕藝強行收下右邊官子,打破局面平衡。
面對絕藝的進擊,PhoenixGo態度同樣強硬,一刀切斷黑棋19子大龍歸路。慘烈的攻殺開始,黑棋大龍幾經輾轉,弈至191手雖能從上邊鑿出縫隙回家,但要付出左上角被吃的代價。
見此情景絕藝團隊主動認輸,比分變為2:0,PhoenixGo已經提前奪冠。
最終,Phoenix Go 2:1擊敗絕藝,贏下本屆AI大賽,智能圍棋世界冠軍榜上又添新成員。
「星陣」戰勝柯潔,國產AI圍棋崛起
中國作為圍棋的發源地,在AlphaGo誕生後的幾年裡也成為主要的AI圍棋源頭之一。
被同門兄弟擊敗的「絕藝」,是騰訊AI Lab於2016年3月4日開發出的AI圍棋,當年8月絕藝就首次戰勝職業棋手,11月第一次戰勝世界冠軍棋手江維傑(野狐ID若水雲寒)。
2016年11月「絕藝」首次和柯潔交手,成績一勝一負;2017年2月14日以後,絕藝對野狐帽子(世界冠軍和全國冠軍)的勝率,已經能夠穩定在90%以上。不久前,「絕藝」還成為中國圍棋國家隊的訓練工具。
在PhoenixGo戰勝絕藝的同一個賽場上,另一家國產AI圍棋「星陣」戰勝了柯潔。
星陣的前身是清華大學由小川團隊研發的「神算子」,曾在比賽中戰勝世界冠軍孔傑九段。
據「AI前線」報導,由小川曾介紹,星陣也借鑑了AlphaGo的基本架構,但在特徵體系、模型結構、MCTS 算法架構等方面有所創新,力爭用更少的計算資源和更少的訓練樣本完成模型學習。
現在,AlphaGo已經退休,但是它啟發的無數後來者站在巨人的肩膀上,不斷探索計算的奧秘。