美國電影《鐵甲鋼拳》中的機器人劇照
DeepMind關於AlphaGo Zero的視頻和論文一發表,小編我是心事重重,徹夜未眠。
AlphaGo Zero對AlphaGo Master,近百分之90的勝率,實際上是圍棋AI對人類棋手進一步的變相實力碾壓,DeepMind公司已經不屑於再借用哪怕一丁點的人類圍棋的經驗來做人工智慧的引導,也不願再用頂尖人類棋手來做AlphaGo新版本的對手來做測試。實際上也是無法再用人類棋手來測試現在的Zero版本,之前的Master網上60局和烏鎮的3局人機大戰,讓人類棋手已經失去了登臺的意義。
不久的將來,圍棋AI會否會像好萊塢大片《鐵甲鋼拳》中所描述的,因為機器人拳擊賽的興起,讓人類職業拳擊手全部失去了賴以生存的比賽舞臺一樣;已然倒下的多米諾骨牌,會不會讓所有職業棋手的生計成為問題?
在被以AlphaGo為代表的,包括了日本的DeepZenGo,中國的絕藝,臺灣的CGI等圍棋AI全面碾壓之後(DeepZenGo和絕藝現在對人類棋手的勝率超過百分之90),棋界內外早有人出來試圖打圓場,主張職業棋手淡看勝負。他們的主張是:即便有一天無法與人工智慧在棋盤上爭勝,圍棋文化的博大精深卻不會因此受到影響,反而會藉助技術發揚光大。話說得很漂亮,很可惜的是——這是一句充滿阿Q精神的話。
我年少時讀過一個長相猙獰的外國老頭,傑克韋爾奇寫的一本著名的管理學圖書,名字很惡俗——就叫《贏》。小時候,我們就本能的崇拜班級裡跑得最快,跳得最高,最能打架的男同學了,長大了,我們喜歡看進球最多,投籃最準的球員打球。即使是虛擬無聊如王者榮耀這樣的網路遊戲,人類還是喜歡贏。贏的本能大概來自於人類的生物本能,人類就是那麼地崇拜贏家。
同樣地,對圍棋而言:「贏棋」是吸引觀眾的首要砝碼。中國圍棋隊總教練俞斌九段就說過一段名言:「圍棋的美我覺得就在於勝負競技,我們說這一招很美,是因為它導向了勝利。」離開了輸贏,圍棋之美也就成了一紙空言,空中樓閣。而再也贏不到,或者極為罕見地能贏一盤圍棋AI的職業棋手們還能定義圍棋的美嗎?
雖然圍棋這個遊戲敗給人工智慧要比當年的深藍戰勝西洋棋棋王晚了近20年,但是圍棋卻和西洋棋的處境截然不同。
首先讓我們了解一下當年的超級電腦深藍(Deep Blue)。深藍是美國IBM公司生產的一臺超級西洋棋電腦,重1270公斤,有32個大腦(微處理器),每秒鐘可以計算2億步。並且"深藍」輸入了一百多年來優秀棋手的對局兩百多萬局。是不是給人有一種笨重的感覺?
而AlphaGo只是一個單純的軟體,AlphaGo Lee作為AlphaGo Zero的「前輩」,它需要48個TPU(神經網絡訓練專用晶片)支持,並在參考大量人類棋譜,自我對弈約3000萬盤,訓練大半年後,才在2016年3年月,AlphaGo Lee以4:1的擊敗韓國九段棋手李世石,引發人們關注。而AlphaGo Zero的最新版本 Zero僅需要4個TPU,零人類經驗,其自我訓練的時間僅為3天,自我對弈的棋局數量為490萬盤。它就以100:0的戰績擊敗了「前輩」。是不是給人一種輕巧而進化的感覺?
我們再來對比戰績——1996年2月10日~2月17日,超級電腦深藍首次挑戰西洋棋世界冠軍卡斯帕羅夫,以3敗2和1勝的總比分落敗。
請注意:西洋棋的第一次人機大戰,卡斯帕羅夫完美地獲得了勝利。這個歷史意義和頂尖職業圍棋棋手面對AlphaGo的比賽,每次都像是被砍瓜切菜一般的敗北是不一樣的。即使是李世石九段,下出「神之一手」獲得人類棋手對AlphaGo的比賽中唯一獲勝的一局。實際上,那並不妙手,而是一步沒有用的壞棋。結果確實是贏了,但並不是人類在圍棋的技術水準上擊敗了AlphaGo,而只是非常偶然地抓住了當時的AlphaGo Lee這個版本在算法上的漏洞。而對於這個漏洞,整個AlphaGo開發的核心團隊事前其實上是心知肚明的。
78「神之一手」
其後IBM的研究小組把深藍加以改良,1997 年 5 月3 日~5月11日,在第二次人機大戰中,深藍首次在正常時限的比賽中擊敗了等級分排名世界第一的棋手。棋王加裡·卡斯帕羅夫以 1勝2負3平的劣勢輸給了進化後的深藍。
但是首先請注意:西洋棋是有和棋的!小編因為小時候經常在區體校集訓,圍棋隊經常和象棋隊,西洋棋隊混在一起訓練,所以久而久之,我也學會了下西洋棋,並且成了我廣泛的興趣愛好之一。(即使是今日,我把西洋棋的布局套路忘了個精光,仍能夠輕易下贏Window系統自帶的小遊戲中西洋棋的最高水平。)而據我了解,西洋棋的比賽中,一旦有一方抱定了不想贏,只求和心思的話,除非雙方有明顯的實力差距,否則和棋的概率是非常高的。即使是加強版的深藍,也沒有可能在和卡斯帕羅夫的較量中百戰百勝,這就使得勝負的懸念依舊存在,也可以說人類在西洋棋上雖然贏不了了,但是並不沒有徹底的輸掉。
戴密斯·哈薩比斯(Demis Hassabis)在烏鎮人工智慧高峰論壇上發表演講
某位在烏鎮峰會上(這哥們的名字是?我一直想知道,但是愣是沒找到,請教大家)展示AlphaGo不同版本間棋力的增長幅度。
進化到Zero版本的AlphaGo和人類棋手的絕對實力差距被進一步拉大。在5月烏鎮人機大會上,DeepMind在人工智慧高峰論壇上表示:AlphaGo Master版本可以讓AlphaGo Lee版本3個子時,我清楚地記得當時會場聽眾的反應——先是沉默,然後轟鳴。在公布了Master自戰50局後,更有不止一位一流的職業棋手表示:恐怕Master可以讓我2個。而昨晚——最新版本AlphaGo Zero對AlphaGo Master,有近百分之90勝率的消息一經發布,更是證明現在的AlphaGo Zero要讓世界頂尖棋手2子,恐非妄言。事實上,我們都無需第3次人機讓子棋大戰來測試AlphaGo Zero是否真的能讓柯潔2子,只需要DeepMind公開最新版本AlphaGo Zero或者AlphaGo Master版本讓AlphaGo Lee版本3個子的數盤對局實錄即可。
而西洋棋呢?——你讓深藍或者任何一個西洋棋AI試試讓人類棋王一個皇后,或者一個象,又或者一個車試試?在西洋棋中,任何AI和人類棋王的實力差距,並不懸殊。這也是深藍當年戰勝棋王加裡·卡斯帕羅夫,卻對西洋棋這項運動賽事的發展和繼續並無多大影響的關鍵原因所在。
而圍棋呢?——我們看到的是一群再也贏不了,也和不了,被讓2子還依然要輸的棋王們。難道你還能說你對職業圍棋賽事的繼續和發展沒有一丁點的危機感嗎?
柯潔九段(圖片來自南方人物周刊)
還是柯潔最有先見之明。早在年初,柯潔在接受南方人物周刊採訪時就說:「將來的事情怎麼樣,我說了不算,下不贏AI,是不是我們的聯賽就沒有人看了,贊助商就不願意冠名了,這不由我管。」雖然這件事情不由柯潔管,但是我想,聰明如柯潔不可能不去想這個事情可能引發的連鎖反應。
畢竟,泡一杯茶,坐在電腦前,就能隨時隨地欣賞真正頂級的圍棋對弈——看AI下棋。那麼,職業圍棋生存的真正土壤——棋迷朋友們是不是還會繼續饒有興趣地看輸得底掉的職業棋手下棋呢?
圍棋圈的聰明腦袋們是不是應該去想想:AlphaGo Zero後時代的職業圍棋市場化之路如何走?
後記:本文僅代表我個人觀點。為了邏輯稍微嚴密一點,寫的有點太囉嗦了,請耐心看完再噴,本人坐等萬炮齊轟。其實我還言之未盡,應該還有下一篇《AlphaGo Zero後時代(2)——不再神秘的圍棋,圍棋文化的危機》。
(作者:王振飛)
弈客圍棋整理髮布!
更多精彩賽事直播,棋文弈事,盡在弈客圍棋,下載弈客APP,和熱愛圍棋的棋友對弈手談!