8月6日的舊金山,一支由人類組成的《Dota 2》隊伍以1:2輸給了5名人工智慧組成的機器人戰隊。
第一局比賽中,人類戰隊到最後也沒能摧毀AI方的任何一座塔,在經濟和擊殺數雙雙落後的情況下失敗。第二局人類方開局取得了一些優勢,拿下了一血,在經濟上稍稍領先了AI,但在20分鐘左右,AI迅速組織集結和轉移,借人類方對此準備不足的機會,摧毀了人類方的幾座堡壘,很快又取得了勝利。
至於人類獲勝的第三局,現場觀眾為AI們指定了5位比較脆弱的英雄,人類方則拿到了堪稱完美的陣容。選擇完陣容之後,系統給出的AI勝率只有不到3%,人類也沒有辜負如此優勢的局面,在40分鐘時攻破了AI的基地,取得這場人機大戰中唯一的勝利。
如果說這場對戰中人類有什麼值得慶幸的,那就是這支《Dota 2》戰隊並非頂尖職業隊伍,一半以上成員是已經退役的前職業選手,還有一名遊戲解說,他們經驗豐富,但之前沒有在一起進行過團隊訓練,配合的默契度肯定無法保證。
這套擊敗了他們的AI軟體全名是「OpenAI Five」,由非營利組織OpenAI研發。OpenAI成立於2015年末,一直專注於前沿的機器學習,所有研究成果都在網上公布供所有人使用。他們研發的Dota AI一年前已經在公眾面前亮相,它在1v1的《Dota 2》對戰中擊敗了職業選手Dendi,那時它尚且不會團隊作戰。到了今年6月,學會5v5的OpenAI Five在《Dota 2》的天梯上遊覽了一圈,和業餘玩家們互有勝負。
現在,這個進步飛速的AI的下一個目標,是Dota界最權威的賽事TI錦標賽,在那裡,它們將和這個世界上真正的最強Dota玩家競爭。
這當然不是AI第一次在遊戲領域擊敗人類。兩年前的3月,Google DeepMind開發的圍棋軟體AlphaGo擊敗了韓國棋手李世石,成為近年來AI戰勝人類的最著名案例。追溯到更早以前,1997年,人工智慧深藍擊敗了西洋棋世界冠軍卡斯帕羅夫。只是到了最近,我們已經越來越習慣這類事件的發生。科技的進步總是這樣,在人們徹底習慣以前,人工智慧和人類的每次對決都能引發話題。
這次也一樣,網絡輿論中會有一些情緒化的表達,諸如「血虐」「吊打」一類的詞語在新聞標題中頻頻出現。在關於AI與人的討論中,總有很多報導喜歡詳細描寫人類在進步迅速的AI面前是如何慘敗、如何不堪一擊的。
事情當然沒有那麼誇張,AI目前的能力仍然有很大的不足。簡單來講,現在的諸多AI仍然沒有脫出我們所熟知的那個套路:「對人類很難的事對AI非常簡單——比如瞬間判斷和反應,有些對人類簡單至極的事對AI卻非常困難——比如理解合作和長遠的收益」。
此次《Dota 2》的人機比賽之中,OpenAI調用了Valve官方的bot接口,而非直接從屏幕上讀取像素信息。這樣AI們立刻就能獲得人類玩家需要仔細觀察理解才能得到的信息——對手的血量、位置和隊友的狀態等等。OpenAI承認,他們還做不到真正讓AI像人一樣玩遊戲,因為「那將需要數不勝數的GPU同時運作」。
比賽中AI們只能從18個英雄中選擇5個參賽,而《Dota 2》實際上一共有100多個英雄。不僅如此,比賽還加入了諸多限制,不能使用聖劍、掃描,每個英雄都有5個無敵的信使,等等。這讓人機大戰和真實的《Dota 2》對戰大相逕庭。
2016年底,暴雪宣布與開發出AlphaGo的DeepMind合作,讓AI在《星際爭霸2》的遊戲環境裡進行特訓,協助人工智慧研究發展,結果並不那麼令人滿意。DeepMind承認,「目前的深度學習AI還存在巨大的瓶頸」,他們說,現在AI的《星際爭霸2》水平很差,連遊戲自帶的簡單電腦都打不過,學過最高明的技巧只是讓人族的建築飛到空中逃跑,還只是碰巧試出來的。
事實證明,這些利用深度學習的遊戲AI確實還有很長的路要走。在韓國舉辦的一場人機對抗《星際爭霸》表演賽中,由AI競賽的前三名AI分別迎戰普通學生玩家和頂級職業選手宋炳具。AI方先以5:1的好成績擊敗了兩名普通玩家,但輪到宋炳具上場後,AI就表現得有些力不從心。宋炳具連勝3場,由於他獲勝太快,活動的時間還剩不少,主辦方安排了臨時的加賽,讓Facebook研發的AI CherryPi也登場參加比賽,結果仍敗在這位頂尖「星際」玩家的手下。
在AI問題上,遊戲公司們看得更加長遠和開放。今年3月,EA已經在自己的遊戲《戰地》中開始訓練AI,它們很快就學會了在生命值較低和沒有彈藥時採用不同的模式行動,不過在單人行動時它們表現得還是很蠢,比如會莫名其妙地開始原地轉圈……
負責這項訓練的人工智慧實驗室表示,他們的目標不是為了創造出能擊敗人類的AI,而是創造能給玩家帶來更多快樂體驗的AI,為了達成這一目的,AI太過「厲害」顯得沒什麼必要。
育碧也已經在2017年和一位名叫Daniel Holden的程式設計師合作。他們想改變以往遊戲角色動畫全是由預先捕捉動作製作的方法,希望直接利用AI將用戶的操作映射到遊戲角色身上,這樣AI會自動根據玩家操作生成遊戲動畫,需要儲存的數據大大減少。
不僅是歐美廠商,日本大廠Konami在《實況足球2017》裡也引入了人工智慧系統「TeamVision」,這個系統會使玩家操作的球隊學習玩家的踢球風格與擅長的玩法,從而做出隊員的優化,讓玩家能感受到球隊在與你一同成長進步。對手的球隊也會利用AI適應、學習玩家的戰術,從而改變自己的策略,讓比賽更富有挑戰性。Konami的解釋是,這套系統的目的在於激勵玩家採用新的戰略和思路,遊戲難度仍然是按照玩家事先選擇的水平,AI只是保證比賽「更加真實」。
從另一個角度上說,就算AI的遊戲水平確實比人類玩家高了,似乎也沒什麼值得害怕的。深藍出現之後,整個西洋棋界確實受到了影響,觀眾們看棋、高手們訓練都非常依賴於AI的各種提示,但是西洋棋沒有就此消失,反而發展良好,整個業界的整體規模和水平都得到了長足的進步。與1995年相比,國際棋聯的活躍棋手已經從1億人增長到了6億人,會員國從120個提高到了188個,擁有1萬個正式比賽和10萬個非正式比賽。
AlphaGo擊敗圍棋界的高手們之後,不同於大眾的憂心忡忡和輿論的悲觀論調,棋手們卻普遍有一種欣喜的感覺,棋手高飛龍這麼說:「我們可以將之化為工具來研究圍棋。人機對弈的必要性可能超出大家的想像,利用AlphaGo進行拆棋,是不能錯過的光明的未來。」被AI擊敗的世界級棋手李世石、柯潔都在多個場合表示,AI讓他們看到了棋道上的新思路。圍棋界因為這些新聞獲得了前所未有的關注度,這項古老的棋類遊戲藉此勢頭,可能因而獲得更多新鮮血液。
在這次的《Dota 2》人機大戰中,國外解說們多次提到,人類選手可以從AI身上學到很多之前沒人想過的技巧,比如快速集合轉移的價值和對補給品的使用。
不管AI們現在水平如何,從長遠來看,很可能的情形是AI越來越強,總有一天會比所有人類玩家都要強。這件事早晚會發生,畢竟在人類歷史上,機器打敗人這種事已經發生過很多次了。
中國年輕的圍棋高手柯潔在被AlphaGo擊敗幾個月後曾經說:「作為棋手,下棋對我來講是一件挑戰自我的事情。我希望跟強大的對手去比賽,不管對手是AI,還是人類棋手,都是很令人激動的。我希望去跟他們進行比賽,這是有意義的,是我人生中寶貴的經歷。之前我在烏鎮跟AlphaGo下完之後說我再也不會跟人工智慧下棋了,但是我現在食言了。因為我覺得一個棋手是應該弈無止境的,是需要去挑戰其他對手的。」
既然西洋棋沒有因為「深藍」而消失,圍棋界也沒有因為AlphaGo而毀滅,在電子遊戲領域,AI擊敗人類本身也承載不了太多的情緒。人類的遊戲、比賽本身就是有意義的,它們有趣、令人激動,是所有玩家寶貴的體驗。就像我們沒有把法拉利賽車拉到100米短跑賽道上讓它和人類比賽一樣,AI們被設計出來的目的也不是進入遊戲和人類玩家一較高低,它們理應讓玩家更加快樂地享受遊戲。
AI在遊戲上打敗人類,這更不值得恐懼或者悲哀,畢竟AI們也是由人類開發出來的,它們自己就是人類智慧的結晶,存在的目的也是為人類服務。AI們在遊戲上戰勝人類,只代表人類在不斷超越過去的自己,在這條道路上,人類又踏上了新的臺階,還代表著玩家們以後可以享受更加智能的AI服務。
不管怎樣,正如OpenAI聯合創始人Greg Brockman所說,「無論結果如何,勝利(受益)的一方都是人類。」