還記得2017年,那個血洗圍棋界的「阿爾法狗」嗎?
這個由谷歌旗下 DeepMind 公司開發的 AI ,對陣世界頂尖圍棋選手,打出完全碾壓式的戰績:
AlphaGo vs. 樊麾 - 5 : 0
AlphaGo vs. 李世石 - 4 : 1
AlphaGo vs. 柯潔 - 3 : 0
那時人們都絕望地說,在圍棋上,人類可能再也贏不了AI了。
很遺憾,這就是棋類遊戲的現狀。
去年,阿爾法狗的終極版AlphaZero,已經在西洋棋、將棋和圍棋三種棋類遊戲中,全面超越人類。
DeepMind 與它的阿爾法 AI 大軍,在吊打了各路頂級選手之後,甩下一句話:
「下次我們想試試打星際爭霸。」
那時候,是2016年。經過兩年多的訓練,這一天,終於來了。
昨天,DeepMind 和暴雪進行一場直播,秀了一把他們在《星際爭霸II》中,與人類選手對戰吊打的成果。
這一回,出場的選手,是阿爾法狗的親戚 AlphaStar。
暴雪邀請了,來自職業戰隊 Team Liquid 的兩位職業選手, TLO 和 MaNa,和 AlphaStar 各打了5局。
結果...
被剃了光頭,AlphaStar 十局全勝。
機哥非常好奇,像星際2這樣操作如此複雜的RTS遊戲,究竟AI需要強到什麼程度,才可以做到「吊打」人類選手?
於是機哥借著寫稿的機會,在上班時間,公然擼完了,這一場快三個小時的直播,看了個究竟。
AlphaStar 和 AlphaGo 血緣關係密切,訓練的方式都非常相似。
借著暴雪開放星際2 API 的機會,AlphaStar 獲得了大量來自玩家的 Replay 檔案,藉此大量地學習並模仿,真實玩家的操作和戰術。
像星際爭霸這樣的即時戰略遊戲,和之前的各種棋,有著一處關鍵性的不同——戰爭迷霧。一種限制玩家獲取對方完整信息的機制。
這樣,AlphaStar 就不能像在下棋的時候一樣,獲得敵我雙方的完整信息,必須要有非常強大的預判和即時決策的能力。
AlphaStar的目標是模擬人類的操作,為了讓操作更接近人類,DeepMind 甚至對它的操作做出了各種限制。
比如說,將它的反應速度限制在偏低的 350 毫秒。
再比如說,AlphaStar的平均 APM 也在 277 左右,遠低於星際職業選手的水平。
即使如此,在和兩位職業選手的對戰中,還是獲得了十戰全勝,這 AI 真的就這麼無敵嗎。
不好意思,是的,真的是打不過。
即使有著諸多限制,AI操作的精度,仍然是人類選手無法達到的。別看人家APM低,不過它可以說沒有任何的冗餘操作,每一次操作都是有效的。
而人類選手就不一樣,人類選手的高APM,參雜了各種熱手、誤操作和多餘的操作,很多時候你以為的騷操作,都是瞎JB浪。
這回AlphaStar之所以能贏的如此徹底,靠的就是騷操作,精確到每一個單位的騷操作。
藍方:AlphaStar,絲血反殺後撤退
並且,在這10場比賽中,AlphaStar 有著覆蓋了所有可見區域的全局視野,就像開了掛一樣。人類被碾壓,很正常。
不過還好,MaNa選手在直播的最後,和AlphaStar打了一場表演賽。這回,人類贏了。
這全都是因為,這一次,AlphaStar使用了另一個版本。這次,它失去了上帝視角,必須像人類一樣切換視角觀察戰場,被MaNa用放風箏戰術拖死。
沒了視野,任你操作再騷,也要翻車。
果不其然,星際圈流傳的老梗誠不我欺:
玩笑歸玩笑,DeepMind的這次「成果展示」,代表著AI玩家的觸手,已經正式深入到了電子競技領域。
AlphaStar,現已正式約戰世界冠軍serral。機哥對下一場,還是非常期待的。
人類就真的沒有未來麼?我不信。