【TechWeb】1月25日消息,據國外媒體報導,在人機圍棋大戰中打敗柯潔、李世石等一眾圍棋高手之後,谷歌旗下人工智慧公司DeepMind又將人機大戰轉向了電腦遊戲,而在《星際爭霸2》的人機大戰中,谷歌DeepMind的人工智慧程序以10:1的成績完勝人類職業選手。
谷歌DeepMind研發的用於人機對戰的人工智慧程序名為AlphaStar,其挑戰的是兩位《星際爭霸2》的職業玩家「TLO」和「MaNa」,比賽在去年的12月進行,《星際爭霸2》的開發商暴雪和谷歌DeepMind已公布了當時比賽的視頻。
在AlphaStar 與「TLO」和「MaNa」去年的對戰中,使用的是略微過時的《星際爭霸2》版本,這一版本在設計上便於人工智慧程序進行相關的研究。
「TLO」和「MaNa」與AlphaStar各進行了五局比賽,但「TLO」和「MaNa」在比賽中並未佔據優勢,最後的結果都是AlphaStar全勝,對決結果定格在了尷尬的10:0。
在所公布的比賽視頻中,谷歌DeepMind推出了一個新版本的AlphaStar,與「MaNa」進行比賽,新推出的AlphaStar對視野進行了限制,「MaNa」也得以發現的AlphaStar的部分不足並最終也戰勝了它,用一局勝利為人類職業玩家挽回了一絲顏面,AlphaStar也在與職業玩家的對戰中首嘗敗績。
在與AlphaStar進行對戰的視頻中,「TLO」曾表示他有信心戰勝AlphaStar,但不曾想後者在五局中全部獲勝,而且每次都採用了完全不同的策略。
「TLO」之後的「MaNa」,在比賽中也拼盡全力,但並未擺脫與「TLO」相同的命運,他在與AlphaStar的五局比賽中也均已失敗告終。
外媒在報導中表示,人工智慧程序在電腦遊戲方面存在較多的優勢,包括「TLO」和「MaNa」在內的職業玩家,玩電腦遊戲時每分鐘的滑鼠點擊量方面存在理論上的限制,而人工智慧程序則沒有這方面的限制。
其次,外媒在報導中表示,人工智慧程序的反應時間約為350毫秒,AlphaStar在反應速度方面比大多數的職業玩家要慢一些,但在通過大量的訓練之後,人工智慧程序變得更聰明,更有效率的決定彌補了反應時間方面的不足,這也是人工智慧程序在遊戲中的一大優勢。
其三,雖然古語有「眼觀六路耳聽八方」,歷史上也不乏視野開闊的高手的傳說,但在遊戲中,這一點對職業玩家並不太適用,反而更適用於人工智慧程序,相關的技術使其對遊戲全部區域有更好的掌控,人類玩家則需要花費時間關注不同的區域。
AlphaStar對遊戲全部區域有更好的掌控能力這一點,在其與「MaNa」的最後一局中也得到了印證,在那一局中,谷歌DeepMind對新推出的AlphaStar進行了視角方面的限制,在對所進行遊戲的全部區域的注意力方面就不再有明顯的優勢,「MaNa」也就有時間發現AlphaStar的缺點並最終戰勝它。
AlphaStar在《星際爭霸2》方面的技能,來自於開發商DeepMind對其進行的深度訓練,DeepMind回放了大量人類玩家遊戲時的視頻,也是基於相關的數據訓練神經網絡,在持續一周的時間裡,AlphaStar玩了相當於200年的《星際爭霸2》。
AlphaStar目前在遊戲方面的水平及超快的學習能力,對《星際爭霸》方面的職業玩家來說並不是個好消息,但也不全是壞消息,職業玩家也能從中學到部分有用的策略,畢竟AlphaStar通過訓練所積累的遊戲經驗遠高於職業玩家。