AI:電腦騎臉你叫我怎麼輸?
在 AlphaGo 戰勝了韓國圍棋棋手李世石後,DeepMind 創始人戴密斯·哈薩比斯(Demis Hassabis)就曾表示將研究以人工智慧與人類玩其他遊戲,例如即時戰略遊戲《星際爭霸》。不過目前看來,DeepMind AI 要跟人類比賽打《星際爭霸》這事,還是有點兒懸。
早在 2015 年,DeepMind AI 就開始用已經雅達利 1977 年發行的遊戲機 Atari 2600 來進行遊戲訓練,整個訓練過程團隊沒有提供任何額外信息幫助,全依靠 AI 自己來一步步學習如何打怪升級。在這些遊戲裡,有一款遊戲始終讓 DeepMind AI 很苦惱,那就是《Montezuma’s revenge》,這是雅達利一款難度超高的遊戲。
後來團隊找到了「好奇心」激勵機制,來讓 DeepMind AI 獲勝。他們給 AI 變成編程輸入「人工好奇心」,在 AI 探索更多的玩法的時候給予它更多的獎勵,鼓勵它去用不同的途徑來獲取更高的分數。在新版本裡,DeepMind AI 在好奇心的驅動下探索了 15 個房間的遊戲。在沒有好奇心的時候,它只玩了 2 個房間。
今年 3 月底,在 AlphaGo 五局四勝贏了李世石之後,暴雪娛樂製作總監 Tim Morten 就在 WCS 中國區總決賽上確認,DeepMind AI 將挑戰《星際爭霸 2》,當時 Tim Morten 就直言 DeepMind AI 不會在《星際爭霸 2 》中戰勝人類。直接目前,這一場人機遊戲爭霸戰,官方都沒透露更多的細節。
實際上,《星際爭霸》作為一款即時戰略類的遊戲,給 DeepMind 的挑戰比圍棋更大。單單是對戰局面的數據獲取方面,兩者就相差巨大。圍棋棋盤上就只有數量不等的黑白兩色棋子作為數據,而遊戲中則包括了雙方兵力數量、兵種構成、能力屬性、時間等等等。另外作為即時戰略遊戲,《星際爭霸》需要在極短時間內執行策略,而圍棋相對來說則有充足的時間給 AI 運算思考。
目前,DeepMind AI 想要打贏《星際爭霸》 還是需要更長的時間學習和摸索。
本文摘選自PingWest中文網,未經許可禁止轉載
人工智慧會突然「抽風」嗎?
點擊閱讀原文或下面圖片,馬上知曉
回覆你感興趣的關鍵詞
立即獲得關於TA的更多信息!
Uber丨特斯拉丨google丨魅族丨beats丨
Twitter丨360丨小米丨亞馬遜丨魔獸世界丨
.
更多精彩,敬請長按關注