DeepMind AI 想要在《星際爭霸》打贏人類,還是太天真了

2021-03-04 品玩

AI：電腦騎臉你叫我怎麼輸？

在 AlphaGo 戰勝了韓國圍棋棋手李世石後，DeepMind 創始人戴密斯·哈薩比斯（Demis Hassabis）就曾表示將研究以人工智慧與人類玩其他遊戲，例如即時戰略遊戲《星際爭霸》。不過目前看來，DeepMind AI 要跟人類比賽打《星際爭霸》這事，還是有點兒懸。

早在 2015 年，DeepMind AI 就開始用已經雅達利 1977 年發行的遊戲機 Atari 2600 來進行遊戲訓練，整個訓練過程團隊沒有提供任何額外信息幫助，全依靠 AI 自己來一步步學習如何打怪升級。在這些遊戲裡，有一款遊戲始終讓 DeepMind AI 很苦惱，那就是《Montezuma’s revenge》，這是雅達利一款難度超高的遊戲。

後來團隊找到了「好奇心」激勵機制，來讓 DeepMind AI 獲勝。他們給 AI 變成編程輸入「人工好奇心」，在 AI 探索更多的玩法的時候給予它更多的獎勵，鼓勵它去用不同的途徑來獲取更高的分數。在新版本裡，DeepMind AI 在好奇心的驅動下探索了 15 個房間的遊戲。在沒有好奇心的時候，它只玩了 2 個房間。

今年 3 月底，在 AlphaGo 五局四勝贏了李世石之後，暴雪娛樂製作總監 Tim Morten 就在 WCS 中國區總決賽上確認，DeepMind AI 將挑戰《星際爭霸 2》，當時 Tim Morten 就直言 DeepMind AI 不會在《星際爭霸 2 》中戰勝人類。直接目前，這一場人機遊戲爭霸戰，官方都沒透露更多的細節。

實際上，《星際爭霸》作為一款即時戰略類的遊戲，給 DeepMind 的挑戰比圍棋更大。單單是對戰局面的數據獲取方面，兩者就相差巨大。圍棋棋盤上就只有數量不等的黑白兩色棋子作為數據，而遊戲中則包括了雙方兵力數量、兵種構成、能力屬性、時間等等等。另外作為即時戰略遊戲，《星際爭霸》需要在極短時間內執行策略，而圍棋相對來說則有充足的時間給 AI 運算思考。

目前，DeepMind AI 想要打贏《星際爭霸》還是需要更長的時間學習和摸索。

本文摘選自PingWest中文網，未經許可禁止轉載

人工智慧會突然「抽風」嗎？

點擊閱讀原文或下面圖片，馬上知曉

回覆你感興趣的關鍵詞

立即獲得關於TA的更多信息！

Uber丨特斯拉丨google丨魅族丨beats丨

Twitter丨360丨小米丨亞馬遜丨魔獸世界丨

相關焦點

Deepmind AI在《星際爭霸2》血虐99.8%人類,登頂宗師段位

能夠和玩家匹敵的電腦AI往往被分配有超越玩家的資源，比方說《紅警》裡面打十家冷酷的敵人，或是在《魔獸爭霸》裡打令人發狂的電腦，電腦AI的優勢僅來自於遠超玩家的資源和造兵速度，或是對AI取消戰爭迷霧等種種作弊。這種時候，人類玩家的常見贏法，要不然是通過自己的精心磨練的遊戲水平硬剛，要不然就是利用電腦套路的缺陷「走後門」。
谷歌DeepMind《星際爭霸》AI負責人即將來華!人類選手4-0完勝AI恐成絕唱

因為 AI 界認為，人工智慧要掌握《星際爭霸》異常困難。去年，AlphaGo 以壓倒性優勢戰勝李世乭之後，AI 又在西洋棋和雅達利（Atari）的遊戲中有所斬獲，人們開始將注意力轉移到《星際爭霸》這類即時戰略遊戲上。在圍棋中，由於人工智慧和人類玩家能看到棋盤，所以他們有時間來思考及制定策略。
剛剛,星際爭霸2人類1:10輸給AI!DeepMind 「AlphaStar」橫空出世,兩周內進化神速

TLO 在演示中表示，他覺得自己還是可以贏的，如果能夠有更多的訓練時間，對 AlphaStar 有更多的了解，是一定可以找到 AlphaStar 弱點，然後獲勝的。隨後登場的是 Liquid 戰隊 MaNa，作為排名 19 的神族選手，他比 TLO 更加強大。
DeepMind攜手暴雪發戰帖:周五直播AI打星際II,發布研究新進展

Twitchhttps://www.twitch.tv/starcraftYouTube：https://www.youtube.com/c/deepmind暴雪在最近的BlizzCon上，總結了自己2018年的工作，並相當低調地發布了「與DeepMind合作正在繼續」的更新：
AI擊敗星際爭霸職業玩家

據稱，該系統是迄今為止同類系統中最複雜的。在DeepMind上月舉行的一系列比賽中，AlphaStar成為世界上第一個在沒有任何遊戲限制的情況下擊敗職業人類玩家的AI。星際爭霸2極其複雜，這次勝利是AI的一個重要的裡程碑。與西洋棋和圍棋不同的是，這款遊戲提供了一個所謂的不完美的信息遊戲環境，其中某些關鍵細節被隱藏。這使得它在概念上更類似於AI模型在用於實際應用程式時必須處理的任務。
DeepMind AlphaStar星際爭霸2首秀:Demo很強大,現場比賽竟然輸了

除了 Dota2、王者榮耀這樣的 Moba 類遊戲，星際爭霸因其豐富的多層次遊戲機制，對於人工智慧研究來說也是一個再理想不過的環境。過去一年，機器之心報導了眾多機構在星際爭霸、星際爭霸 2 上的 AI 研究成果。而我們所熟知的 DeepMind，在圍棋項目結束之後也成為了 AI+星際爭霸研究的主力之一。
星際爭霸任一種族,戰網狂虐99.8%人類玩家

不同於圍棋，《星際爭霸Ⅱ》是一款即時戰略而非回合制的遊戲，玩家的信息隱蔽性和移動自由性較圍棋更高。之後，Deepmind設立了更宏偉的目標：在不設限制的情況下，以Grandmaster級別玩一場完整遊戲。
人類又被AI碾壓,這次是星際爭霸

那時人們都絕望地說，在圍棋上，人類可能再也贏不了AI了。很遺憾，這就是棋類遊戲的現狀。去年，阿爾法狗的終極版AlphaZero，已經在西洋棋、將棋和圍棋三種棋類遊戲中，全面超越人類。DeepMind 與它的阿爾法 AI 大軍，在吊打了各路頂級選手之後，甩下一句話：「下次我們想試試打星際爭霸。」
從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!

Deepmind最初由三名科學家聯合創辦，就像其創始人兼CEO哈薩比斯（Demis Hassabis）所說的，它的性質更像一個科技研究院而不是創業公司，因為公司一開始並沒有任何產品，而是一直在通過遊戲來研究人工智慧算法。在被谷歌收購前，Deepmind通過人工智慧的無監督學習算法打爆了57個atari遊戲，即八九十年代國內也很流行的小霸王卡帶遊戲。
【星際】星際爭霸人類AI對抗賽職業選手完爆最強人工智慧

」，這就是在昨日世界首屆人類與星際爭霸AI對抗賽上發生的事。在接連兩位學生選手敗在遊戲AI之手後，韓國著名星際爭霸選手、星際四皇「司令」 Stork 登臺振臂一呼，最終通過四場連勝將AI殺得潰不成軍。本次比賽由韓國首爾世宗大學牽頭舉辦，地點位於學校的一間禮堂會議室。現場座無虛席擁擠著大學生，都是為了見證職業玩家與世界第一遊戲人造智能的勝者而來。
10:1,AlphaStar橫空出世,碾壓星際爭霸2人類職業玩家 TLO 和 MaNa

另外10場比賽，代表人類出戰的是職業選手TLO和MaNa。兩位選手分別與AlphaStar打了五場。如果說與TLO對戰時AlphaStar還是萌新的話，那麼與MaNa的對戰則完全顯示出了其戰術的老辣。畢竟，兩個比賽才相隔2周，AI 自學成才的能力已經初步顯示了可以超越人類極限的潛力。
DeepMind AlphaStar:Demo很強大,但比賽輸了

星際爭霸還有其他吸引研究者的方面，比如每天在線競爭的大量狂熱玩家。這保證了有大量的遊戲記錄數據可以學習，以及大量可與智能體競爭的優秀人類對手。甚至星際爭霸的操作空間也是一個挑戰，可從超過 300 種操作中做選擇，相比之下 Atari 遊戲只有 10 種操作選擇（例如，上下左右等）。在此之上，星際爭霸中的操作是層級的，能夠進行調整、增強，有很多遊戲單位需要點擊屏幕控制。
AI大獲全勝?DeepMind 被質疑,幹翻星際2人類選手全靠手速?

DeepMind表示，自己能夠贏，全靠策略。但這個說法，遭到了大量的質疑，無論是的Reddit和Twitter上，還是知乎和微博上，大多人都持有的觀點是：AlphaStar能贏，全靠手速。雖然這種情況沒有持續多久，但手速快慢以及精確度，對於星際2太重要了。在這些質疑中，有一篇文章引發了很多人的關注，Medium上的鼓掌超過了1.3K，Reddit上的Vote也已經逼近700。
當 AI 打起星際爭霸2來,連毒奶色也救不了你!

而後在現場演示中MaNa拿下一局，讓AlphaStar在與人類職業玩家的對戰中首嘗敗績。DeepMind 終於帶來了在《星際爭霸 2》中研發了超過 2 年的人工智慧系統：AlphaStar 以及它的全球首秀。自從兩天前暴雪和 DeepMind 在社交媒體上公布這場在線直播後，就引起世界上許多 AI 社區、AI 領域的專家、開發者和遊戲社區知名人士的關注。
【星際】人類VS人工智慧!世界首屆星際爭霸人機AI大賽來襲

以下內容轉自查爾星港：韓國首爾世宗大學官方近日宣布，將於2017年10月31日下午1:00至4:00在大會堂大廳舉行世界首個人類與星際爭霸這場較量將是迄今為止人類與AI最早的遊戲對決，屆時韓國星際人類選手將登場挑戰世宗大學研發的最新版人工智慧機器人。《星際爭霸》在韓國取得了非凡的成就，被譽為國民娛樂，與傳統運動競賽相媲美。同時谷歌 DeepMind 在造就圍棋屆無敵的 AlphaGo 後，宣布與暴雪合作挑戰下一個對手《星際爭霸2》，這一舉動也讓星際遊戲AI成為了人工智慧研究方向的熱點。
在圍棋界戰勝人類後,AI要挑戰《星際爭霸II》了!

2》的API，讓DeepMind開發的AI學習玩耍《星際爭霸2》。（誤）然而，蝦丸君聽說AlphaGo要進軍星際2之後，深深地為人類選手們擔憂了起來……在AI面前，我們先發的這「60人口」優勢，會轉瞬間煙消雲散嗎？DeepMind默默地表示，其實他們即將進行的是一場科學研究，只不過不太一樣啦。他們希望以此來推進AI研究的邊界，從而開發新的程序讓AI學習解決任何複雜的問題——而且人類無需事先告知AI應該如何去解決。
雖然打星際輸給了AI,但人類尚未一敗塗地

《星際爭霸2》的職業選手迎來了在人工智慧面前的第一次慘敗。北京時間1月25日凌晨，谷歌旗下人工智慧團隊DeepMind公布了其開發的AI「AlphaStar」與《星際爭霸2》職業選手TLO和MaNa的比賽錄像。AlphaStar與兩人的比賽相隔約半個月，以兩場「5：0」取得完勝。
世界首個人類與《星際爭霸》AI的對抗賽不日展開丨龍門茶社

本月19日DeepMind團隊公布AlphaGo Zero更是以100：0戰勝了AlphaGo，引得柯潔感嘆：對於AlphaGo的自我進步來講，人類太多餘了……雖然人機對弈已經落下了帷幕，但近日韓國首爾世宗大學官方宣布：將於2017年10月31日下午1:00至4:00在大會堂大廳舉行世界首個人類與《星際爭霸》AI的對抗賽。
Google DeepMind 團隊發布新算法,下一個被 AI 虐哭的是誰?

你冬練三九夏練三伏，別人一出世就自帶超強自學能力，而且人家全家輸的次數屈指可數，還都是輸給自己人，你說這比賽讓人怎麼打？平心而論，再早之前「深藍」就已經深深傷過棋手們的心，各類智力比賽和遊戲當中，圍棋可以說是難度非常高的了，本以為圍棋 324 格棋盤生出千萬般變化能夠守住人類的陣地，結果 AlphaGo 虐哭柯潔， Alpha Zero 還說「我能自己學」，MuZero 說「我能自己學，還不需要規則」，就像 AI 世界裡的葉問，一個馬步攤手，豪氣發問：「我要打十個，還有誰？」
2018 AIIDE星際爭霸AI全球挑戰賽結果出爐!中科院季軍,三星拔得頭籌

星際爭霸遊戲是一款經典的即時戰略（RTS）遊戲，自 1998 年發行以來在全球範圍內備受歡迎。星際爭霸 AI 競賽自 2010 年出現後，每年都會舉行，且參與者越來越多。參賽者提交星際爭霸 AI bot，這些人工智慧體將在《星際爭霸：母巢之戰》零售版中互相格殺。

DeepMind AI 想要在《星際爭霸》打贏人類,還是太天真了

相關焦點

Deepmind AI在《星際爭霸2》血虐99.8%人類,登頂宗師段位

谷歌DeepMind《星際爭霸》AI負責人即將來華!人類選手4-0完勝AI恐成絕唱

剛剛,星際爭霸2人類1:10輸給AI!DeepMind 「AlphaStar」橫空出世,兩周內進化神速

DeepMind攜手暴雪發戰帖:周五直播AI打星際II,發布研究新進展

AI擊敗星際爭霸職業玩家

DeepMind AlphaStar星際爭霸2首秀:Demo很強大,現場比賽竟然輸了

星際爭霸任一種族,戰網狂虐99.8%人類玩家

人類又被AI碾壓,這次是星際爭霸

從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!

【星際】星際爭霸人類AI對抗賽 職業選手完爆最強人工智慧

10:1,AlphaStar橫空出世,碾壓星際爭霸2人類職業玩家 TLO 和 MaNa

DeepMind AlphaStar:Demo很強大,但比賽輸了

AI大獲全勝?DeepMind 被質疑,幹翻星際2人類選手全靠手速?

當 AI 打起星際爭霸2來,連毒奶色也救不了你!

【星際】人類VS人工智慧!世界首屆星際爭霸人機AI大賽來襲

在圍棋界戰勝人類後,AI要挑戰《星際爭霸II》了!

雖然打星際輸給了AI,但人類尚未一敗塗地

世界首個人類與《星際爭霸》AI的對抗賽不日展開丨龍門茶社

Google DeepMind 團隊發布新算法,下一個被 AI 虐哭的是誰?

2018 AIIDE星際爭霸AI全球挑戰賽結果出爐!中科院季軍,三星拔得頭籌

【星際】星際爭霸人類AI對抗賽職業選手完爆最強人工智慧