終極人機大戰要來了?AI打星際2即將直播,DeepMind暴雪發出神秘預告

2021-02-26 量子位
乾明 嶽排槐 發自 凹非寺
量子位 出品 | 公眾號 QbitAI

要出大事了。

剛剛,DeepMind和暴雪聯合宣布,北京時間周五凌晨2點,公開展示AI打《星際爭霸II》(下稱星際2)的新進展!

屆時,將會在星際的Twitch頻道和DeepMind的Youtube頻道進行直播。

DeepMind CEO哈薩比斯說,星際2是一款複雜的實時戰略遊戲,對AI來說是一個長期的巨大挑戰。我們將展示我們的進步!你肯定不想錯過直播! :-)

消息一經放出,便在推特上引發了近千條轉發,以及激烈的討論。

不少網友都紛紛表示,要看!哪怕是上了一天班之後,熬夜也要看!絕對不容錯過。

甚至在Reddit論壇上給自己設提醒:兩天後提醒我!42小時後提醒我!

更有網友當場「深情表白」:當DeepMind宣布他們開始打星際的時候,我也開始玩了,只是為了更好地欣賞這種深奧的技術。

在一些人看來,這是一個時代的結束。最初,它們是為了我們的象棋&圍棋,現在是為了我們的星際爭霸。

怎樣迎接這樣的一個時代?有人說自己已經感覺到恐懼了。也有人為DeepMind的發展制定了規劃:第一步,精通星際;第二步,精通魔獸世界;第三步,精通企業戰略諮詢。

也不乏有好事者評論道,它跟OpenAI打Dota的AI相比怎麼樣?放一起「幹架」肯定很精彩。

好事者問道:2019年DeepMInd和OpenAI會來一場嗎?

不過,也有一些網友不服,表示如果DeepMind能夠打贏職業選手,當場吃鞋!還引發了其他網友的附和。

還有專業的網友,在猜測DeepMind攻剋星際2究竟用了什麼技術。大家也可以一起來猜一猜,下面是他列出的選項:

AI打星際2難在哪裡

2016年11月暴雪嘉年華上,DeepMind工程師宣布了訓練AI打星際2的計劃。算起來到現在已經兩年多了。

DeepMind與暴雪合作的目標之一,就是開發一套足夠好的人工智慧系統,使之可以擊敗星際2人類選手。就像AlphaGo擊敗李世乭、柯潔一樣。

然而,最終的目標是將其中使用的技術應用到現實世界,而不是讓它始終停留在遊戲裡面。

「我們正在試圖理解人類以及我們大腦的工作方式。」暴雪首席軟體工程師Jacob Repp此前說,「如果我們能夠得到這種高質量的數據流——人類玩遊戲時的原始輸入以及由此產生的結果——那就能成為研究人們行為的有用數據。」

對人工智慧研究人員來說,星際2是個頗為有趣的挑戰。

與西洋棋或圍棋不同,星際玩家面對的是不完美信息博弈。「戰爭迷霧」意味著玩家的規劃、決策、行動,要一段時間後才能看到結果。

DeepMind團隊負責人Oriol Vinyals說,在星際2裡一個玩家可能看到對手的偵察兵,然後又消失在視野中。對人工智慧來說,記住他們遇到的東西,並且理解這可能表明敵人正在某個地方修建基地,這種記憶不僅需要保存,還要在未來針對某個信息調取出來。

「在星際2中,這非常重要,但卻很微妙,可以將未來與過去聯繫起來。」他說,「很難建立因果關係,因為遊戲中會發生很多事情。」

連著名的AlphaGo「人肉臂」黃士傑,也已經轉到星際2的項目中。很多人認為在即時戰略遊戲中,AI的反應速度會成為極大的優勢,但事實並非如此。

黃士傑此前解釋稱,圍棋只有361個落子點,對AI來說全部遊戲內容都是可見的。但星際2遊戲有大量全黑的地圖,玩家需要探索地圖以及偵查對手動向,才能制定相應的策略。

幾乎每次滑鼠移動,都能視為一次落子。這種不確定性讓星際2對AI來說,難度比圍棋要高很多。

這有一段6分鐘的視頻,配好了中文字幕,能更直觀一點的解釋AI打星際2到底是怎麼回事。

其中重點提到了AI打星際的三大難題:

1、不完美信息博弈

2、需要同時控制上百個單位

3、最難的是,需要制定長期策略

星際2的AI大戰進展

為了教AI打星際2,暴雪和DeepMind在2017年8月,發布了星際2中加速AI研究的工具SC2LE。GitHub的傳送門在這裡:https://github.com/Blizzard/s2client-proto

工具包推出同時,他們還開源了一套星際2的迷你遊戲,是星際2部分操作的抽象產物,AI能從中練習移動、採礦、建造單位等等技能。

到2018年6月,DeepMInd終於宣布,用關係性深度強化學習搞定了這些小遊戲,在六個小遊戲中達到了當前最優水平,其中4個還超過了大師級人類玩家。

想更深入了解可以閱讀這篇論文:
Relational Deep Reinforcement Learning
https://arxiv.org/abs/1806.01830

不過,在星際2上有野心的不止DeepMind。

去年9月,騰訊AI Lab發布論文稱,他們構建的AI首次在完整的蟲族VS蟲族比賽中擊敗了星際2的內置機器人Bot。雖然不是嚴格意義上的「自學」,AI還高度依賴人為歸納的信息,但迄今為止,這是我們在星際2項目上見到的最有建樹的成果之一。

騰訊實際上開發了兩個AI,基於扁平化動作結構的深度強化學習智能體TStarBots1,和基於分層動作結構規則控制器的智能體TStarBots2。

這兩個AI都能在完整對戰中擊敗等級1~10的遊戲內置機器人(1v1蟲族對抗,地圖:深海暗礁🔱),其中等級8、等級9和等級10的機器人都是作弊級AI,它們享有額外的視野和晶體礦、氣礦資源。

TStarBots1擁有一系列扁平化的大型操作,在這個基礎上,它用強化學習訓練智能體採取策略;而TStarBots2的操作控制也是人為編碼的,但它有可以自行組合的大型、小型混合層次化操作集。

另外去年11月,塔爾圖大學也開源發布了星際2深度強化學習(DRL)智能體Reaver。這種模塊化的框架主要用於訓練星際2的各種任務,提供比大多數開源解決方案更快的單機環境並行化能力。

Reaver可適應多種環境,除了用於星際2的SC2LE外,還支持其他強化學習任務上常用的Gym、Atari和Mujoco。它用簡單的Keras模型來定義神經網絡,配置和共享配置也非常方便。

最重要的是,Reaver的訓練規模親民到爆炸。在普通的4核CPU的筆記本電腦上,每秒採樣率可以達到5K,10秒內就能學會那個立杆子的遊戲CartPole-0。

實際上,還有一批人在研究如何用AI攻剋星際(不是星際2)。

如果你感興趣,可以看看我們此前的報導,這裡不贅述了。

最後,附上直播地址,別忘了定鬧鐘哦~

Twitch上的星際頻道:
https://www.twitch.tv/starcraft

DeepMind的YouTube:
https://www.youtube.com/c/deepmind

量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

相關焦點

  • 教AI打星際2也不難,試試暴雪和DeepMind的工具包 | 附論文+代碼
    安妮 編譯整理量子位 出品 | 公眾號 QbitAI去年年底,DeepMind宣布想教會AI智能體玩《星際爭霸2》(後簡稱星際
  • DeepMind聯手暴雪:星際II的玩家們,準備好對抗AI了嗎(附論文)
    用阿爾法狗徵服了圍棋界的DeepMind正把目光投向遊戲界:今日凌晨,DeepMind官網發布消息,已正式與暴雪娛樂合作,共同開發可以在星際爭霸II中與人類玩家對抗的AI,並且發布了SC2LE,一個旨在加速即時戰略遊戲當中AI應用的工具集。
  • 揭秘星際2人工智慧AlphaStar:DeepMind科學家回應一切
    例如:對於 AI 研究者來說,打星際 2 的能力是不是應該寫進簡歷裡?網友 NexYY:我應該把會打星際爭霸 2 作為一項技能寫在簡歷裡證明我是一個有抱負的 AI 開發者嗎?有時我沉迷於打星際,而不是提高寫代碼的能力,我常常因此感到迷茫……Oriol Vinyals:在比賽那天我打了好多盤星際,我得說這是非常好的體驗——特別是考慮到它塑造了我在人工智慧、學習計算機科學等方面的動力。所以如果你想完成一個好簡歷,請把星際爭霸 2 當做一個愛好寫進去,祝你好運!
  • 多圖詳解 DeepMind 的超人類水準星際爭霸 AI 「AlphaStar」
    雖然都是 RTS (即時戰略)遊戲,雖然都需要在收集資源和打架之間找到平衡,但星際和 DOTA2 也有不少區別。星際中需要控制多種不同類型的單位,這些單位有各自的運動和攻擊特點,而 DOTA2 中可以從頭到尾只控制同一個英雄;星際中每一方只有一位玩家,而 DOTA2 中每一方有五位玩家。
  • 新的一年,DeepMind準備讓AI學會「放煙花」
    選自marcgbellemare機器之心編譯參與:王淑婷、賈偉、李澤南在星際爭霸 2 的首場「人機大戰」結束後不久,DeepMind 又宣布即將投身另一個遊戲「煙花」。與以往不同的是,這是一款非完整信息、多人合作的遊戲。
  • 【暴雪】星際2有你們真好!2017WCS暴雪電競盛宴下的粉絲
    以下內容轉自 查爾星港:10月初,暴雪在2017年的嘉年華預告中悄悄公布了這樣一條消息
  • DeepMind人工智慧在《星際爭霸2》人機對戰中完勝職業玩家
    【TechWeb】1月25日消息,據國外媒體報導,在人機圍棋大戰中打敗柯潔、李世石等一眾圍棋高手之後,谷歌旗下人工智慧公司DeepMind又將人機大戰轉向了電腦遊戲,而在《星際爭霸2》的人機大戰中,谷歌DeepMind的人工智慧程序以10:1的成績完勝人類職業選手。
  • 這樣的星際給我來一打
    終於暴雪要發行星際重置版,注意是星際重置版不是星際2,星際2完全是另外一個遊戲。我覺得哪些年罵人遺老的S屌可以閉嘴了。下面韋德給大家總結以下到目前為止關於重置版得相關信息的理解和一些問題。記住韋德看東西不會用一個靜態視角,所以文章中有很多東西說的都是可能性,如果有不愉快的地方請考慮這點。
  • 對話暴雪聯合創始人莫漢:阿爾法狗挑戰星際爭霸,我猜人類贏
    賽後,AlphaGo的研發團隊DeepMind的創始人戴密斯·哈薩比斯(Demis Hassabis)暗示,暴雪娛樂製作發行的電子競技遊戲《星際爭霸2》很有可能是AlphaGo的下一個目標。一時間《星際爭霸2》的高手們開始躍躍欲試,認為一定可以在《星際爭霸2》上為人類挽回顏面,谷歌真的已經對《星際爭霸2》的製作方下達戰書了嗎?
  • 暴雪雜談:星際爭霸系列及RTS對暴雪的重要意義
    今天回過頭去看,《星際爭霸》的成功對暴雪還有著特殊的意義:1、《星際爭霸》的成功讓暴雪走向全球,特別是點燃韓國的電競之火;2、《星際爭霸》是暴雪首個在特定領域最成功的遊戲;3、從《星際爭霸》開始,「平衡性」補丁成為暴雪遊戲不可分割的一部分。
  • AI研究的提速器! DeepMind力薦的JAX到底有多強大?
    工程團隊還發現 ,最重 要的是保證每 個庫 都 有明 確的定義範圍,並確保它們之間可以相互調用但保持獨立。 此外, 還需要具有增量復用的能力,具有可選擇而不被其他功能鎖定的能力。 這些要素至關重要,有助於為研究人員提供最大程度的靈活性與選擇性。
  • 暴雪遊戲遭遇AI「實力」坑隊友:四處遊走,還不參與戰鬥
    一個月前在《星際爭霸 II》中輕鬆戰勝人類職業選手的 AlphaStar(在 APM 限制為 180 的條件下,以總比分 2:0 分別戰勝兩位職業人類選手),正是來自與暴雪宣布合作的 DeepMind。早在 2016 年 11 月,DeepMind 就宣布與暴雪在《星際爭霸 II》中合作開展機器學習的相關研究。
  • 暴雪爸爸發大招:瓦王活了、暗黑1回來了、爐石又要剁手了…
    導讀一年一度的暴雪嘉年華在安納海姆會議中心隆重開啟,我們一起來看看暴雪為全世界的玩家們帶來了哪些消息。
  • 斯坦福初創公司發力AI硬體,DeepMind刪除神經元了解深度學習
    __biz=MjM5MTQzNzU2NA==&mid=2651658559&idx=2&sn=8d5ac8dcd0c2d5d35a7c5b03c0af26d8&scene=21#wechat_redirectSambaNova System為AI硬體募集5600萬美元來源:TECHCRUNCH.COM連結:
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    鄭集楊 發自 凹非寺量子位 報導 | 公眾號 QbitAI一早醒來,發現搞蛋白質結構研究的朋友都在紛紛自嘲:要失業了。啊這,怎麼回事?原來是結構生物學,迎來了一個「革命性」的突破。
  • 暴雪將推出首款《暗黑破壞神》手遊,War3重製版也要來了
    故事背景設置在第二代和第三代中間的二十多年內,世界之石被毀後,暗黑破壞神中的世界發生了什麼,犧牲自我的天使泰瑞爾境遇如何,暗黑3中出現的新角色莉亞是怎樣來的,這些此前沒有詳細交代的細節都會在手遊中逐一揭曉。
  • 玩家請願不要停止《星際爭霸2》更新:暴雪無動於衷
    《星際爭霸2》推出已經10年了了,而暴雪也是做了一個決定,停止對它的更新。雖說在這樣的一個大時間點,但暴雪並沒有給喜歡這款遊戲的玩家帶來好消息,相反給出的公告稱,《星際爭霸2》將停止付費內容更新,僅保留必要的PVP平衡性調整。
  • 【星際】有意洩露?暴雪暗示星際爭霸2合作新英雄為米拉·韓
    2017暴雪嘉年華的新版海報。值得留意的是在五位登場海報的遊戲人物:吉安娜、死靈法師、馬圖、普羅比斯以及末日鐵拳中,除了代表《風暴英雄》的普羅比斯外,官方並沒有列出《星際爭霸2》的代表人物。暴雪嘉年華海報而就在玩家一度以為暴雪設計師在畫海報時是不是遺忘了星際時,官方在近日的暴雪商城中上架了今年 Blizzcon 的周邊產品,令人驚奇的是,在海報、馬克杯、T恤等等產品的圖案中,突然多出了一個
  • 人機大戰:谷歌AlphaStar《星際爭霸2》10比1勝人類
    今早DeepMind與暴雪公布了星際爭霸2遊戲的最新人機大戰況,Google Allo的AlphaStar10比1勝人類兩位職業選手。
  • 【星際】經典歸來!《星際爭霸:重製版》現已登陸國服暴雪戰網
    穿越20年的暴雪即時戰略(RTS)經典之作《星際爭霸:重製版》從8月30日起將正式入駐國服暴雪戰網。還記得曾經的宿舍大戰嗎?還記得戰役裡波瀾壯闊的艾爾之戰嗎?還記得飛龍甩尾、矩陣閃電這樣的極限操作嗎?《星際爭霸》作為一款誕生於20年前的經典之作,承載了那個時代關於遊戲、電競太多的回憶。20年過去,《星際爭霸》重製歸來,再次將我們帶回那個恢弘史詩的太空世界。