終極人機大戰要來了?AI打星際2即將直播,DeepMind暴雪發出神秘預告

2021-01-21 量子位
乾明 嶽排槐 發自 凹非寺
量子位 出品 | 公眾號 QbitAI

要出大事了。

剛剛,DeepMind和暴雪聯合宣布,北京時間周五凌晨2點,公開展示AI打《星際爭霸II》(下稱星際2)的新進展!

屆時,將會在星際的Twitch頻道和DeepMind的Youtube頻道進行直播。

DeepMind CEO哈薩比斯說,星際2是一款複雜的實時戰略遊戲,對AI來說是一個長期的巨大挑戰。我們將展示我們的進步!你肯定不想錯過直播! :-)

消息一經放出,便在推特上引發了近千條轉發,以及激烈的討論。

不少網友都紛紛表示,要看!哪怕是上了一天班之後,熬夜也要看!絕對不容錯過。

甚至在Reddit論壇上給自己設提醒:兩天後提醒我!42小時後提醒我!

更有網友當場「深情表白」:當DeepMind宣布他們開始打星際的時候,我也開始玩了,只是為了更好地欣賞這種深奧的技術。

在一些人看來,這是一個時代的結束。最初,它們是為了我們的象棋&圍棋,現在是為了我們的星際爭霸。

怎樣迎接這樣的一個時代?有人說自己已經感覺到恐懼了。也有人為DeepMind的發展制定了規劃:第一步,精通星際;第二步,精通魔獸世界;第三步,精通企業戰略諮詢。

也不乏有好事者評論道,它跟OpenAI打Dota的AI相比怎麼樣?放一起「幹架」肯定很精彩。

好事者問道:2019年DeepMInd和OpenAI會來一場嗎?

不過,也有一些網友不服,表示如果DeepMind能夠打贏職業選手,當場吃鞋!還引發了其他網友的附和。

還有專業的網友,在猜測DeepMind攻剋星際2究竟用了什麼技術。大家也可以一起來猜一猜,下面是他列出的選項:

AI打星際2難在哪裡

2016年11月暴雪嘉年華上,DeepMind工程師宣布了訓練AI打星際2的計劃。算起來到現在已經兩年多了。

DeepMind與暴雪合作的目標之一,就是開發一套足夠好的人工智慧系統,使之可以擊敗星際2人類選手。就像AlphaGo擊敗李世乭、柯潔一樣。

然而,最終的目標是將其中使用的技術應用到現實世界,而不是讓它始終停留在遊戲裡面。

「我們正在試圖理解人類以及我們大腦的工作方式。」暴雪首席軟體工程師Jacob Repp此前說,「如果我們能夠得到這種高質量的數據流——人類玩遊戲時的原始輸入以及由此產生的結果——那就能成為研究人們行為的有用數據。」

對人工智慧研究人員來說,星際2是個頗為有趣的挑戰。

與西洋棋或圍棋不同,星際玩家面對的是不完美信息博弈。「戰爭迷霧」意味著玩家的規劃、決策、行動,要一段時間後才能看到結果。

DeepMind團隊負責人Oriol Vinyals說,在星際2裡一個玩家可能看到對手的偵察兵,然後又消失在視野中。對人工智慧來說,記住他們遇到的東西,並且理解這可能表明敵人正在某個地方修建基地,這種記憶不僅需要保存,還要在未來針對某個信息調取出來。

「在星際2中,這非常重要,但卻很微妙,可以將未來與過去聯繫起來。」他說,「很難建立因果關係,因為遊戲中會發生很多事情。」

連著名的AlphaGo「人肉臂」黃士傑,也已經轉到星際2的項目中。很多人認為在即時戰略遊戲中,AI的反應速度會成為極大的優勢,但事實並非如此。

黃士傑此前解釋稱,圍棋只有361個落子點,對AI來說全部遊戲內容都是可見的。但星際2遊戲有大量全黑的地圖,玩家需要探索地圖以及偵查對手動向,才能制定相應的策略。

幾乎每次滑鼠移動,都能視為一次落子。這種不確定性讓星際2對AI來說,難度比圍棋要高很多。

這有一段6分鐘的視頻,配好了中文字幕,能更直觀一點的解釋AI打星際2到底是怎麼回事。

其中重點提到了AI打星際的三大難題:

1、不完美信息博弈

2、需要同時控制上百個單位

3、最難的是,需要制定長期策略

星際2的AI大戰進展

為了教AI打星際2,暴雪和DeepMind在2017年8月,發布了星際2中加速AI研究的工具SC2LE。GitHub的傳送門在這裡:https://github.com/Blizzard/s2client-proto

工具包推出同時,他們還開源了一套星際2的迷你遊戲,是星際2部分操作的抽象產物,AI能從中練習移動、採礦、建造單位等等技能。

到2018年6月,DeepMInd終於宣布,用關係性深度強化學習搞定了這些小遊戲,在六個小遊戲中達到了當前最優水平,其中4個還超過了大師級人類玩家。

想更深入了解可以閱讀這篇論文:
Relational Deep Reinforcement Learning
https://arxiv.org/abs/1806.01830

不過,在星際2上有野心的不止DeepMind。

去年9月,騰訊AI Lab發布論文稱,他們構建的AI首次在完整的蟲族VS蟲族比賽中擊敗了星際2的內置機器人Bot。雖然不是嚴格意義上的「自學」,AI還高度依賴人為歸納的信息,但迄今為止,這是我們在星際2項目上見到的最有建樹的成果之一。

騰訊實際上開發了兩個AI,基於扁平化動作結構的深度強化學習智能體TStarBots1,和基於分層動作結構規則控制器的智能體TStarBots2。

這兩個AI都能在完整對戰中擊敗等級1~10的遊戲內置機器人(1v1蟲族對抗,地圖:深海暗礁🔱),其中等級8、等級9和等級10的機器人都是作弊級AI,它們享有額外的視野和晶體礦、氣礦資源。

TStarBots1擁有一系列扁平化的大型操作,在這個基礎上,它用強化學習訓練智能體採取策略;而TStarBots2的操作控制也是人為編碼的,但它有可以自行組合的大型、小型混合層次化操作集。

另外去年11月,塔爾圖大學也開源發布了星際2深度強化學習(DRL)智能體Reaver。這種模塊化的框架主要用於訓練星際2的各種任務,提供比大多數開源解決方案更快的單機環境並行化能力。

Reaver可適應多種環境,除了用於星際2的SC2LE外,還支持其他強化學習任務上常用的Gym、Atari和Mujoco。它用簡單的Keras模型來定義神經網絡,配置和共享配置也非常方便。

最重要的是,Reaver的訓練規模親民到爆炸。在普通的4核CPU的筆記本電腦上,每秒採樣率可以達到5K,10秒內就能學會那個立杆子的遊戲CartPole-0。

實際上,還有一批人在研究如何用AI攻剋星際(不是星際2)。

如果你感興趣,可以看看我們此前的報導,這裡不贅述了。

最後,附上直播地址,別忘了定鬧鐘哦~

Twitch上的星際頻道:
https://www.twitch.tv/starcraft

DeepMind的YouTube:
https://www.youtube.com/c/deepmind

量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;


此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。


進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

相關焦點

  • 現在,你可以親手調教一個AI,帶它攻陷《星際爭霸2》了!
    AlphaGo的親爹deepmind和暴雪聯手開發了個新的接口,可以訓練AI打《星際爭霸2》了。2. AlphaGo能來得了這個麼?不能,打遊戲比下棋複雜多多多了。3. 這接口分兩個部分,一個是暴雪給AI定做的訓練場,可以讓AI以人類視角進入遊戲;另一個是deepmind打造的「通關攻略」,可以調教AI逐漸變強。
  • 星際爭霸2人類1:10輸給AI!DeepMind 「AlphaStar」進化神速
    這次的演示也是 DeepMind 的星際爭霸 2 AI AlphaStar 的首次公開亮相。除了此前比賽錄像的展示外,AlphaStar 還和 MaNa 現場來了一局,不過,這局AlphaStar 輸給了人類選手 MaNa 。
  • Deepmind AI在《星際爭霸2》血虐99.8%人類,登頂宗師段位
    為何專注於攻剋星際爭霸2?因為極為複雜,高度擬真 星際爭霸是一款暴雪出品的經典即時戰略(RTS)遊戲,以其對戰略思維的超強考驗、精妙的種族平衡性和極強的可玩性著稱,玩家也必須在經濟的宏觀管理和微觀個體的控制之間保持謹慎的平衡。
  • 復盤《星際2》人機大戰:職業高手首次被AI擊敗 5分鐘就潰退
    DeepMind開發的全新AI程序AlphaStar,在今天凌晨的《星際爭霸2》人機大戰直播節目中,輕鬆戰勝2018 WCS Circuit排名13、神族最強10人之一的MaNa。實際上,AlphaStar以10-1的戰績,全面擊潰了人類職業高手。戰敗的不止MaNa,還有另一位高手TLO。
  • > 星際爭霸2
    今天,暴雪發文表示將不再為《星際爭霸2》製作指揮官模式等付費內容,但是賽季更新和平衡調整仍會繼續提供給玩家。 今天(4月29日)中國第一位《星際爭霸2》世界冠軍劉斌(ID:WE.ACE)不幸因病去世,著名的《星際爭霸2》解說黃旭東也在微博中發聲,追悼we.ac...
  • 《星際大戰外傳:韓索羅》完整預告公開
    圖片來自:movieweb.com在超級盃之後,《星際大戰外傳: 韓索羅》完整預告也終於公開,推特上有個每天自問自答「今天韓索羅預告公開了嗎?」的推特帳戶,現在終於可以安心去了wwwww《星際大戰外傳: 韓索羅》將在陣亡將士紀念日(Memorial Day,5月的最後一個星期一)上映,預告終於釋出,,身為星戰迷應該要歡欣鼓舞才對~但是綜合之前拍攝這部電影的一連串風暴,這隻預告簡直正常的太讓人摸不著頭腦了~?
  • 『燒錢機器』DeepMind持續多年虧損後,仍無商業...
    自2014年被收購以來,DeepMind的巨額研發資金和虧損全部由Google來買單。不過在長期虧損之下,今年的DeepMind在財務方面似乎也有了一些好消息。從最新的財務報告來看,雖然其虧損仍在持續擴大,但相比於往年來說,虧損增幅有所減小,同時其營收有明顯增加—2019年收入達2.66億英鎊,相比2018年的1.03億英鎊,可謂翻了一番。
  • 《星際大戰9》要來了!只是能解開預告片中的諸多疑問嗎
    《星球大戰9:天行者崛起》就要來了,但這部電影將是星球大戰系列的最終章,這就意味著延續了42年的星際大戰就要完結了!然而看完了它最新的預告片之後,心中卻生出了諸多疑問。凱洛·倫要回歸光明了?萊婭將軍要殉職了?而預告片中的一句「願原力與你同在,直到永遠。」瞬間讓人起雞皮疙瘩呀!
  • 再創新高:DeepMind一年燒掉6.5億美元,谷歌卻揮手免除15億債務
    這家公司因其大量研究成果被社區所熟知,比如打敗圍棋世界冠軍的 AlphaGo、預測蛋白質結構的 AlphaFold 2 等等。DeepMind 以在圍棋領域戰勝最強人類的 AlphaGo 開始廣為人們所知,2017 年 5 月,當時的世界第一選手柯潔在人機大戰中 0 比 3 落敗。
  • DeepMind、哈佛造出 AI「小白鼠」,窺探神經網絡的奧秘
    同時,他們用神經科學技術來分析小鼠的大腦生物活動,由此來理解神經網絡如何控制小鼠的行為。該論文目前已被 ICLR 2020 大會接收為 Spotlight 論文。 論文連結:https://openreview.net/pdf?
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    鄭集楊 發自 凹非寺量子位 報導 | 公眾號 QbitAI一早醒來,發現搞蛋白質結構研究的朋友都在紛紛自嘲:要失業了。啊這,怎麼回事?原來是結構生物學,迎來了一個「革命性」的突破。
  • 電競「鼻祖」落幕,《星際爭霸2》停更,暴雪終結了一代人的青春
    然而,在距星際爭霸發行23年之際,星際爭霸2停止更新付費內容的公告,僅保留必要的PVP平衡性調整內容。 這個消息雖然在電競圈依然沒有激起多大水花,但仍然有一批忠實的老玩家感受到了「晴天霹靂」!
  • 【萬字長文】即將「逝去」的星際和未曾變老的星際老男孩
    「永別了星際爭霸」「暴雪XXX退錢」「感謝SCBOY多年的陪伴,完結撒花」看到滿屏幕的負能量,黃旭東有些哭笑不得:「我說,你們別這樣,搞的好像星際2要掛了一樣。」從解說比賽,到打星際執政官,再到娛樂打CSGO,一天的直播編排滿滿當當。當最後黃旭東說「睡了拜拜大家」時,直播間已經一片歡樂了,沒人再像剛開始那麼負能量——可能說說玩玩笑笑之後,大家都能安心的睡去了。黃旭東和孫一峰,這兩人搭檔解說、直播已經有7-8年的時間,從15年開始,二人的風格就不再偏向那麼專業,宗旨是「陪大家玩,娛樂的內容更多」。
  • DeepMind新GNN模型,將谷歌地圖預估到達準確率提升50%!
    計劃著和女友約會,按照地圖預計的實時路況做準備,可是卻往往不太準時……眼看著上班就要遲到,明明顯示會在10分鐘後到達的公交車,並沒有如期而至……如果您是拼車服務的司機,地圖還會獲取接送時間信息,並依據此來估計價格。全世界都有類似的煩惱。
  • 繼圍棋後,人類又一大智商高地被Al拿下:升級Alpha星際2狂虐頂級玩家
    DeepMind開發的全新AI程序AlphaStar,在今天凌晨的《星際爭霸2》人機大戰直播節目中,輕鬆戰勝2018 WCS Circuit排名13、神族最強10人之一的MaNa。人工智慧在《星際爭霸2》上的進步速度,遠遠超過了此前外界的預期。畢竟與下圍棋這件事相比,星際2要難得多。
  • 星際爭霸2:合作模式將永久不再更新,暴雪即將放棄星際?
    之前就說了威望系統是透支星際生命力的東西,一堆人不信,對於玩家的可玩內容確實存在透支,畢竟有imba威望,就不回去用弱雞威望了,但對於買斷制遊戲來講還算好,只要騙你花了25塊錢,你玩一下imba威望和玩完全部威望其實差別不大,對玩家的透支頂多是壓死駱駝的一根稻草。
  • 暴雪將推出首款《暗黑破壞神》手遊,War3重製版也要來了
    故事背景設置在第二代和第三代中間的二十多年內,世界之石被毀後,暗黑破壞神中的世界發生了什麼,犧牲自我的天使泰瑞爾境遇如何,暗黑3中出現的新角色莉亞是怎樣來的,這些此前沒有詳細交代的細節都會在手遊中逐一揭曉。 >>>點擊查看視頻
  • 暴雪新項目黑石計劃開啟 頁面顯示《星際爭霸2:蟲群之心》人族標誌
    今天小編給大家帶了個比較酷一點的消息: 去年,暴雪新註冊了域名「黑石計劃」,當時引起媒體猜測或與WOW有關,並有可能是魔獸世界的新一部資料片。就在剛剛,暴雪大中華區總經理戴錦和微博發布了一個黑石計劃的頁面,頁面上顯示了星際2人族的標誌,推測應該與星際爭霸2有關。
  • 被時代遺棄的暴雪:《星際爭霸2》停止付費內容更新
    只不過澤拉圖沒想到的是,終結星際宇宙的不是埃蒙,而是暴雪。《星際爭霸2》的十周年,暴雪正式發出官方公告,宣布今後將停止付費內容的更新,包括合作指揮官、戰爭寶箱等,僅提供賽季更新和必要平衡性調整。消息一出,玩家論壇裡群情激憤。有人無奈,有人憤怒,更多的人則是不理解。
  • 玩家請願不要停止《星際爭霸2》更新:暴雪無動於衷
    《星際爭霸2》推出已經10年了了,而暴雪也是做了一個決定,停止對它的更新。雖說在這樣的一個大時間點,但暴雪並沒有給喜歡這款遊戲的玩家帶來好消息,相反給出的公告稱,《星際爭霸2》將停止付費內容更新,僅保留必要的PVP平衡性調整。