《星際爭霸II》的玩家遭遇了一個非同尋常的對手!

2021-01-18 中國科學技術館

《星際爭霸》遊戲截圖(圖片來源:暴雪遊戲官網)

這個夏天,科幻電子競技遊戲《星際爭霸II》的玩家遭遇了一個非同尋常的對手——AlphaStar。人工智慧AlphaStar由谷歌的人工智慧公司DeepMind開發,於《星際爭霸II》歐洲伺服器上線,之後登上宗師(Grandmaster)段位,排在該地區九萬名玩家中的前0.15%。

這一項結果發表於《自然》(Nature)雜誌。該研究顯示,人工智慧可以在《星際爭霸II》裡與最高水平的玩家較量。《星際爭霸II》是一個非常流行的網絡策略遊戲。玩家們在遊戲裡分為三個種族——人族、星靈和異蟲,在具有未來感的戰鬥環境裡進行實時對抗。

在此之前,DeepMind在西洋棋和圍棋等領域開發了領先世界的人工智慧。這次,因為《星際爭霸II》遊戲策略的複雜性和快節奏,DeepMind以《星際爭霸II》為接下來的基準來發展通用的人工智慧技術,即能夠學習或者理解任何人類所能完成任務的機器。

「我沒料到人工智慧可以在這個領域中如此迅速地具備出類拔萃的能力,在我原來的預想裡,也許再過幾年也做不到,」俄勒岡州立大學(位於科瓦利斯)的人工智慧研究者Jon Dodge說道。

在《星際爭霸II》中,經驗豐富的選手們可以同時做多件事情——管理資源,執行複雜的戰鬥策略,並最終以決策打敗他們的對手。職業選手的遊戲節奏極快,每分鐘能進行300多次操作。DeepMind人工智慧背後的機器學習技術依賴於人工神經網絡。該神經網絡從大量數據集中學習識別各種模式,而非接收具體指令。

2018年12月,DeepMind第一次讓AlphaStar在一系列實驗室測試遊戲中與高水平玩家對抗。人工智慧與兩位人類職業選手進行了遊戲,並取得勝利。但是評論者們認為這些示範比賽並不公平,因為AlphaStar操作的速度和精準性都超過人類。

在開發團隊讓AlphaStar離開實驗室登陸《星際爭霸II》歐洲伺服器之前,他們限制了人工智慧的反應能力,使競爭更加公平。七月,玩家們收到通知,在匹配遊戲對手時,他們可以選擇與人工智慧有機率地進行匹配。為了使實驗不被察覺,DeepMind隱藏了AlphaStar的身份。

「我們想進行盲法實驗(blind experiment),」 AlphaStar的領隊之一David Silver說道。「我們真的想要在這樣的條件下進行遊戲,並對這一群人類對抗我們的表現有一個真實判斷。

AlphaStar的訓練獲得了成功:它擊敗了低段位的對手,並最終在90場對戰高段位玩家的遊戲中收穫了61場勝利。

挑戰複雜性

《星際爭霸II》的複雜程度給人工智慧們帶來了巨大的挑戰。與西洋棋不同,《星際爭霸II》有數百枚「棋子」——不同種族大軍中的士兵——在即時對抗中同時移動,而非依照有秩序的回合制方式博弈。在西洋棋中,一枚棋子符合規則的走棋方式是有限的,而AlphaStar則每時每刻都有1026種可選擇的操作方式。

並且,與西洋棋不同,《星際爭霸II》是一種不完全信息博弈(a game of imperfect information)——玩家們經常不能看到他們的對手在做什麼。這使得這個遊戲不可預測。

在將近十年的時間裡,研究者已經讓《星際爭霸》和《星際爭霸II》的人工智慧玩家們在年度競賽中相互對戰。然而,與AlphaStar不同,大多數自動機器人程序有賴於硬編碼(hardcoded)的指令,而非具備能夠自學的神經網絡。

AlphaStar的領隊之一Oriol Vinyals,過去是加州大學伯克利分校團隊中的一員,他們團隊在2010年的首次比賽中取得了勝利。他說,「在那時,我有點開始考慮,也許我們應該做(機器)學習,但是那個時候還太早了。」

2016年,Vinyals加入了DeepMind,開始研究能自學操作《星際爭霸II》的人工智慧。通過學習模仿將近一百萬局人類遊戲,AlphaStar開始了它的訓練。為了進一步提高AlphaStar的遊戲操作,DeepMind創建了一個聯賽,讓不同版本的人工智慧相互對戰。

帝國理工學院的人工智慧研究者Kai Arulkumaran表示,這個方法很有道理,因為像《星際爭霸II》這樣的遊戲,沒有一種策略是最好的,對於很多其它的人工智慧現實應用來說也是如此。

反應敏捷的玩家

同時,DeepMind也限制了AlphaStar的操作,確保人工智慧是真的在思維能力方面擊敗它的人類對手,而不是憑藉操作速度和數量獲勝。因為這個遊戲獎勵快速操作的能力,一臺點擊速度超過人類的電腦可能打敗人類,而不需要比人類更聰明或者做出更優的決策。因此DeepMind限制了AlphaStar的反應速度,使之與經驗豐富的人類玩家的速度相當。

在這些條件下,經過27天的訓練,AlphaStar躋身於歐洲伺服器所有玩家中的前0.5%。

然而,50局遊戲過後,DeepMind遇到了一個麻煩。一些玩家已經注意到戰網(Battle.net)遊戲平臺上有三個帳號在相似的時間段裡玩過相同數量的《星際爭霸II》遊戲,這三個帳號正是AlphaStar秘密使用的帳號。

在觀看遊戲回放時,玩家們發現,這個帳號使用者的操作對於人類來說,即使不是不可能,也是極其困難的。為了應對這個麻煩,DeepMind開始使用許多技巧來使試驗保密,避免玩家們認出AlphaStar,如經常更換遊戲帳號。

AlphaStar的最終版本依賴於44天的累積訓練,並頻繁與專業遊戲選手對戰。與西洋棋和圍棋的人工智慧們不同,這一人工智慧無法打敗世界上最優秀的玩家,但是DeepMind認為它達到了基準,並且宣布它已經完成了《星際爭霸II》挑戰。

其他人工智慧科學家還沒有被這種言論說服,他們不認為AlphaStar可以宣稱完全勝利。加拿大聖約翰市紐芬蘭紀念大學的人工智慧研究者Dave Churchill認為,AlphaStar還有很多的弱點,比如說無法處理它還沒見過的戰略。

他承認,「AlphaStar非常令人刮目相看,絕對是至今任何星際爭霸遊戲裡最強的人工智慧。不過,即便如此,星際爭霸的挑戰還遠未被 『解決』,AlphaStar甚至還沒有接近世界冠軍的水平。」

本文來自:環球科學

相關焦點

  • 《星際爭霸II》2017世錦賽
    世界錦標賽(WCS)是全球頂尖《星際爭霸II》玩家的最高殿堂。
  • 10:1,AlphaStar橫空出世,碾壓星際爭霸2人類職業玩家 TLO 和 MaNa
    為了解決這幾點,總的來說,人工智慧的需要突破的技術點是:博弈論:星際爭霸是一種像石頭剪刀一樣的遊戲,沒有單一的最佳策略。因此,在對人工智慧進行訓練的時候,需要不斷探索戰略層面的知識。不完全的信息:在西洋棋或圍棋這種棋牌遊戲中,玩家可以對比賽一覽無餘。在星際中,玩家關鍵的信息是隱藏的,必須通過「偵察」才能發現。
  • 紅色警戒與星際爭霸,暴雪從沒有忘記曾經的老對手
    Hi~ o(* ̄▽ ̄*)ブ ,大麥的《星際爭霸十萬個為什麼》又和大家見面啦!相信老玩家們幾乎都知道曾經星際爭霸和紅色警戒有過一段有趣的競爭故事。當初暴雪在星際爭霸1遊戲中故意將最大的反派的名字設置成凱瑞甘,借用現實中凱瑞甘和譚雅之間兩人的恩怨來暗示星際爭霸必然擊敗紅色警戒。
  • AI擊敗星際爭霸職業玩家
    Alphabet旗下子公司DeepMind在訓練一個人工智慧模型掌握了西洋棋和圍棋之後,開始了一個新項目:破解一款熱門電子遊戲的密碼。研究人員將這款遊戲視為人工智慧的「重大挑戰」之一。據稱,該系統是迄今為止同類系統中最複雜的。
  • 在圍棋界戰勝人類後,AI要挑戰《星際爭霸II》了!
    2》的API,讓DeepMind開發的AI學習玩耍《星際爭霸2》。《星際爭霸2》是這些遊戲環境的延伸,不過當然也有很多不同的地方。DeepMind的研究人員認為《星際2》是一個讓AI大展拳腳的完美環境,允許研究者更為快速而高效地開發和測試他們手中更智能,更靈活的AI算法。而且遊戲是可以通過一系列的得分來給AI提供即時反饋的。最終,研究人員希望將AI在《星際爭霸2》中學到的「技能」轉移到現實世界上來。
  • 《星際爭霸2》2014真愛玩家盤點
    《星際爭霸2》2014真愛玩家盤點   作為一款風靡全球的RTS遊戲大作,《星際爭霸2》在全球擁有無數狂熱的粉絲,在眾多星際2粉絲中除了遊戲大神之外還隱藏著許多其他行業的大神級玩家,其中不少玩家對《星際爭霸2》的熱愛程度已經超出你的想像,這些星際真愛粉們把自己的隱藏技能淋漓盡致的發揮到對《星際爭霸2》的無限熱愛上,接下來就讓我們一起回顧2014年那些星際真愛粉們的逆天舉動,看看什麼才是真愛
  • 2020年,你為什麼還在玩《星際爭霸2》?
    以至於前兩年AI機器人AlphaSta都致力於研究「RTS史上最複雜遊戲」《星際爭霸2》,並在對陣人類職業玩家、前 WCS 亞軍 MaNa 的一場比賽中,人工智慧卻被人類「狡詐」的戰術迷惑,輸給了對手。
  • 【賽事】2019中國《星際爭霸II》的電競計劃公布
    2018年,《星際爭霸II》電子競技迎來了許多新的突破與歷史性時刻,我們一起見證了《星際爭霸II
  • 星際爭霸歷史上最精彩的一場比賽!地毯式空投驚豔全世界玩家
    在星際爭霸歷史上,有過很多精彩的比賽,但如果要評選哪一場比賽最精彩,那麼,2001年時第一屆WCG世界電子競技大賽星際爭霸項目的決賽,絕對是最有資格當選的比賽之一。作為一名老玩家,今天我就給大家介紹一下這場比賽。
  • 《星際爭霸II》五月精彩遊戲大廳地圖推薦
    作為RTS遊戲的代表作,《星際爭霸II》在全球的電子競技比賽中佔據著極其重要的地位,扮演著舉足輕重的角色,然而《星際爭霸II》並非只是一款電競遊戲
  • 《星際爭霸II》天梯地圖及戰術推薦
    《星際爭霸II》遊戲中,天梯對戰一直深受玩家的喜愛,天梯中的排名更是成為玩家們展現自身實力的最佳方式。
  • 《星際爭霸3》有戲?光頭哥推特玩笑引玩家猜測
    今天凌晨,《星際爭霸2》遊戲總監Dustin Browder(光頭哥)在自己的個人推特上回答玩家提問時有趣的提到了「《星際爭霸3》」,儘管看上去似是一句不經意的玩笑話,但仍會有敏感的玩家覺得,暴雪是否真的已經準備讓《星際爭霸3》在未來的某一天問世。
  • 為什麼說玩慣了星際爭霸2的玩家就再也回不去星際1了?
    Hi~ o(* ̄▽ ̄*)ブ ,大麥的《星際爭霸十萬個為什麼》又和大家見面啦!前幾天呢大麥我看到了一個粉絲的評論深有感觸,這個粉絲表示,自從玩慣了星際2,都不知道當年是怎麼玩了十多年的星際1的?確實,我這幾年來一直都玩的是星際爭霸2,前段時間想重新回味一下星際爭霸1的劇情時,發現遊戲中的操作變得非常不適應,結果才玩了不少半小時就關閉遊戲了。這時候才體會到,由儉入奢易由奢入儉難的道理。那麼為何星際1和星際2兩者之間會有這麼大的差別呢?今天大麥就來和各位說說星際爭霸2給玩家們帶來的操作習慣上的改變。
  • 星際爭霸1的平衡性真的做得比星際爭霸2好麼?
    反觀現在,《星際爭霸2》從誕生開始,平衡性就一直飽受爭議,所以在不少玩家心中就產生了一種《星際爭霸1》的平衡性要比《星際爭霸2》好得多的感覺。那麼20年前的《星際爭霸1》平衡性真的要比10年前的《星際爭霸2》要好麼?今天大麥就來說說這個問題。其實在《星際爭霸1》時代玩家們也曾經抱怨過不少平衡性問題,但是當時玩家們的抱怨情緒遠沒有現在高。
  • 停更的《星際爭霸2》,半「入土」的RTS
    對於那些不了解或者對《星際爭霸2》一知半解的玩家來說,《星際爭霸2》就是一個以競技比賽為主體的遊戲,停止製作一些付費內容,反而是替玩家省錢了,是一樁好事才對。
  • --議外掛泛濫的星際爭霸2國服
    引子:憤怒的包子包子是一名初中生,星際爭霸2國服開啟後,他每天都會抽出一部分時間投身到星際爭霸2的世界中。而同樣的事情發生在ID為「功夫茶」的玩家身上,在國服內測時功夫茶就堅持打星際2,他對我說,他的戰績並不好,而很多的比賽戰敗後也不去看錄像。在前不久網易公布了「外掛永久刪號」的名單時,功夫茶偶然發現一個經常和自己比賽的對手竟然被封號了,而他這才留意了一下和這位名為「Flash」的玩家對戰戰績竟然是0勝4負。
  • 暴雪打折季《星際爭霸II》專場活動即將結束 快來搶購吧!
    第一波《星際爭霸II》專場現已開啟!假期伊始,戰鬥開啟,入手暴雪即時戰略巔峰之作的最佳時機,不容錯過! 《星際爭霸II》新年促銷活動詳情如下:  每一款暴雪遊戲都有專屬的優惠時段,新年即將到來,快來提升裝備吧!
  • 《星際爭霸II:虛空之遺》3.4.0版本更新說明
    綜合《星際爭霸II》天梯改版已經上線。閱讀了解主要內容介紹!在伺服器時間下午 5:00 點,宗師聯賽排名墊底的 5% 的玩家將被移出聯賽。具備晉級宗師聯賽資格的玩家將進入新的「爭奪者聯賽」天梯榜。任何登錄《星際爭霸II》的玩家都可以查看「爭奪者聯賽」天梯榜中的現有玩家名單,實時了解最有晉級可能的玩家動態。選擇個人資料>天梯>宗師>1v1爭奪者或者執政官爭奪者即可前往。
  • DeepMind AlphaStar星際爭霸2首秀:Demo很強大,現場比賽竟然輸了
    除了 Dota2、王者榮耀這樣的 Moba 類遊戲,星際爭霸因其豐富的多層次遊戲機制,對於人工智慧研究來說也是一個再理想不過的環境。過去一年,機器之心報導了眾多機構在星際爭霸、星際爭霸 2 上的 AI 研究成果。而我們所熟知的 DeepMind,在圍棋項目結束之後也成為了 AI+星際爭霸研究的主力之一。
  • 迷失星海的倩影——夭折之作《星際爭霸:幽靈》(二)
    此外,遊戲裡玩家遭遇的敵人均出自原版《星際爭霸》,像是蟲族小狗、蟲族領主、神族狂熱者、神族龍騎兵等,暴雪甚至專門為本作設計了幾個新兵種單位,比如裝備能量炮的神族步兵「淨化者」( Purifier )。製作者還為遊戲加入了諸如開鎖小遊戲、 QTE 處決技(比如跳到敵對人族陸戰隊員頭上撬開其頭盔然後扔一顆手雷進去:)等玩法來豐富娛樂性。