「一邊倒」的人機對抗:《星際爭霸》比圍棋難在哪?

2021-01-08 艾瑞網

導語:目前在《星際爭霸》的項目上,AI還不能給人類選手帶來哪怕一點點的壓力。

目前在《星際爭霸》的項目上,AI還不能給人類選手帶來哪怕一點點的壓力。

與之前AlphaGo挑戰柯潔和李世石時的萬眾矚目不同,當人工智慧再一次想要挑戰人腦時,受到的關注卻遠沒有上一次多。這一次它的對手不是圍棋,而是《星際爭霸》。

前段時間,韓國首爾世宗大學官方舉辦了世界首屆人類與星際爭霸AI的對抗賽,代表人類出戰的是前《星際爭霸》項目職業選手:Stork(宋炳具),與之對抗的對手則是四個不同的AI,韓國世宗大學金正中教授組織開發的「MJ Bot」,以及來自澳洲的「ZZZK」,挪威的「TSCMO」和Facebook開發的Cherry Pi。

無論是《星際爭霸》還是《星際爭霸2》,韓國幾乎可以說「一直代表著這個遊戲的最高實力」。因此,由韓國的科研機構來主辦這場比賽自然是相當有說服力的。

而作為電腦AI隊伍的頭號種子,電腦AI「MJ Bot」也不遑多讓。該程序從2011年開發至今已經多次亮相,而且獲獎無數,被譽為現今韓國最好的「星際爭霸AI」。

當現階段最強電腦AI碰上前職業選手,有人猜測二者會殺得難解難分。尤其是在看過了AlphaGo在圍棋上的強勢之後,有人反而覺得電腦的勝算會更高一點。

但是比賽的結果卻相當的「平淡」,第一局和MJ的比賽,Stork祭出空投戰術,拿到場面優勢之後順手就拆了對手老家。第二局對上ZZZK,Stork和AI同時拿出速推打法,結果AI仍舊敗下陣來。第三局面對TSCMO,Stork仍然是速勝。第四局裡,Cherry Pi同樣也沒有給人類選手帶來哪怕一點點壓力。

至少從目前的情況來看,AI想要在《星際爭霸》這個項目上戰勝人類,還有很長的路要走。

層層選拔的機器人「對手」

在過去的幾年之間,以《星際爭霸》為基礎展開的人工智慧研究一直在上演,其歷史甚至比圍棋上的較量還要早。最著名而且歷史最悠久的,肯定要數美國加州大學聖克魯茲分校舉辦的AIIDE了。

這場名為AIIDE的比賽,其實本質上是一場人工智慧之間的比賽,說白了就是「電腦打電腦」,從2010年開始,每年一屆,到今年已是第8年。

每年都會有來自世界各地的大學或者實驗室,帶來自己的作品來這裡進行互相比拼。包括這次比賽的三個AI都是AIIDE的常客,來自澳洲的「ZZZK」是2015年的亞軍,來自挪威的「TSCMO」是當年的冠軍。而韓國的「MJ」則是名為「Xelenaga」的老牌星際AI的升級版,在AIIDE賽場也是多年混跡於前十名的常客。可以說,這三個在現階段已經是AI在《星際爭霸》領域裡的最強選手了。

從2012年到2016年的五屆AI對抗賽裡,都能看到「TSCMO」,「ZZZK」和「Xelenaga」(即MJ)這三臺AI的身影

而在每年的AIIDE最後都有一個保留節目:最後獲得冠軍的電腦AI會與一名非專業的人類選手進行較量。雖然這樣的表演賽看起來更像是一個非正式的「助興節目」,但是直到2017年的AIIDE,電腦AI對陣人類選手還未嘗勝績——哪怕對手只是普通的星際愛好者。

AIIDE的組織者Dave Churchill曾就此表示:「即使最頂尖的電腦AI,目前也只達到了低級業餘的水平(在星際爭霸項目中),在人類選手面前就像過家家一樣,想要達到AlphaGo在圍棋方面的壟斷優勢,至少還有5~10年的路要走……但是誰也說不好明天會發生什麼。」

《星際爭霸》究竟比圍棋難在哪兒?

說AIIDE裡的人機對抗還是一場不成熟、不正式的助興節目,這次韓國舉辦的比賽應該會讓這個論斷更有說服力。隨著時間的進步,電腦硬體和智能算法的進步要遠快於人腦。所以至少到比賽開始之前,無論是星際職業選手,觀眾還是科研人員,對於結果的預測都很難達成共識。

《麻省理工科技評論》雜誌在賽前曾採訪過兩位頂尖職業選手:2016年《星際爭霸2》WCS世界錦標賽的冠軍ByuN,以及曾經世界最強的蟲族選手之一,現已退役的「暴君」Jaedong。

二人均在採訪中表示,願意代表人類與星際AI來一場公開的較量,但是他們對於誰勝誰負的看法卻截然相反,恰好可以代表大部分人對於這場比賽的兩種態度。

24歲的ByuN很有信心戰勝人工智慧。「在有生之年,人工智慧絕不是我的對手。」 他說,「在玩《星際爭霸》時,你需要對許多未知和變數作出迅速的反應,但是我發現AlphaGo並不擅長處理突發事件……想要設計一個同時可以應對突發情況,又要對比賽的長期發展做出預測的AI是很難的。」

像這樣精彩的極限操作,沒有任何一個人類選手可以保證在比賽中萬無一失

而Jaedong則持相反的觀點,他認為人工智慧可以輕鬆戰勝人類選手。他說:「AI不知疲倦,而且在重壓之下也不會犯錯,並且擁有人類生理無法實現的手速(APM), 如果人工智慧技術達到了一個人類無法跟上的速度,那麼它將輕鬆戰勝人類。」

職業星際選手的手速在人工智慧面前不值一提

這兩種觀點的矛盾之處,恰恰是人們對於「想要贏,什麼條件最重要」的討論。換句話講,就是在問:AI為什麼在《星際爭霸》項目上會輸呢?或者是問:為什麼要選擇《星際爭霸》這款遊戲來作為研究人工智慧AI的樣本呢?

相比於之前AlphaGo擅長的「完全信息博弈」的圍棋,《星際爭霸》顯然是一個擁有更多不確定因素的遊戲。在圍棋對弈時,AI可以看清楚棋盤上的每一個位置,然後依靠自己比人腦強大無數倍的計算能力,衡量每一步落子所帶來的收益,然後確定最優的方案。這種能力是人腦再開發到極限也是無法實現的。

而在遊戲中,AI的這種優勢其實並無太多用武之地。熟悉RTS(即時戰略)遊戲的玩家應該都了解「戰爭迷霧」這種機制。AI並沒有「作弊」讀取正在進行中的遊戲的內存數據的話,它是無法得知玩家現階段在布置何種戰術,因此也就無法提前做出「最優判斷」。而這種判斷對於RTS的獲勝來說才是至關重要的。即使AI洞悉了玩家的戰術,他也未必能即時做出改變,甚至有可能被玩家「虛晃一槍」。

職業選手ByuN就表示他會使用"非常規的策略和戰術"來迷惑AI。「我會阻止它開視野,發現我的基地布局和建築順序。」ByuN說,"如果我的基地被發現,我會選擇停止所有建築計劃。」

AI在信息對等的情況下,臨機應變的能力不如人類,星際需要玩家對資源控制,升級先後順序,不同種族和兵種相互克制等方面有整體的認識。這種互相牽制的效果,即是遊戲平衡性的由來。這方面的整體考慮遠比下圍棋時只考慮黑子和白子的位置更加複雜。

考慮到人工智慧在APM手速和精確微操方面優勢明顯,這可能成為另外一個能決定比賽最終結果的重要因素。

曾經有人設計出一種 「悍馬2000(Automation 2000)」的腳本,極限APM達到15000(頂尖職業選手APM大約為200+),實現了一系列諸如「100隻狗拆掉20輛坦克」、「機槍兵甩毒爆」、「無雙運輸機甩牛」等眼花繚亂的壯舉。如果在現實比賽中出現,無疑可以給人類玩家造成巨大的心裡壓力,甚至一舉奠定勝利基礎。

100隻狗 VS 20輛坦克

雖然頂尖職業選手也曾在比賽中上演過類似的操作,但是畢竟在正式比賽的高壓之下,沒人敢說一定能成功。在這種前提下,電腦與人腦看起來是在不平衡的前提下進行對決。官方似乎也注意到了這一點,暴雪和DeepMind團隊也強調過,未來的人工智慧並不會擁有非人類的逆天操作,他們將會通過限制人工智慧的APM來保證它的操作,也會有類似人類的極限和失誤。

電腦控制下的機槍兵甩毒爆

但是藝高人膽大的ByuN再一次站出來反對了,他說:「任何限制人工智慧的舉動都會令『人機大戰』失去意義。 」

啟示

目前除了這些老牌的星際AI在不斷進化之外,也有更多人工智慧科研團隊加入進來。其中最有代表性的就是曾主導了AlphaGo開發的DeepMind團隊。

AlphaGo 2.0在版本(即完勝柯潔的版本)時,已經可以通過自我博弈達到學習的目的。如果這種技術應用到遊戲中的話,可能會徹底改變目前星際AI打法都是人工設定好的,容易被針對的現狀,甚至會誕生出一些新的戰術和玩法,以啟發職業選手。

在2016年的暴雪嘉年華開幕式上,谷歌的研究人員就上臺宣布了DeepMind目前和暴雪共同開發星際AI的計劃和工作進展

而由Elon Musk贊助的人工智慧項目OpenAI,也同樣將目標瞄準了《星際爭霸》為代表的對抗性遊戲。在今年的Dota2 Ti7全球總決賽上,它就以壓倒性的優勢戰勝了代表人類玩家的頂級選手Dendi。雖然二者對決並非建立在完整的遊戲規則之上,但是在中路一對一對線的表演中,OpenAI在走位,補兵的操作上沒有一絲失誤,這也再一次映證了電腦AI在操作方面仍然有著先天性的優勢。

來自中國阿里巴巴人工智慧實驗室和倫敦大學的研究人員也在以星際為樣本,研究人工智慧對多種單位協同控制的能力,並且取得了不錯的成績。

眾多科研機構能夠如此順利進行星際AI研究,要多虧了暴雪官方在遊戲上對開放性做出的讓步。針對《星際爭霸1》,暴雪專門針對母巢之戰版本開放了BWAPI編程接口,保證了開發者可以針對遊戲操作來不斷優化人工智慧的算法,同時還保證了「公平性」:AI基本上只能按照人類的思維方式向遊戲下達指令,基本上人類可以做到哪些事情,AI也就只能做到這個地步,從而杜絕了對於電腦會「作弊」的擔憂。

針對《星際爭霸2》,暴雪則和DeepMind團隊合作推出了SC2LE(StarCraft II Learning Environment)——一個星際爭霸2(StarCraft2)的工具包,為研究提供了非常大的幫助。

通過暴雪開放的官方接口,已經可以測試AI在某些特殊任務中的行為

顯然,研究一款遊戲AI不是所有研發人員的最終目的。谷歌曾經透露,更多的意義是通過這種研究來幫助人類改善生活。

如果僅從《星際爭霸》這款遊戲來看,人工智慧在不久的將來,可以成為人類選手訓練的最佳伴侶。更進一步講,當人工智慧技術成熟之後,提供給人類的可能更像是星際爭霸中副官的形象,協助我們分析局面,提供建議。當然,這樣的前提是我們電腦AI能「更像一個真人」或者一個「冷靜的旁觀者」,這樣最終的決定權就仍然掌握在我們自己手中。

最後提醒一句,那些曾經給柯潔出主意,讓他「拔掉AlphaGo插頭」的人要注意了,星際AI可不吃這一套。因為《星際爭霸2》對戰時掉線,是可以重連的。

(文章為作者獨立觀點,不代表艾瑞網立場)

相關焦點

  • AlphaGo Zero創造者:星際爭霸2比圍棋更具挑戰性
    我們都知道 AlphaGo 曾打敗圍棋世界冠軍,它是God,是神,是史上最強的圍棋「選手」,但這次公布的 AlphaGo Zero 卻更為兇悍:憑藉新型的強化學習技術, AlphaGo Zero 以100:0的比分擊敗了之前的世界冠軍 AlphaGo。AlphaGo Zero 拋棄了此前 AlphaGo 基於人類圍棋比賽的訓練方式,完全「自學成才」,通過隨機下棋的方式來自己學習圍棋。
  • 星際爭霸2人類1:10輸給AI!DeepMind 「AlphaStar」進化神速
    在交戰中,我們看到了 AlphaStar 進行了類似人類的微操,一邊撤退,一邊反打 TLO 的追獵,同時利用稜鏡傳輸兵力。在 AlphaGo 在 2017 年圍棋大獲全勝之後,DeepMind 開始對外宣布,團隊正在著手讓人工智慧徵服星際爭霸 2,這款遊戲對人工智慧在處理複雜任務上的成功提出了"重大挑戰"。
  • AlphaGo挑戰人類《星際爭霸2》:必遭暴虐
    在 AlphaGo 戰勝了韓國圍棋棋手李世石後,DeepMind 創始人戴密斯·哈薩比斯(Demis Hassabis)就曾表示將研究以人工智慧與人類玩其他遊戲,例如即時戰略遊戲《星際爭霸》。不過目前看來,DeepMind AI要跟人類比賽打《星際爭霸》這事,還是有點兒懸。
  • 魔獸爭霸3機制比圍棋還簡單?阿爾法狗能否輕鬆戰勝war3玩家?
    魔獸爭霸3一直是即時戰略類遊戲的神作,因為小地圖作戰模式與英雄體系的加入,使得魔獸的微操與多線操作要求更加複雜,對於玩家精力的消耗非常恐怖,因為被不少想要要入坑即時戰略遊戲的玩家拒之門外。不過,如果拿wai3與圍棋對比,這兩款遊戲誰的難度會更高呢?
  • 暴雪的兩大神作 魔獸爭霸和星際爭霸,哪一款遊戲的影響力比較大
    RTS(即時戰略)遊戲領域四大天王,暴雪的星際爭霸和魔獸爭霸就佔據了兩個位置。而這兩款遊戲又都是RTS遊戲領域中的翹楚,分別代表了RTS遊戲的兩個不同的方面。星際爭霸代表的是全面對抗和高操作性;魔獸爭霸代表的是局部戰爭和RPG要素推進,坦率的說,兩款遊戲難分高下。
  • 下圍棋是阿爾法厲害打星際它贏不了人
    原標題:下圍棋是阿爾法厲害打星際它贏不了人《最強大腦》的「人機大戰」中,中國「腦王」王峰惜敗機器人「小度」。本周五晚,中國電視史上首場「人機大戰」,在江蘇衛視《最強大腦》第四季舞臺上正式打響。最終,中國「腦王」王峰2:3惜敗於人工智慧機器人「小度」。而就在幾天前,用連勝60局的戰績肆虐了世界棋壇近一周後,Alpha Go(阿爾法狗)脫下「Master」的馬甲,宣布暫時閉關。人工智慧的話題在新年裡又成了熱搜。
  • 《星際爭霸》將推出新漫畫 拓展系列宇宙,對抗外星人
    暴雪的即時戰略遊戲「星際爭霸」系列,馬上會推出漫畫《星際爭霸:士兵》第一卷。這部漫畫將拓展該系列宇宙,故事圍繞對抗外星人的戰鬥來展開。由Jody Houser(《星球大戰》《怪奇物語》)和Andrew R.
  • 為何在星際爭霸1時代的職業賽場上神族一直都處於劣勢?
    Hi~ o(* ̄▽ ̄*)ブ ,大麥的《星際爭霸十萬個為什麼》又和大家見面啦!相信玩家們應該都了解,《星際爭霸》這款遊戲之所以會被玩家們所喜愛,很大一部分是因為其公平的競技對抗,而這也是RTS遊戲最吸引玩家的地方。但是呢,《星際爭霸》又因為3個截然不同的種族也無法做到絕對的公平,這是個不爭的事實。
  • 阿爾法狗大勝「人機大戰」後,有圈內人士擔心圍棋會走下坡路
    「阿爾法圍棋」雖然沒能橫掃獲勝,但其遠超人腦的計算能力已經讓人震驚。  本文圖片均來自網絡中新網北京3月16日消息,過去一周,「人機大戰」成為橫跨體育和科技界,蔓延至全球的爆炸話題。隨著比賽一場場進行,各方的思考接踵而至。對中國人來說,了解和懂得圍棋在傳統文化中的意義,顯得尤為重要。
  • 繼AlphaGo圍棋戰勝柯潔,AlphaStar大勝人類星際玩家
    谷歌DeepMind的AlphaGo繼谷歌DeepMind的AlphaGo戰勝人類的世界圍棋冠軍柯潔、李世石之後,時隔兩年,DeepMind人工智慧再升級,推出最新AI程序AlphaStar,挑戰暴雪的經典遊戲《星際爭霸
  • 阿爾法狗大戰星際爭霸2?明早凌晨兩點的直播你不可錯過!
    它是DeepMind Al推出的人工智慧系統,曾經於2016年3月以4比1的比分擊敗了世界圍棋冠軍職業九段棋手李世石,隨後又以3比0的比分擊敗了世界排名第一的圍棋冠軍柯潔。雖然不能說阿爾法狗的智能超過了人類,但是至少在最考驗智能的圍棋項目中,人類已經不是敵手。星際爭霸2是誰?
  • 「黑客帝國」離我們更近了 人類玩星際2輸給AI
    這個人工智慧已經在圍棋領域上戰勝了現今棋壇第一的柯潔。而現在它的兄弟AlphaStar在《星際爭霸2》遊戲中將兩名知名選手斬於馬下,接下來又是同樣的劇情,最新的世界冠軍——芬蘭選手Serral將在2月15日出戰AlphaStar。
  • 柯潔對戰阿爾法狗首場告負 圍棋人機對弈的五十年
    2017年5月23日訊,AlphaGo2.0來到中國, 「人機大戰第二季」激戰正酣。但事實上,AlphaGo已經是圍棋人工智慧的第三代。在開發圍棋人工智慧的道路上,人類已經艱難地探索了將近五十年。AlphaGo、絕藝以及人機協作圍棋AI之難,難在這項運動本身的多重複雜性——「最簡單的規則,最複雜的變化」。在AlphaGo及其開發團隊DeepMind出現之前,幾乎所有研究者都認為在十年內人工智慧戰勝圍棋大師的機會是渺茫的。而在它出現以後,幾乎所有人都在驚呼人工智慧已破解了圍棋這一歷史難題,甚至在極短的時間內兩次讓研究成果上了《自然》雜誌的封面。
  • 圍棋人機大戰柯潔哭了 機器卻沒有笑
    新華社發  浙江在線5月28日訊(浙江在線記者 張峰)5月27日,人機大戰的最後一局在烏鎮開始,要求再次執白的柯潔沒有創造奇蹟,在行棋至209手時,柯潔將兩顆棋子擺上棋盤,向裁判表示投子認輸。至此,人機大戰第二季以柯潔0:3被人工智慧AlphaGo橫掃告終。
  • 最強版阿爾法狗已停止進一步強化 締造者稱正著手星際爭霸
    該團隊成員稱,公司內部已經停止了AlphaGo的強化研究,他們正著手開發星際爭霸。 他們嘗試了很多方法來解決,如給程序灌輸更多的圍棋知識或人類元知識。這一次他們的解決方法是讓系統的算法變得更加條理化,使用更少的知識,更多地依賴強化學習來生成更高質量的解決方案。從最終結果看,效果還不錯。 AlphaGo Zero更多依靠強化學習算法,而不是人類數據的方法,也引發了算法和數據之間哪個更重要的討論。
  • 為了培養AlphaGo二代 暴雪想把《星際爭霸2》變成AI實驗室
    「圍棋上帝」AlphaGo 在戰勝柯潔之後便宣布退役,成為圍棋界難以逾越的一座高峰。而其締造者 DeepMind 公司早就為人工智慧準備了下一個目標:《星際爭霸 2》(StarCraft)。
  • 人機大戰:AlphaGo贏 世界圍棋冠軍李世石首場認輸
    3月9日下午3點30分,人機世紀大戰第一場結果公布,谷歌人工智慧系統AlphaGo挑戰世界圍棋冠軍李世石成功,李世石認輸。這次比賽採用中方的圍棋規則,黑貼3又3/4子(黑貼7目半)。每位棋手各有兩個小時布局時間,3次60秒的讀秒,每場比賽預計需要大約4-5個小時。
  • 穿越到《星際爭霸2》 你的最佳選擇是什麼
    如果給你一個選擇的機會,讓你穿越到《星際爭霸2》,你想成為那一族哪一兵?還是更願意作自己?一場穿越大戲,不妨來幻想一回。《星際爭霸2》的玩家太有愛了,在如今穿越文橫掃全領域的同時,也被玩家拿來戲說一回。當穿越至宇宙,不再是面對電腦,而是真實的星際2世界,那個時刻的你,會如何抉擇呢?
  • 人機大戰兩周年紀念:阿爾法狗揭開圍棋新時代序幕
    無論是對圍棋領域的影響,還是對人工智慧領域的影響,又或是論及廣泛的傳播性和帶給公眾的震撼,均是第一次人機大戰(即AlphaGo vs 李世石)的五番棋更大。   不知不覺中,第一次人機大戰已經過去兩年整了。
  • 阿法狗挑戰星際爭霸打不過簡單電腦 網友腦洞:天網的陰謀
    日前人工智慧公司DeepMind宣布,在圍棋界所向披靡的AlphaGo,在遊戲訓練上,至今打不過「簡單電腦」......早在去年11月,DeepMind就宣布攜手暴雪,將把《星際爭霸》做為新的AI訓練平臺。彼時雙方信心滿滿,然而九個月過去,他們的成果就是上面那個......劃重點1:為啥狗會輸?