最終決戰!OpenAI將挑戰Dota2最強戰隊、TI 8冠軍OG

2021-02-21 機器之心
OpenAI 今日宣布,它們的遊戲人工智慧 OpenAI Five 將於 4 月 13 日與人類進行最終決戰,此次比賽的對手是 Dota 2 世界冠軍團隊 OG。

雖然在去年 8 月的 Dota2 國際邀請賽(TI8)上,OpenAI連續輸給 paiN 以及由大 B 神、xiao8、430、ROTK、狗哥這些中國 Dota 屆元老組成的戰隊,但 OpenAI 並沒有因為挑戰失敗而放棄嘗試。這一次他們直接選擇了與 TI8 上的冠軍團隊過招。

看來在最近 6 個多月的時間裡,人工智慧又學會了一些新的技術?

這次比賽的規則類似於 TI8 時 OpenAI Five 與職業戰隊的比賽:

值得注意的是,TI8 比賽期間,去除掉了「5 個無敵信使」的限制,因為這個條件會極大的影響遊戲的真實性。

OpenAI Five:挑戰人類的成與敗

人工智慧在圍棋上擊敗人類之後,很多技術人員就開始展望 AI 在視頻遊戲中的表現了。2017 年的 Dota2 國際邀請賽 TI7 上,OpenAI 推出的人工智慧橫空出世,在人類巔峰對決的比賽現場 1v1 打敗了世界頂級玩家。

在那場一對一表演賽中,OpenAI 的人工智慧打敗了 Danylo "Dendi" Ishutin,一名在職業生涯中贏得超過 70 萬美元獎金的職業玩家。OpenAI 的 bot 在第一場比賽開始約 10 分鐘打敗了 Dendi。在第二場比賽中 Dendi 放棄,並拒絕進行第三場比賽。

Dendi 在比賽前接受採訪,作為第一個在公開比賽中被 AI 擊敗的職業選手,他領教了人工智慧在單挑時的應變能力。

單挑可能還不具有太多說服力,Dota2 是一個 5v5 的多人對戰遊戲,很快 OpenAI 就開啟了更為正式的「10 人對決」之旅。2018 年 6 月,這家公司提出的「OpenAI Five」又在 5v5 多人對局中擊敗了由前職業玩家、遊戲解說組成的天梯 6000 分級別戰隊,並宣布會於 TI8 上亮相和真正的職業選手過招,一時吸引了人們的關注。

Dota2 是目前全球最為流行,也最複雜的電子競技遊戲之一。其最負盛名的賽事「TI」每年都會吸引上千萬玩家的關注。

面對 AI 的挑戰,人類躍躍欲試,在 TI8 上很多參賽隊伍都報名想參加 OpenAI Five 的比賽,OpenAI 遇到的第一個對手是來自巴西的戰隊 paiN,後者也是 TI8 決賽階段第一支被淘汰的隊伍。有了 AlphaGo 的「前車之鑑」,人們紛紛預測 AI 穩贏,然而人類職業玩家卻讓 OpenAI 嘗到了失敗的滋味。

paiN 選擇了開霧直接衝進天輝野區,四人圍攻落單的潮汐,搶到了一血。OpenAI 也展示出了人工智慧「不聰明」的一面,在塔下不斷插眼。雖然在隨後的比賽中雙方有來有往,但人類玩家逐漸掌握了計算機的套路,在 50 分鐘的比賽後打爆了對方的建築。

在 Open AI Five 對陣 paiN 的比賽中,人工智慧對於自己獲勝概率的預測。

這場失利讓大家對於 AI 的期待有所下降,隨後在第二場比賽中,由 Burning、Xiao 8、430、ROTK 和 Sansheng 組成的「中國 Dota2 元老隊」也順利擊敗了 OpenAI Five,讓人工智慧的 TI8 之旅最終以失敗告終。

第二場比賽中,人類用了 45 分鐘拿下勝利,人頭比 48 比 43。

解決 5v5 的核心問題

雖然首次挑戰職業玩家沒有成功,但 OpenAI Five 的嘗試為人工智慧領域技術的發展有著很大意義——它解決一個重要問題:強化學習在如此複雜、需要長期策略的遊戲環境下是否依然奏效?

通過自我對抗學習,OpenAI Five 每天相當於玩 180 年的遊戲。訓練上,它使用 256 塊 GPU、12 萬 8000 個 CPU 核心使用近端策略優化(Proximal Policy Optimization)方法進行訓練。當每個英雄使用單獨的一個 LSTM,模型就可以在沒有人類數據的情況下學到可識別的策略。這表明強化學習即使沒有根本性的進步,也能夠產生大規模但也可接受的長期規劃。這出乎了 OpenAI 研究人員起先的預料。

為了訓練每個英雄,OpenAI 使用了兩種機器學習技術:長短期記憶網絡(LSTM)和近端策略優化(Proximal Policy Optimization)。

為什麼使用 LSTM 其實很好理解:打 Dota2 需要長期策略,敵方英雄的每一個當前行為都會對之後的行為產生影響。LSTM 是一種循環神經網絡(RNN),它比普通的 RNN 更適合於處理和預測時間序列中間隔和延遲非常長的重要事件。LSTM 有一個叫做 Cell 的元素,能夠分辨出輸入的信息是否有用,是否需要記住。

每一個 bot 的神經網絡包含一個單層的、擁有 1024 單位的 LSTM,觀察遊戲的局勢然後做出相應的行為。下圖這個互動演示就是可以讓你理解每個 bot 是如何做出指令的,這些畫面就是 Dota 2 的 API 所觀察到的。

如何讓五個神經網絡協作團戰是另一個讓不少人好奇的地方,這其實也是建立在獎勵機制上。OpenAI 為 AI 模型開發了一個叫 Team Spirit 的超參數,數值從 0 到 1,數字越小每個神經網絡就越「自私」,相反則越考慮團隊的整體利益。到最後,OpenAI 發現將 Team Spirit 設置為 1 都能贏得比賽。

在訓練初期,研究員其實會將數值調整的很小,這樣 AI 會更考慮自身的獎勵,學習如何分路、對線、提供金錢和經驗。等到每個神經網絡學會了基本的策略和玩法後,研究員才將數值慢慢提高。

由於所有參數都是隨機,AI 沒有引入任何人類的經驗,所以 AI 沒有 1-5 號位的概念,不會區分輔助和 carry,出裝備也是從頭開始學習。

在第一場遊戲中,英雄漫無目的地在地圖上探索,而在幾個小時的訓練後,出現了規劃、發育或中期戰鬥等概念。幾天後,智能體能一致地採用基本的人類策略:試圖從對手偷財富、推塔發育、在地圖旋轉控制英雄以獲得線路優勢。通過進一步的訓練,它們開始學會了 5 個英雄一起推塔這樣的高級策略。

TI8 冠軍 OG 戰隊

OpenAI 捲土重來,這一次直接選擇挑戰目前人類最強戰隊 OG,展示了自己的強大自信。這次的「最終對決」,OpenAI 直接以 Finals 為名,看來是最後一戰了。更令人興奮的是,它的對手 OG 絕非等閒之輩。

OG 戰隊前身為 Monkey Busniess 戰隊,後被一家遊戲直播平臺收購改名為 OG。2015 年,OG 戰隊在決賽中擊敗了 Secret 戰隊,奪得法蘭克福特錦賽冠軍,從此一戰成名。

2016 年,OG 戰隊雖然在上海錦標賽中失利,卻於當年在馬尼拉再次奮起奪得第二個特錦賽冠。

冠軍團隊也並非一帆風順的。在 2016 年 TI 賽慘敗之後,OG 戰隊經歷了一波換血:去掉了 Cr1t-、Miracle-和 MoonMeander,新加入 Jerax、Ana 和 s4。重生之後的 OG 隨即斬獲了波士頓特錦賽的冠軍,之後於 2017 年獲得基輔特錦賽冠軍。

TI5-TI7 期間,OG 取得了 7 個官方特錦賽中的 4 個冠軍,這是一支頂級的世界強隊。

但 OG 真正的傳奇,展現在 TI8 的舞臺上。

TI8 自 2018 年 8 月 15 日溫哥華開戰後,OG 先以 2:1 擊敗 PSG.LGD,取得勝者組冠軍。而後,打落敗者組的 PSG.LGD 在敗者組決賽中以 2:0 戰勝 EG 挺進總決賽。TI8 決賽成為了 OG 與 LGD 的恩怨局。

8 月 26 日,在總決賽的精彩對決中,最終 OG 更勝一籌,3:2 贏得 LGD,在全世界面前捧起了 TI 冠軍盾,而 N0tail 與 JerAx 也成功拿下四大聯賽大滿貫。

小結

雖然 TI8 期間,OpenAI Five 與職業選對的「表演賽」輸的慘不忍睹,但讓我們看到了人工智慧在遊戲領域的創新與突破。此次 OpenAI Five 最終決戰 TI 8 冠軍 OG,無論結果如何終將為 OpenAI 的 Dota2 遊戲項目劃上一個句號。希望時經一年,OpenAI Five 能帶來更為驚豔的表現。

最後,去年的「大巴黎,咚咚咚」,今年上海 TI 9 加油啊……小編要去現場!!!


vivo網際網路將於 3 月 30 日舉辦「億級用戶的智能體驗交付之路」主題沙龍,邀請 vivo 大數據專家、高級算法工程師為大家做精彩分享。點擊「閱讀原文」參與報名。

相關焦點

  • 對戰 DOTA2 世界冠軍 OG團隊,OpenAI 稱這將是最終決戰!
    ▲點擊上方 雷鋒網 關注OG 團隊將代表人類能力極限和 OpenAI Five進行最終決戰。
  • dota2液體戰勝og,輪盤隊被奇蹟哥嘲諷?
    今天(5月11日)液體戰隊2:1戰勝og戰隊,如果接下來lgd戰勝nip的話,兩隊會在明天凌晨(5月12日2點30分)進行對決,很遺憾不是lgd和og。og戰隊作為ti8冠軍,9個月來在dota2吧都是令人喜歡又招人恨的角色。
  • OG戰隊全世界公認的DOTA2實力獨一檔
    OG戰隊,世界刀塔第一個TI雙冠王,擁有著至高無上的榮耀,這個戰隊也吸引著許許多多的天才選手,以前的Miracle,現在的Sumail等等,OG在2018年決賽中擊敗LGD戰隊奪取了TI8冠軍,這讓我感到痛心疾首,也讓我對這個戰隊產生興趣,並且進行深入了解和分析。
  • NiP俱樂部官方宣布解散旗下DOTA2戰隊
    在DOTA2項目徵戰5年之後,NiP俱樂部在今天宣布宣布解散旗下DOTA2戰隊,並將在未來尋找新的應對方法以面對目前嚴峻的挑戰。最終由於DOTA2戰隊內部缺乏財務穩定性,因此俱樂部宣布解散旗下DOTA2分部。
  • Dota2世界冠軍OG被OpenAI碾壓,全程人類只推掉兩座外塔
    是AI與人類冠軍的終極決戰,也是它的期末大考。對決的雙方,勝者是多次擊敗人類玩家的AI戰隊代表OpenAI Five;敗者是(理論上)人類最強Dota 2戰隊,去年的TI 8冠軍OG。看比賽之前,我們先來了解一下這次決戰的規則。
  • 中國最強的電競俱樂部,創始人是王思聰,聊聊ig那些事!
    要說中國成績最好最強的電競俱樂部,王思聰創建的ig俱樂部必須榜上有名。ig這個名字相信許多電競粉絲在各個遊戲領域都聽說過,現在ig最出名的分部是它的《英雄聯盟》分部,但是它其他分部在業內也很有名氣。ig俱樂部取得的榮譽,放在現實中國乃至世界的電競界,都毫無疑問位於第一檔。
  • 歷屆DOTA2國際邀請賽回顧:中國戰隊三奪TI冠軍
    中國戰隊除了獲得榜首的Wings外,還有第五名的Ehome戰隊,第十名的LGD戰隊,第12名的Newbee戰隊和第13名的VG.R戰隊。五支中國戰隊共獲獎金7176萬人民幣,佔TI6總獎金1億3806萬的52%,其中僅冠軍Wings戰隊的獎金就佔總獎金的43.8%。
  • Dota2的Topson稱將2連冠,Ti8、Ti9實在太簡單了,你覺得是這樣嗎
    不知道大家有沒有看過Ti9的真視界,其中有句話很霸氣,就是「頂級兒子」Topson,說"他將3連冠,因為前面兩個冠軍太簡單了"Ti8那是他第一次打ti,雖然之前也曾在二三線打過職業,但大部分時間都是在打路人跟代練,第一次打ti就能有不少局打出亮眼的表現也是很出色的
  • IG俱樂部DOTA2戰隊正式官宣:保持不變
    就在剛剛IG在其官方微博公布了兩支戰隊的最終名單,IG戰隊保持不變!以為是微博原文在過去的一年裡,iG.DOTA2分部在國內與國際的賽場上都有所收穫,新的賽季我們將繼續努力,向更高的目標發起衝擊。感謝粉絲的關注與支持,新賽季讓我們繼續同行!
  • 為什麼近幾年dota2的成績越來越差了?連續三年沒獲得TI冠軍?
    在電競圈中,dota2可是中國電競的驕傲,在LOL電競最黑暗的那幾年,中國dota就已經拿到了三次的世界冠軍獎盃,玩家們甚至驕傲的說中國dota偶數年必得冠,Ti6Wings戰隊更是直接一穿三獲得了冠軍。
  • 超級挑戰賽匯聚中國DOTA2眾多職業選手
    完美世界DOTA2超級挑戰賽即將於8月14日正式開戰,為期三周的比賽將為Dotaer們帶來耳目一新的觀賽體驗。有別於傳統賽事中戰隊之間的互相抗衡,本次比賽內參賽選手們將各自為戰。職業選手、主播以及路人大神們將選擇自己所擅長的位置,並在特定時段內通過隨機匹配比賽贏得積分,個人積分將成為唯一衡量實力的標準。
  • 完美DOTA2聯賽海選結束 五支B級戰隊確定
    除A級聯賽直邀的5支隊伍外,參加海選的26支隊伍通過本日激烈的角逐,最終決出了B級聯賽5支晉級名額。能夠在始終有著」地獄海選賽」之稱的中國賽區一路殺出的隊伍究竟是何方神聖?下面請和我們一起了解一下這5支中國DOTA2的新生力量吧!【B級聯賽5支晉級隊伍】
  • 為什麼dota2作為獎金最高的電競,但竟然出現冠軍戰隊打假賽?
    要說電競獎金最高的賽事是什麼,當然是dota2的國際邀請賽了,從Ti4開始獎金就過了1000萬美元,這之後獎金一年比一年高,到了去年Ti9的時候達到了巔峰,獎金池足足有3200萬美元,而獲得冠軍的戰隊可以拿到1000多萬美元,折合人民幣就是一個多億,這誇張的獎金數目直接將英雄聯盟S賽的冠軍獎金給比下去了。
  • 傳奇落幕——OG官宣JerAx退役
    在萊比錫Major決戰前夕,OG再次官宣:四號位JerAx正式退役。以下是官方公告:從波士頓到上海,JerAX同我們一起譜寫一段完美的傳奇。但所有好的事物都會走向完結,JerAx正式決定退役了。感謝你為我們做出的貢獻。
  • 洛杉磯Major預選賽概況:OG等傳統強隊突圍
    今天早間(2月13日),洛杉磯Major五大賽區預選賽落下帷幕,最終12支戰隊脫穎而出。其中不乏有我們熟悉的Secret、OG、EG等傳統強隊,也有一些我們熟悉的戰隊沒有出線,老液體選手組建的Nigma在歐洲區預選賽小組賽僅僅只獲得了3分,失去了爭奪歐洲區出線名額的機會。
  • Secret獲最佳戰隊提名 DOTA2缺席最佳遊戲
    這一年的歐洲區,Secret毫無疑問就是唯一的王。天馬行空的BP、無解發揮的個人能力,這支隊伍獲得年度最佳電競戰隊當之無愧。即使最近的ESL One德國站,他們被Team Liquid擊敗僅獲殿軍,但相信他們很快就會調整狀態重回王座。
  • DOTA2的TI獎金在體育界是什麼水平?
    眾籌提高獎金額度,其收入的25%將直接歸入獎金池中,物品還能夠給喜愛的戰隊和選手增加收入。Valve打通了遊戲和賽事,賦予賽事更深層次的營銷,也將Ti的獎金數額拉到了一個誇張的地步。Ti3獎金額提升到287萬美元,破了電子競技史上最高獎金紀錄。玩家數量在7-8月增幅了39%。
  • 中國10大DOTA2未來靈魂盤點
    8.june  最早和臭腳組建了cis任中單,也是整個cis個人實力最強的,開發了很多非常潮的打法,火槍骷髏王體系,精靈猛獁體系,使得一手好的骷髏卡和蝙蝠,後來再ti賽場,最為cis唯一發揮比較有看點的選手,卻因帥鍋,帶妹辦鑑證的事件
  • 決戰平安京:OG閻魔面對強敵,閻魔強行入場,抗壓不屈最終獲勝
    決戰平安京:OG閻魔面對強敵,閻魔強行入場,抗壓不屈最終獲勝OPL暑期賽季後賽在og對陣omg的第四場中,因為這是omg的關鍵局如果勝利則是雙方都來到賽點,而輸掉則是告別比賽賽場,og的選手也是無比的重視這場比賽。
  • DOTA2十年回顧 TI1是夢開始的地方
    在2011年科隆遊戲展上,V社宣布將舉辦基於尚處於測試階段的遊戲DOTA2的一項電競賽事,命名為TI,同時宣布總獎金160萬美元,冠軍獨享100萬美金。這一消息一經發布,立刻引起來遊戲界的軒然大波。可是100萬美金這一龐大的數額讓很多人難以置信,甚至覺得是一個騙局。國外戰隊紛紛下載V社提供的測試客戶端,開始訓練。