騰訊AI 王者「絕悟」升級了

2020-12-07 電子發燒友

騰訊 AI 王者「絕悟」升級了

機器人大講堂 發表於 2020-12-02 10:29:06

AI 王者「絕悟」升級了,能達到精通金庸武俠裡所有武功的那種水平。

騰訊宣布,由騰訊 AI Lab 與王者榮耀聯合研發的策略協作型 AI「絕悟」推出升級版本「絕悟完全體」。

這一升級的背後,則是騰訊策略協作型 AI 算法能力的進一步提升,與之相關的研究也已被 AI 頂級會議 NeurIPS 2020 與頂級期刊 TNNLS 收錄。

英雄池完全解禁

在王者榮耀中,若每個職業都有 4 個紫色熟練度英雄,就能解鎖「全能高手」稱號。但受到練習時間與精力限制,很少有人能精通所有英雄,但「絕悟」做到了。

那麼,王者再進化,將有多強?

據了解,「絕悟」一年內掌握的英雄數從 1 增加到 100+,王者榮耀英雄池也實現了完全解禁,不但掌握了所有英雄的全部技能,能應對高達 10 的 15 次方的英雄組合數變化,甚至還「自帶軍師」,可做出最佳的英雄博弈策略選擇,綜合自身技能與對手情況等多重因素,派出最優英雄組合。

目前,「絕悟完全體」已在王者榮耀 App 限時開放,玩家都可與之對戰,親身體驗 AI 在複雜策略、團隊協作與微觀操作方面的強大能力。

11 月 14-30 日,「絕悟」在 20 個關卡的能力將不斷提升,最強的 20 級於 11 月 28 日開放,接受 5v5 組隊挑戰。

AI 教練的田忌賽馬術

AI+遊戲研究,是騰訊攻克 AI 的終極研究難題,也是通用人工智慧(AGI)的關鍵一步。

騰訊技術團隊的長期目標不僅是讓「絕悟」學會所有英雄的技能,而且每個英雄都要達到頂尖水平,可以根據陣型排列組合打出制勝局。

但難點就在於,「絕悟」的不同英雄會共享一個模型參數,從零學會單個陣容易如反掌,但面對多英雄組合時就難如登天。對戰中,因為地圖龐大且信息不完備,不同的 10 個英雄組合有不同的策略規劃、技能應用、路徑探索及團隊協作方式,這將使決策難度幾何級增加。

同時不可忽略的是「災難性遺忘」問題,模型容易邊學邊忘,這也長期困擾著開發者。

畢竟,一場比賽勝負的關鍵不僅在於擁有頂尖選手,排兵布陣的教練也非常重要。

基於此,技術團隊為「絕悟」找了一個能排兵布陣的 AI 教練,也就是在遊戲 BP 環節(禁選英雄)的最優策略。

【絕悟 vs 人類 BP 測試】

受到圍棋 AI 算法的啟發,研究團隊創新地採用了蒙特卡洛樹搜索(MCTS)和神經網絡結合的自動 BP 模型,能夠又快又準地選出具備最大長期價值的英雄。

具體來講,先採用引入「老師分身」模型,每個 AI 老師在單個陣容上訓練至精通,再引入一個 AI 學生模仿學習所有的 AI 老師。

最終,「絕悟」掌握了所有英雄的全部技能,正所謂「少林有七十二藝,功夫既有不同,練習之法,亦必各異。學者苟能盡之,則無敵於世矣。」

「絕悟」手握強兵善用兵

自然,團隊的長期目標,就是要讓「絕悟」手握強兵,且每個英雄都能達到頂尖水平,因此技術上有了三項重點突破:

首先,團隊構建了一個最佳神經網絡模型,讓模型適配 MOBA 類任務、表達能力強、還能對英雄操作精細建模。

模型綜合了大量 AI 方法的優勢,如:

在時序信息上引入長短時記憶網絡(LSTM)優化部分可觀測問題;

在圖像信息上選擇卷積神經網絡(CNN)編碼空間特徵;

用注意力(Attention)方法強化目標選擇;

用動作過濾(Action Mask)方法提升探索效率;

用分層動作設計加快訓練速度;

用多頭值估計(Multi-Head Value)方法降低估計方差。

其次,團隊研究出了拓寬英雄池,讓「絕悟」掌握所有英雄技能的訓練方法——CSPL(Curriculum Self-Play Learning,課程自對弈學習)。

根據下圖可以看出,使用 CSPL 方法擴展英雄池有明顯優勢。

據悉,這是一種讓 AI 從易到難的漸進式學習方法——第一步是挑選多組覆蓋全部英雄池的陣容,在小模型下用強化學習訓練;第二步是蒸餾,把第一步得到的多個模型的能力遷移到同一個大模型中;第三步是隨機陣容的強化訓練,在蒸餾後的大模型裡,隨機挑選陣容繼續強化訓練和微調。

最後,團隊搭建了大規模訓練平臺騰訊開悟(aiarena.tencent.com),依託項目積累的算法經驗、脫敏數據及騰訊雲的算力資源,為訓練所需的大規模運算保駕護航。

2020 年 8 月,開悟平臺對 18 所高校開放,未來希望為更多科研人員提供技術與資源支持,深化課題研究。

早在 2018 年 12 月的 KPL 秋季總決賽中,「絕悟」就曾公開亮相對戰人類玩家。

當時,團隊研發了監督學習(SL)方法,針對大局觀和微操策略同時建模,使得「絕悟」同時擁有優秀的長期規劃和即時操作,達到了非職業玩家的頂尖水平。

但其實,團隊對於監督學習的研發一直在進行——今年 11 月 14 日起開放的絕悟第 1 到 19 級,就有多個關卡由監督學習訓練而成。

理論上,監督學習訓練出的 AI 表現遜於強化學習的結果,但這一方向極具研究與應用價值,相關成果也入選了頂刊 TNNLS 。

如今,「絕悟」前有強兵,後有軍師,不折不扣的一代宗師終於練成了。

責任編輯:xj

原文標題:熱點|騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁

文章出處:【微信公眾號:機器人大講堂】歡迎添加關注!文章轉載請註明出處。

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 騰訊的 AI 進化了!王者榮耀「絕悟」升級,全英雄池解禁
    >AI 王者「絕悟」升級了,能達到精通金庸武俠裡所有武功的那種水平。今天,騰訊宣布,由騰訊 AI Lab 與王者榮耀聯合研發的策略協作型 AI「絕悟」推出升級版本「絕悟完全體」。這一升級的背後,則是騰訊策略協作型 AI 算法能力的進一步提升,與之相關的研究也已被 AI 頂級會議 NeurIPS 2020 與頂級期刊 TNNLS 收錄。
  • 騰訊AI聯合王者榮耀推出「絕悟」完全體
    說起 MOBA 類手遊,想必大家都能想到王者榮耀。它近日又有了新動作。11 月 28 日騰訊宣布,旗下騰訊 AI Lab 與王者榮耀聯合研發的策略協作型 AI 「絕悟」 推出升級版本 「絕悟 「完全體。目前,「絕悟 「背後採用的創新算法突破了 AI 的英雄上限,英雄池數量也從 40 個增至 100 + 個。
  • 不服SOLO:騰訊絕悟AI擊敗王者榮耀頂尖職業玩家,論文入選AAAI
    機器之心報導機器之心編輯部騰訊王者榮耀人工智慧「絕悟」的論文終於發表了。在研究測試中,AI 玩露娜和頂級選手單挑時也贏了個 3:0。據介紹,此技術支持了騰訊此前推出的策略協作型 AI「絕悟」1v1 版本,該版本曾在今年 8 月上海舉辦的國際數碼互動娛樂展覽會 China Joy 首次亮相,在 2100 多場和頂級業餘玩家體驗測試中勝率達到 99.8%。
  • 王者榮耀AI絕悟如何選英雄?騰訊AI Lab新研究揭秘
    「絕悟」在打王者榮耀時是如何選英雄的?騰訊 AI Lab 開發的 AI 智能體「絕悟」已讓王者峽谷不再只是人類召喚師的競技場,而且這個 AI 戰隊在上月底進化成了「完全體」。在一局完整的比賽中,英雄選擇階段是至關重要的(比如五射手或五法師陣容會有官方勸退)。近日,騰訊 AI Lab 和上海交通大學發布的一篇論文介紹了絕悟的英雄選擇策略:JueWuDraft。
  • 騰訊AI Lab 2020 年度回顧
    AI+遊戲:遊戲仿真世界,「絕悟」AI 策略協作能力再升級 「AI+遊戲」也是騰訊 AI Lab 深耕的研究領域。基於圍棋、《王者榮耀》、《毀滅戰士》、《星際爭霸》等遊戲平臺,騰訊 AI Lab 已經研發許多有價值的前沿技術,並創造了中國國家隊圍棋訓練專用 AI 等真實應用。
  • 登上NeurIPS 2020:騰訊AI聯合王者榮耀推出「絕悟」完全體
    11 月 28 日騰訊宣布,旗下騰訊 AI Lab 與王者榮耀聯合研發的策略協作型 AI 「絕悟」 推出升級版本 「絕悟 「完全體。 目前,「絕悟 「背後採用的創新算法突破了 AI 的英雄上限,英雄池數量也從 40 個增至 100 + 個。
  • 打「王者」的AI拿下了足球世界冠軍騰訊研發「AI+遊戲」意欲為何?
    日前,騰訊宣布,其人工智慧球隊摘得足球AI比賽----首屆谷歌足球Kaggle競賽冠軍,該冠軍球隊來自騰訊AI Lab研發的絕悟WeKick版本。騰訊方面表示,「AI+遊戲」是騰訊攻克AI終極研究難題——通用人工智慧(AGI)的關鍵一步。
  • 鵝廠AI科學家,偷偷把無人摩託寫進了年終總結
    AI+遊戲:遊戲仿真世界,「絕悟」AI 策略協作能力再升級「AI+遊戲」,也是騰訊 AI Lab 深耕的研究領域。基於圍棋、《王者榮耀》、《毀滅戰士》、《星際爭霸》等遊戲平臺,騰訊 AI Lab 已經研發許多有價值的前沿技術,並創造了中國國家隊圍棋訓練專用 AI 等真實應用。
  • 看到絕悟和阿爾法狗,王者榮耀和圍棋,張大仙柯潔被虐
    玩了十幾個賽季的王者榮耀,沒有被王者榮耀虐人的匹配機制打敗,沒有被各路主播代練虐哭,沒有被木蘭露娜複雜的操作難倒,每個玩家都有一顆不服輸的心王者榮耀的玩家們看到了天。絕悟,來了。它踩著祥雲,傲視眾生,還未完全甦醒,便將一眾凡夫打的直接掛機。任你北慕,劍仙,孤影,可傑,騷白,心態,寂然,夢淚,飛牛,藍煙,張大仙等各大主播。
  • AI「絕悟」或許早就上線,玩家實錘排位有機器人,用AI控制勝率?
    王者榮耀最近上線了一位AI對戰機器人-「絕悟」,以往推出的超強人機和此次AI機器人不同,超強人機有屬性加強,玩家們打不過的一大原因是因為對方有高額的移動速度、高額的免傷以及高額的冷卻縮減,所以我們很難打贏他們。
  • 騰訊機器人拿下足球電競世界冠軍
    深圳商報記者 陳姝日前騰訊宣布,其人工智慧球隊摘得足球AI比賽——首屆谷歌足球Kaggle競賽冠軍,該冠軍球隊來自騰訊AI Lab研發的絕悟WeKick版本。騰訊方面表示,「AI+遊戲」是騰訊攻克AI終極研究難題——通用人工智慧(AGI)的關鍵一步。
  • 騰訊AI Lab主任張潼離職,或將返回學界
    加入騰訊 AI Lab 騰訊 AI Lab 成立於 2016 年 4 月,致力於研發前瞻性的人工智慧技術。2017 年 3 月 23 日,騰訊宣布任命人工智慧領域頂尖科學家張潼博士擔任騰訊 AI Lab 主任。張潼博士作為騰訊 AI Lab 第一負責人,在一年多以來帶領數百名人工智慧專家和工程師,專注於人工智慧的基礎研究。
  • 超強人機「絕悟」即將降臨峽谷,你能戰勝他嗎
    近日,官方發布消息,在5月1號到5月4號期間,智能AI「絕悟」將登陸王者峽谷,玩家們可以在遊戲大廳組隊挑戰絕悟。能夠戰勝絕悟的玩家,將獲得五軍對決頭像框以及五五守護勳章的獎勵。同時,在4月27號至4月29號,來自各大平臺的主播高手們,將組隊對絕悟發起挑戰,全程將進行直播。
  • 「國產狗」勝「日本狗」,圍棋龍星戰騰訊絕藝報「一箭之仇」
    ,「國產狗」絕藝戰勝「日本狗」DeepZenGo(深禪),奪得冠軍,報了今年 8 月份的「一箭之仇」。DeepZenGo 獲得亞軍,而中國的「天壤」(來自天壤智能)和「神算子」(來自清華)分別取得第三和第五的成績。絕藝是誰?如果是圍棋界的人士,可能對絕藝已經非常熟悉;而非圍棋界的人士,可能除了 AlphaGo 外,並不知道還有這麼一個「國產狗」絕藝。
  • 又一視頻社交產品落地,「騰訊新聞極速版」變身為「有味」App
    從2013年第一款短視頻微視誕生,到如今視頻號開始內測,在這七年時間裡,騰訊的短視頻火焰從未熄滅。近日,據媒體消息,騰訊將「騰訊新聞極速版」App升級改造為一款名叫「有味」的產品,後者的定位是「美好生活分享平臺」。
  • AI無法成為「專利發明人」?一位計算機學者決定起訴美國專利局
    這份報告中寫到:「專利性應根據對技術進步的客觀貢獻決定,而不是主觀地由完成發明的過程來確定。」它們的相同點在於:專利發明人均為「DABUS」。值得注意的是,「DABUS」是一個 AI 系統,由大量訓練過的神經網絡組成,Thaler 將其形容為「創造力引擎」。
  • 歐盟「史上最嚴」數據保護法 GDPR 生效;騰訊上線「下飯視頻」;中...
    (來源:新浪科技、新智元)騰訊再加短視頻籌碼:上線橫屏產品「下飯視頻」在復活微視之後,近日,騰訊再上線了一款短視頻產品「下飯視頻」,產品形態為橫屏短視頻一年前,投資快手後,騰訊的另一款短視頻產品 QIM 傳來在內測的消息,這款產品被定位類似於「美拍」、「快手」,主打拍照、短視頻分享,在廣場可以看到附近的人分享的視頻照片。
  • AI 影響因子 8 月份回顧:騰訊 AI Lab 再佔榜首
    此外,雷鋒網 AI 科技評論也整合了諸如與高校實驗室合作、學術會議贊助等企業活動,嘗試為讀者們提供一個全面的數據平臺。距離「AI 影響因子」上線已經五個月時間,4 月份至 7 月份我們相繼推出四篇「AI 影響因子」的相關盤點:AI 影響因子:4 月份都有哪些企業研究院在影響你?
  • 網易和小米率先按下了「大逃殺手遊」的 F 鍵,誰能最終「吃雞」? |...
    目前網易和小米的手遊產品《荒野求生》和《小米槍戰》已經在 App Store 遊戲排行榜榜首會晤,擠下了騰訊的王牌產品《王者榮耀》。而緊跟在《王者榮耀》後面的同樣也是網易的「大逃殺」手遊——《終結者 2:審判日》(圖片截圖自 App Store)網易作為遊戲大廠,也是國內在手遊時代唯一能與騰訊站在角鬥場的對手
  • 騰訊新聞極速版變身為「有味」APP,你還敢說騰訊沒有夢想嗎?
    近日騰訊新聞極速版重大升級,搖身一變成了「有味」APP,該APP主打社交+視頻內容,這是騰訊在視頻社交上的又一次嘗試。騰訊如今是網際網路的社交霸主,雖然地位一直被挑戰,但從未撼動過。可能如今騰訊社交就算拿著望遠鏡可能都找不到對手,就算如此,騰訊的社交產品不斷的優化著自己,嘗試著各種可能,近期微信上線拍一拍就是很好的證明。