遊戲達人!谷歌發布的這款AI會玩57款雅達利遊戲 水平比AlphaZero...

2020-12-05 前瞻網

人工智慧會勝過人類嗎?2016年,谷歌開發的AlphaGo成為了首個擊敗圍棋世界冠軍的人工智慧,向人類有力地證明了這一點。

此後,谷歌2017年又開發了「升級版」AlphaZero,它是一種可以從零開始,通過自我對弈強化學習在多種任務上達到超越人類水平的新算法,堪稱「通用棋類AI」。

AlphaZero不僅擅長圍棋,還擅長西洋棋和日本將棋,陸續擊敗了世界冠軍級人物,可謂「多才多藝」,還登上了2018年的《科學》雜誌封面。

現在,谷歌母公司Alphabet旗下的DeepMind又發布了一個更厲害的人工智慧:MuZero。

與已經提前得知遊戲規則的AlphaZero相比,這次的MuZero能夠自動學習規則,並且在57款不同的雅達利遊戲中取得了行業領先的表現,能夠達到與AlphaZero在三種棋類中的表現相等的水平。

(圖表:在西洋棋、圍棋、圍棋和雅達利的訓練中MuZero達到的評價,y軸表示Elo等級)

此外,在圍棋方面,MuZero的表現略優於AlphaZero,儘管它使用的總體計算較少。研究人員表示,這表明它可能對自己的處境有了更深入的了解。

MuZero將基於樹的搜索與學習模型相結合(樹是一種數據結構,用於從集合中定位信息),它接收到的是觀測數據,比如棋盤或雅達利遊戲的屏幕圖像,這一點與人類下棋、玩遊戲時的狀態相同。

隨後MuZero將會不斷迭代更新觀測到的數據,並且在每一步都使用模型預測接下來的策略(例如在哪裡下棋)、價值函數(例如誰將得分)和即時獎勵(如能夠得到多少分)。

簡單地說,MuZero自己探索出了遊戲的規則,並在此基礎上實行精確的規劃。

DeepMind的研究人員解釋,MuZero和AlphaZero的核心技術是強化學習的一種形式——即用獎勵驅動人工智慧朝著目標前進。

該模型將給定的環境建模為中間步驟,使用狀態轉換模型預測下一步,使用獎勵模型預測獎勵。

通常,基於模型的強化學習側重於直接在像素級別對觀察流進行建模,但是這種粒度級別在大規模環境中計算開銷很大。

事實上,之前沒有任何一種方法能夠在視覺上很複雜的領域(如雅達利遊戲)建立起一個便於進行規劃的模型,即使在數據效率方面,結果也落後於經過調優的無模型方法。

該研究團隊還重點觀察了MuZero在圍棋和遊戲《吃豆小姐》中的表現。MuZero每步只有6次模擬——少於每步模擬的可能次數,不足以涵蓋《吃豆小姐》中所有八種可能的行動——因此,它學會了一種有效的策略,並「迅速改進」。

研究人員表示,無論是在邏輯複雜的棋類遊戲還是視覺上複雜的雅達利遊戲中,MuZero的表現都能媲美此前的AI算法,並且勝過最先進的無模型(強化學習)算法。

AlphaGo的成功讓越來越多人意識到了強化學習的激動人心之處。此前,機器學習領域頂級會議 NeurIPS 2019主辦的Learn to Move 強化學習賽事中也出現了不少有意思的案例。

參賽者需要根據主辦方提供的人體骨骼高仿模型中多達 100 多維以上的狀態描述特徵,來決定模型肌肉的信號,控制模型的肌體行走。賽事不僅要求模型的實時速度變換,還要360° 範圍調整行走方向。

百度基於飛槳的強化學習框架PARL再度蟬聯冠軍,且將第二名拉下143分。百度的模型中甚至出現了一些普通人也難以做到的動作,如從立定狀態突然平順地向後轉向並且同時以要求的速度行走,並全程保持穩定不會摔倒。

在這個領域內的成功有助於了解人體的運動機制,從肌肉層面學習控制仿生機器人的運動。

本文來源前瞻網,轉載請註明來源。本文內容僅代表作者個人觀點,本站只提供參考並不構成任何投資及應用建議。(若存在內容、版權或其它問題,請聯繫:service@qianzhan.com) 品牌合作與廣告投放請聯繫:0755-33015062 或 hezuo@qianzhan.com

相關焦點

  • DeepMind秀出最強遊戲AI!57場Atari遊戲超過人類,復盤遊戲AI進化史
    智東西(公眾號:zhidxcom)編 | 董溫淑智東西1月12日消息,谷歌旗下人工智慧公司DeepMind開發出史上最智能的代理Agent57。該代理在街機學習環境中表現良好,在57款雅達利遊戲中的表現超過人類平均水平。
  • DeepMind全能AI:完全自學規則,攻破多款遊戲,表現碾壓人類!
    然而就在昨天,曾開發AlphaGo的DeepMind公司在《自然》上發文,正式宣布了MuZero:這個新的算法不僅精通圍棋、西洋棋和將棋,還能在30多款雅達利(Atari)遊戲上全面超越過去的人工智慧算法和人類。MuZero的正式發布,為人工智慧領域揭開了新的篇章。
  • 我只是個遊戲肥宅!玩遊戲也有這麼強的破壞力?
    1982年年底,遊戲史上出現了一次臭名昭著的「雅達利崩潰」,不僅直接造成了美國遊戲巨頭雅達利的衰落,還引發了一起大型環境危機:由於粗製濫造,無人問津,超過350萬份《ET外星人》雅達利主機遊戲卡帶,被埋進了美國新墨西哥州的垃圾填埋場,直到32年後,才被重新發掘處理
  • 圍棋擊敗AlphaZero!各類遊戲測試碾壓前輩,谷歌DeepMind AI再添新員
    一、「自學成才」的MuZero谷歌DeepMind在去年年底發表在《科學》雜誌上的一篇論文中,詳細介紹了AlphaZero,這是一種人工智慧系統,可以通過自學掌握西洋棋、日本「將棋(shogi)」以及中國的棋盤類遊戲「圍棋」的玩法。
  • 國內遊戲市場為何畸形?三個大事件徹底改變中國遊戲環境
    中國遊戲環境變成這樣的原因很多,但是有三次大事件起到了決定性的作用,一直影響至今。第一個事件就是1997年《血獅》的發售。這款遊戲相信不少人都已經聽聞過它的大名了,但這絕不僅僅是一款垃圾遊戲而已。因為血獅在發售前用了非常大的手筆宣傳,在宣傳中聲稱這是一款可以超越《命令與徵服》的即時戰略遊戲。
  • 魔玩空間 | 炸裂的遊戲心!9款適合女生玩的主機遊戲
    當然,香菜沒有別的意思,《血緣詛咒》作為一款暗黑風格的動作類角色扮演遊戲相當出色,難度高爽快度也高,僅管過程容易受苦,但通關之後會異常快樂。BUT,確實不太適合新手妹子,為什麼呢?首先,沒有接觸過主機遊戲的話,不太習慣手柄操作,許多遊戲中的組合鍵不易上手;其次,遊戲接觸少,會對3D感到暈眩,尤其是對於畫質極為真實高清的畫面,各種真實的反饋讓萌新感到暈眩。
  • 程式設計師最愛的8款代碼遊戲 邊玩遊戲邊擼代碼
    休息的時候,玩遊戲是最好的放鬆方式。如果有這麼一款遊戲,能在放鬆的同時鞏固學到的代碼、學到新代碼,就再好不過了。W3Cschool精選8款熱門遊戲,趕緊來邊玩遊戲邊擼代碼吧!1.Hack Run、Hack Run Zero、Hack Time這是黑客入侵解謎遊戲系列遊戲,相信不少程式設計師並不陌生。
  • 為什麼人工智慧專家喜歡用遊戲訓練AI?
    遊戲公司也開始意識到這一點。例如,微軟2015年6月啟動了Project Malmo,這是一個以微軟最近收購的熱門遊戲《我的世界》為基礎打造的人工智慧開發平臺。2016年11月,作為策略遊戲《星際爭霸2》的開發商,動視暴雪也宣布與谷歌(微博)旗下DeepMind展開合作。
  • 騰訊移動遊戲發布石器時代DNF等11款新品
    【17173專稿,轉載請註明出處】在移動遊戲30分鐘的發布環節中, 一向低調的騰訊移動遊戲平臺一口氣發布了全新的11款手遊,《星河戰神》、《天天傳奇》、《腦力達人》、《英雄殺》、《保衛蘿蔔3》、《奇蹟暖暖》、《石器時代》、《地下城與勇士》、《無盡之劍》、《火影忍者
  • 中國開發者給力,這款遊戲獲得了蘋果和谷歌應用商店年度最佳稱號
    2020年即將過去,有哪些手機遊戲讓你記憶深刻呢?最近世界上最有名的兩個應用商店根據往年慣例選出了年度最佳應用和遊戲。其中我國的遊戲開發者公司——米哈遊出品的《原神》同時被App Store和谷歌Play收錄為年度最佳遊戲,要知道同時獲得這兩個平臺的"最佳獎項"是非常不容易的相信大部分玩家對原神這款遊戲都非常了解,因為這款遊戲在未正式發布就已經吸引了很多人的眼球。
  • 星際旅行的遊戲,你玩過幾個?這款遊戲還可以這樣操作……
    哈嘍,大家好,今天給大家分享的一款遊戲叫做《天外世界》,這款遊戲小編玩了很長時間,都快要通關了,但是不知道咋整的,做任務做著做著就沒有任務提示了。可能小編下載的這個單機遊戲是從網絡上下載,沒有從官網上下載,所以才導致玩著玩著,有些東西缺失並不是很全面的。
  • 好玩的太空模擬類遊戲推薦!這五款遊戲呢玩了嗎
    這款遊戲之所以不同於傳統的網遊是因為遊戲中的戰役既可以在線與其他人一起玩,也可以線下自己玩(單機部分稱作Squadron 42),但是遊戲的戰鬥場景適合60到100人, 遊戲中玩家可以在飛船內部走動,其他玩家也可登上別人的飛船。只要你足夠富有,你甚至可以擁有可搭載其他玩家的飛船的巨型戰艦,當然你操控飛船而其他玩家控制火炮這樣的玩法也不在話下,在這款遊戲中,玩家可以體驗到更多更複雜的太空互動元素。 2.
  • 這20款大名鼎鼎的遊戲玩的就是心跳!
    不過玩到後來,玩家也會發現這款遊戲的策略性要求可能高過潛行類要求,但並不妨礙它成為一款經典的作品。而且,這款遊戲玩起來也相當的爽,因為它創造了忍者一擊必殺的規則,而且擊殺的時候還有特寫鏡頭,簡直一本滿足!
  • 非常適合在室內玩的4款親子紙杯遊戲
    紙杯應該是每個家庭必備的一款喝水用具,尤其是家裡有孩子的家庭,相信有很多媽媽們有做過紙杯手工。今天樹姐姐給大家分享4款簡單的紙杯親子遊戲,讓孩子在遊戲中學到知識,我想這應該就是寓教於樂的樣子吧! 第一款遊戲:將網球立於紙片上。
  • 《捕魚達人2》評測:讓人有賭癮的休閒遊戲
    作為一款下載量超過8500萬的熱門遊戲的續作,《捕魚達人2》延續了前作的吸引力,同時還增加了新的關卡以及讓人愛不釋手的全新炮彈連發。在遊戲中,炮彈依大小不同而有對應的金幣數量。最貴的炮彈最有可能是只抓住一條最小的魚,而如果你的運氣好,則可能用只值一個金幣的炮彈捕到一條雙髻鯊。這種或然性和靠運氣的玩法讓這款遊戲的玩法變得複雜,而不是表現看上去那麼簡單,同時,這也會讓玩家時不時地感到崩潰。玩家當然可以使用特別的獎勵來實現不同的射擊效果,如捕捉屏幕上所有的魚,或者玩彩票式的小遊戲。
  • 《捕魚達人網頁版》 3D休閒與街機遊戲完美結合
    》成功開啟第二次內測,玩家們興致高漲,一時間,伺服器人滿為患……其實,說起《捕魚達人網頁版》,大家一定也會想起去年火熱全國的街機捕魚遊戲,這款風靡全國的休閒街機遊戲還先後發布了客戶端版《捕魚達人之深海狩獵》和《捕魚達人ipad版》,每款產品問世,都引起市場極大的反響,深受玩家們喜愛。
  • 遊戲史上最偉大的100款遊戲 你玩過幾款?
    Gamesradar最近為我們評出了史上最偉大的100款遊戲,100款,這對於全時代來說並不是過分的數字,如果你是一個80後,甚至70後的專業玩家,那大多數遊戲你都不該漏掉,起碼有所耳聞。另外這篇文章會讓你有一種不斷穿越的感覺,因為全時代性質,你看到的不會像過去評選文章那樣相近的遊戲風格,這裡不僅是懷舊,還有近年來眾多新作的加入,其中這部分實際上還有待時間的考驗,它能否在玩家的腦海中烙下深刻的烙印,這都要在數年之後重新驗證。
  • 《彩獨 2》:玩過這款遊戲,我再也不怕分不清口紅色號了
    如果你的男友或者你本人,對於口紅只能說出紅和粉,那麼一定要抓緊時間玩玩今天推薦的這款遊戲補一補了,玩過後脫單說不定指日可待呢,順便一提,送女孩子口紅做禮物準沒錯!《彩獨2》是一款鍛鍊色彩辨識度和感知度的益智遊戲,整個遊戲基於世界各地藝術學校所教的色彩原理和練習而打造。
  • 玩過這麼多恐怖生存類遊戲,這兩款遊戲你肯定沒玩兒過
    這款恐怖解謎遊戲的男主Thomas便是後者,而且三結局全通之後我們會明白他將再也無法走出自己編織的無盡夢魘。遊戲中很多情節源於遊戲製作者的親身經歷,所以遊戲雖然大部分採用黑白畫質,卻給人強烈的代入感。出於對讀者的負責,還是決定把這款迷宮遊戲歸類為恐怖遊戲。儘管遊戲推薦使用耳機,但是患有心臟病者請勿戴耳機!請勿戴耳機!請勿戴耳機!重要的事情說三遍!好了接下來介紹遊戲,這是一款極有創意的遊戲,玩家將體驗黑暗中前行失去視覺只能依靠聽覺來判斷情況的感受,所以一定要開聲音玩這款遊戲(不要在人多的地方玩這個遊戲!)。
  • 6款休閒手遊推薦:《腦裂》這款遊戲是好遊戲,就是容易讓人暴躁
    所以對於一些比較忙的上班族或者學生黨,這種比較耗時的遊戲玩起來相對比較累。今天就給大家推薦幾款打開手機就能玩的高分小遊戲,即時即效還能開動大腦!交叉線!大家應該都玩過割繩子的遊戲,而《交叉線!》就是一款典型的繩鎖類解謎益智。