玩躲貓貓遊戲 AI學會攻防術

2021-01-09 環球網

儘管機器學習在諸如圍棋和Dota 2等複雜遊戲中取得了顯著進步,但在這些領域掌握的技能並不一定能推廣到真實場景中實際應用。越來越多的研究人員正在尋求建立一種機器智能,使其行為、學習和進化更像人類。

總部位於舊金山的OpenAI公司近日發表的一篇新論文提出,在兒童的「躲貓貓」遊戲中訓練模型,並在數以千萬計的競賽中使它們相互對抗,可導致模型自動發展出類似人類的行為,從而提高智力並改善後續行動的性能。

為什麼選擇躲貓貓?

該論文的第一作者、OpenAI研究員博文貝克認為,躲貓貓被選為一個有趣的起點,主要是因為其規則很簡單。所有遊戲中的代理(Agent,也稱智能體,指能自主活動的軟體或硬體實體)都被模擬為球形對象,可執行3種類型的操作:導航、抓住並移動物體、鎖定對象,且只能由該代理的隊友解鎖。

研究人員在模擬的、物理接地的環境中放置了1—3個「躲藏者」和1—3個「尋找者」,房間的邊界是靜態牆。環境中還包括不同尺寸的可移動箱子和可移動坡道。

研究人員使用強化學習來訓練遊戲代理,並遵循簡單的躲貓貓規則:隱藏者成功躲過尋找者的追逐,或是尋找者成功找到躲藏者。

AI如何玩躲貓貓?

在經過數億次的遊戲後,AI代理經歷了幾個階段的策略發展過程。

在初始階段,躲藏者(藍色)和尋找者(紅色)通過在空間中移動而不操縱任何物體,制定了非常粗糙的躲避和追逐策略。

在經歷2500萬個回合後,遊戲變得更加複雜。躲藏者學會了移動和鎖定在環境中的箱子和路障,以在自己周圍建立堡壘,這樣尋找者就永遠看不到它們了。不僅如此,他們還制定了協調戰略,例如相互傳遞物體,以加快建造堡壘的進程。

然而,在遊戲進行了7500萬回合之後,尋找者發現了一個反策略。他們學會了在躲藏者的要塞旁邊移動一個坡道,並用它來爬過牆壁。

作為回應,躲藏者學會了將坡道移入他們的房間,因此尋找者無法用它來越過牆壁。

隨著環境變得越來越複雜,躲藏者學會了使用細長箱子建造更強大的「堡壘」。雖然OpenAI認為這將是最終的策略,但在遊戲進行到3.8億回合時,尋找者再次成功反擊,找出一種方法來跳到一個盒子上並利用動力在它上面「衝浪」,越過牆壁進入堡壘。

在最後階段,躲藏者學會在建造堡壘之前鎖定所有箱子,以防止「箱子衝浪」。

研究人員將這些不同策略的演變稱為「來自多智能體自動課程的緊急技能進展」。「自動課程」這一術語是今年由DeepMind創造的,適用於多個代理逐漸創造新任務以在特定環境中相互挑戰。OpenAI的研究人員認為,這個過程在自然選擇方面具有相似之處。

這項研究為啥很重要?

鑑於躲貓貓相對簡單的目標,通過競爭性自我遊戲訓練的多個代理學會了使用工具,並採用人類相關技能來獲勝。OpenAI認為,這為未來的智能代理開發和部署提供了一個有前景的研究方向。OpenAI正在開源其代碼和環境,以鼓勵在該領域進一步研究。

OpenAI的最終目標是構建能夠在一個通用系統中執行多項任務的人工通用智能(AGI)。雖然可能會有不同的目標,但OpenAI正在大力投資由大規模計算能力實現的強化學習研究。OpenAI最近與微軟籤署了一份價值10億美元的為期10年的計算合同。

躲貓貓遊戲研究也激發了OpenAI,因為隨著環境複雜性的增加,遊戲中的代理不斷地通過新策略自我適應新的挑戰。貝克表示:「如果擴展像這樣的流程,並將其放入更複雜的環境中,那麼你可能會得到足夠複雜的代理,以便為我們解決實際任務。」

挑戰在哪裡?

遊戲代理有時會表現出令人驚訝的行為。例如,躲藏者試圖完全逃離遊戲區域,直到研究人員對此施加懲罰。

其他挑戰可能歸因於模擬環境設計中的物理缺陷。例如,躲藏者了解到,如果他們在拐角處向牆壁推動斜坡,斜坡將由於某種原因穿過牆壁然後消失。這種「作弊」說明了算法的安全性如何在機器學習中發揮關鍵作用。研究人員說:「在它發生之前,你永遠不會知道。這類系統總是存在缺陷。我們所做的基本上是觀察,以便我們可以看到這種奇怪的事情發生,然後試著修復物理缺陷。」

相關焦點

  • 為啥寶寶玩「躲貓貓」時,只擋小腦袋?你以為的無聊遊戲並不簡單
    今日問題:你家寶寶喜歡玩躲貓貓嗎?小孩子最喜歡大人陪著一起做遊戲,即使是一些簡單的遊戲,孩子玩起來都會特別高興,家長看著也覺得孩子很可愛。而躲貓貓就是很多小寶寶特別喜歡玩的遊戲,即使是小月齡的寶寶也能跟家長互動起來。
  • 躲貓貓大作戰安卓版在哪下載 下載地址分享
    躲貓貓大作戰是最新上架的一款休閒益智小遊戲,很多玩家想趕緊下載體驗一下,今天小編就為大家帶來了安卓版的下載地址,感興趣的安卓手機的玩家不要錯過哦!躲貓貓大作戰安卓版地址:http://sj1.3987.com:801/down/duomaomaodazuozhan.3987.apk貓貓大作戰是一款休閒趣味遊戲,遊戲中我們可以偽裝成場景裡的任何物品,唯一的目的就不要讓人發現你,只要你能生存5分鐘你就贏得了勝利,還等什麼快來體最驗簡單的快樂吧!
  • 孩子為什麼喜歡玩躲貓貓
    所以媽媽在家裡跟孩子玩躲貓貓的時候,就不能把難度搞得很大,也不要覺得躲貓貓的重點在於躲,你假裝讓孩子找不到。我們通過兒童觀察發現,母親在跟孩子玩躲貓貓,在轉身走的那一刻對孩子的傷害是最大的。躲貓貓的重點不在於躲,而是在於被發現和被找到。所以我們可以看到,孩子每次被母親抓到的那一刻是高興的,看他的表情,他是非常的開心,他是興奮的尖叫著。
  • 《csgo》躲貓貓怎麼玩 躲貓貓玩法攻略詳解
    導 讀 csgo躲貓貓玩法教程 教你如何躲到最後 csgo是一款第一人稱射擊遊戲。
  • 慢養良育(總序130):第三版「躲貓貓」遊戲
    出生第552天(一)(總序130):第三版「躲貓貓」遊戲由於她早上起來的比較晚,所以到了睡午覺的時間她一點困意都沒有。今天她特別愛玩躲貓貓遊戲,她管這個遊戲叫「貓貓」。無論在屋裡那個地方,當她想玩這個遊戲的時候,她會徑直跑到南臥室的窗簾旁,抓住窗簾的一邊,自己轉一圈,用窗簾把自己裹起來。
  • 為什麼寶寶喜歡玩躲貓貓?原因出乎人意料
    宅在家無所事事,躲貓貓成了女兒最喜歡玩的遊戲。 細想起來,這款遊戲是Mommy陪她玩過的時間跨度最長的一款遊戲,大概從她出生兩個月開始,Mommy就已經在和她玩躲貓貓的遊戲了。 那時我用雙手捂住臉,然後再突然把手拿開,誇張地對著她說「喵」,每次都能把她逗得手舞足蹈。
  • 從「躲貓貓」遊戲看孩子的認知發展
    「躲貓貓」是許多幼兒期寶寶愛玩的,被稱為是全世界的父母最愛和孩子玩的一種親子遊戲。有研究表面,4個月大的嬰兒就能和媽媽玩「躲貓貓」的遊戲了,6個月的寶寶就已經深得「躲貓貓」的精髓。研究表明,寶寶之間的遊戲互動特別是假裝遊戲能促進寶寶觀點採擇能力的發展。因為在遊戲中,寶寶經常扮演不同的角色,這使寶寶意識到別人的觀點與自己的觀點其實是不同的。
  • 恐怖躲貓貓小遊戲:第五人格小程序版上線!3D恐怖躲貓貓遊戲
    每天推薦好玩遊戲!  關注我們,沐沐帶你發現好遊戲!  《恐怖躲貓貓》遊戲小程序好玩嗎?  《恐怖躲貓貓》小遊戲怎麼玩?  怎麼進入《恐怖躲貓貓》?  PS、這是一個沒有贊助商的公眾號,  暫時沒有廣告遊戲,  可以放心的玩哦!  ————————————————————————
  • 孩子為什麼喜歡玩「躲貓貓」?心理學詳細解析背後的原理
    許多父母會發現,在8~12個月的時候,孩子對「躲貓貓」這個遊戲突然有了極大的興趣。每次我們在孩子面前,把手放在臉上「藏」起來,打開雙手讓他看到我們的臉重新出現時,總會引來孩子一陣陣清脆悅耳的笑聲。這銀鈴般的笑聲就像一味助推劑,讓我們不由自主地重複和孩子玩起來。隨著孩子開始學步,探索的範圍變得更大,你可能還會發現孩子對藏物品非常著迷。
  • 孩子為什麼喜歡玩「躲貓貓」?心理學詳細解析背後的原理
    到底孩子為什麼喜歡玩「躲貓貓」的遊戲?動作的背後隱藏著什麼秘密呢?今天我們一起來看看。孩子為什麼喜歡玩「躲貓貓」?孩子喜歡玩「躲貓貓」,玫瑤老師認為主要有以下三個原因。探索「物體恆存性」,開始學習用「圖示」解決問題最開始的時候,嬰兒許多動作是沒有目的的,比如說他揮動雙手的時候偶然碰到自己的臉,發現了自己的手並把手指放進口中。
  • 「躲貓貓」的作用,被嚴重低估了,這樣玩寶寶更聰明
    剛生完二胎的閨蜜丫丫帶著4個月兒子來工作室玩,我們好久沒見到這麼小的寶寶了,就都圍上去逗他。我用手捂住臉,然後突然又把手拿開,和寶寶玩「躲貓貓」的遊戲,逗得小嬰兒咯咯咯地笑。閨蜜感嘆:「小嬰兒就是笑點低!」
  • 《創造與魔法》園林躲貓貓怎麼玩 園林躲貓貓副本分享
    導 讀 創造與魔法園林躲貓貓副本怎麼玩?這個副本的入口在哪裡?
  • 《創造與魔法》園林躲貓貓怎麼玩 園林躲貓貓副本攻略
    導 讀 創造與魔法園林躲貓貓副本怎麼玩?這個副本的入口在哪裡?
  • 慢養良育(總序104):躲貓貓遊戲的雛形
    出生第384天(二)(總序104):躲貓貓遊戲的雛形這幾天她還表現出了比較特別的地方:喜歡在大人吃飯的時候鑽到飯桌底下躲起來。不僅如此,她還要求家人從不同的地方往下看,爸爸的臉從這邊出現,媽媽的臉從那邊出現,有的時候兩張大臉還在不同的地方同時出現!對此遊戲她樂此不疲。
  • 《女巫來了》:當「躲貓貓」做成遊戲
    眾所周知,對「躲貓貓」遊戲的喜愛,不單單是遊戲簡單好玩,還來源於童年時陪自己一起無憂無慮玩耍的小夥伴。而現在遊戲有了,去哪兒找一起玩的人呢?《女巫來了》所呈現的,大概就是童年時最心嚮往之的「躲貓貓」場景——夢幻般的童話世界。這裡沒有苦大仇深的仇恨。
  • 《女巫來了》童年最嚮往的「躲貓貓」遊戲
    相信大家在小時候都玩過躲貓貓這個遊戲,那麼我們能在線上玩躲貓貓嗎?《女巫來了》這款遊戲的就能做到,這款遊戲所呈現的,大概就是童年時最心嚮往之的「躲貓貓」場景——夢幻般的童話世界。很多玩家對這個遊戲還不是很了解,小編我特意整理了相關的資訊,感興趣的來看看吧。這裡沒有苦大仇深的仇恨。
  • 「媽媽,躲貓貓」,寶媽玩遊戲不配合,2歲女兒抬起手臂咬了一口
    2歲女兒想玩躲貓貓,寶媽沒有及時應答,結果娃狠咬自己手臂一口有一回在吃晚飯的時候,女兒對寶媽說道:「媽媽,躲貓貓。」寶媽對女兒說道:「寶寶乖,媽媽吃完飯再陪你躲貓貓好嗎?」女兒拉住媽媽的手搖頭:「不要。」寶媽假裝誤解女兒放棄了躲貓貓的遊戲,繼續吃飯。而女兒見媽媽很長一段時間都沒有反應,感到非常著急,不停地對媽媽重複剛才的話。寶媽哄女兒:「寶寶再等五分鐘,吃完飯就陪你玩。」
  • 「躲貓貓」英文怎麼說?
    這種遊戲就叫「躲貓貓」。你知道「躲貓貓」的英文怎麼說嗎?這種遊戲就叫「躲貓貓」。 An early theory of why babies enjoy peekaboo is that they are surprised when things come back after being out of sight.
  • 男人喜歡玩「老鼠躲貓貓」的出軌遊戲,一招「欲擒故縱」搞定他
    這才是值得我們去思考的問題,首先我們要識破男人喜歡玩的出軌伎倆。玩「老鼠躲貓貓」的遊戲是男人出軌的一貫伎倆出軌婚姻已經成為了人們心中深惡痛絕的一種現象,可出軌的事情還是層出不窮。有很多男人儘管身體出軌了,但他們的心裡卻並不想離婚失去這個原配家庭。不過,可惡的是他們又總是經不起外面的誘惑而頻繁出軌婚姻。
  • 寶寶「躲貓貓」時只藏小腦袋?遊戲看似簡單,其實反映出兒童心理
    文丨箐媽(文章原創 ,版權歸本人所有,歡迎寶爸寶媽們轉發分享)躲貓貓這個遊戲深受孩子喜歡,所以很多家長跟孩子互動最多的遊戲就是躲貓貓。叮叮爸爸工作雖累,可是他回家之後都會跟孩子進行互動,他們兩父女在家玩得最多的就是躲貓貓,而且據叮叮爸說,叮叮從開始的只藏一個腦袋,到現在玩得特別溜,在這個過程中,叮叮爸總是樂此不疲地陪玩,他說喜歡看到孩子的笑容,也喜歡在這個遊戲中看到孩子的變化。