這麼簡單的遊戲還卡殼?神經網絡在「生命遊戲」裡苦苦掙扎

2021-01-10 新智元

【新智元導讀】生命遊戲是一種基於網格的自動機。最近,有研究人員發表了一篇論文,指出儘管這款遊戲很簡單,但它對神經網絡來說,仍是個挑戰。他們的論文研究了神經網絡是如何「探索」這款遊戲的,以及為什麼它們會常常錯過正確玩法。

康威生命遊戲是英國數學家約翰·康威在1970年發明的細胞自動機。這個遊戲可以在一個無限大的2D網格上進行。

這款小遊戲在科學、計算和人工智慧中被熱烈討論,因為它代表了即使是簡單的規則,也可以產生非常複雜的結果。

在最近的一篇論文中,斯沃斯莫爾學院和洛斯阿拉莫斯國家實驗室的人工智慧研究人員指出,儘管康威生命遊戲很簡單,但對人工神經網絡來說,這仍是個不小的挑戰。

這篇文章名為「神經網絡很難學會生命遊戲」的文章中 ,通過利用神經網絡如何探索生命遊戲,他們發現電腦經常找不到正確解決方案。

生命遊戲是一個零玩家遊戲。它包括一個二維矩形世界,這個世界中的每個方格居住著一個活著的或死了的細胞。

在生命遊戲中,對於任意細胞,規則如下:

如果一個活細胞的相鄰細胞少於兩個,它就會因數量不足而死亡。

如果一個活細胞有三個以上的鄰居,它就會死於過剩。

如果一個活細胞恰好有兩個或三個活的鄰居,它就能存活。如果一個死去的細胞有三個相鄰的活細胞,它就會復活。

可以把最初的細胞結構定義為種子,當所有在種子中的細胞同時被以上規則處理後,可以得到第一代細胞圖。按規則繼續處理當前的細胞圖,可以得到下一代的細胞圖,周而復始。

基於這些簡單的規則,可以調整網格的初始狀態,來創建穩定,振蕩,滑翔等多種模式。

例如,這就是所謂的滑翔模式。

你也可以使用生命遊戲來創建非常複雜的模式,比如這個,

有趣的是,無論網格變得多麼複雜,你都可以使用相同的規則來預測下一個時間步中每個單元的狀態。

現在,神經網絡的預測能力有目共睹,那麼,深度學習模型能否學到生命遊戲的基本規則?

人工神經網絡與生命遊戲

「我們已經知道了一個解決方案,」 雅各布·施普林格,斯沃斯莫爾學院計算機科學專業的學生說,他同時也是這篇論文的合著者,「我們可以手寫一個實現生命遊戲的神經網絡,因此我們可以將學到的解決方案與手工製作的解決方案進行比較。」

雅各布·施普林格,斯沃斯莫爾學院計算機科學專業的學生

通過修改深度學習模型預測的未來時間步長值,可以很容易地調整遊戲的靈活性。

此外,與計算機視覺或自然語言處理等領域不同,如果神經網絡學會了生命遊戲的規則,它將達到100% 的準確率,不會出現模稜兩可的情況——只要出現一次失敗,那就說明它沒有學會正確的規則。

研究人員首先創建了一個小型卷積神經網絡,並手動調整其參數,以便能夠預測網格細胞中的變化順序。這證明了有一個最小的神經網絡可以代表生命遊戲的規則。

然後,他們嘗試著從零開始訓練,看看同樣的神經網絡在能否達到最佳設置。他們將參數初始化為隨機值,並對神經網絡進行了100萬個隨機生成的生命遊戲實例的訓練。神經網絡達到100%準確率的唯一方法是收斂於手工製作的參數值。這意味著人工智慧模型已經將生命遊戲背後的規則參數化。

但在大多數情況下,經過訓練的神經網絡並沒有找到最優解,並且,隨著步數的增加,網絡性能進一步下降。

果然,訓練樣本集的選取和初始參數對神經網絡的訓練效果有很大影響。

最不幸的是,你永遠不會知道神經網絡的初始權重應該是多少。常見的做法是從正態分布中挑選隨機值。

雅各布·施普林格說:「對於許多問題,你在數據集方面沒有太多的選擇; 你可以收集數據,所以如果你的數據集有問題,你可能很難訓練神經網絡。」

大型神經網絡的性能

左圖: 一個手動調整的卷積神經網絡可以非常準確地預測生命遊戲的結果。右: 實踐中,當從頭開始訓練網絡時,需要一個更大的神經網絡來獲得同樣的結果

在機器學習中,提高表現不佳的模型準確性的流行方法之一就是增其複雜性。這個技巧在生命的遊戲中起到了作用。

隨著研究人員為神經網絡增加了更多的層次和參數,結果得到了改善,訓練過程最終產生了一個近乎完美的精確度的解決方案。

但是,一個更大的神經網絡也意味著訓練和運行深度學習模型的成本增加。

一方面,這表明了大型神經網絡的靈活性。雖然一個巨大的深度學習模型可能不是解決問題的最佳架構,但是它有更大的機會找到一個好的解決方案。但另一方面,它證明了可能存在一種更小的深度學習模型,能夠提供相同或更好的結果ーー如果你能找到它的話。

這些發現與麻省理工學院 CSAIL 的人工智慧研究人員在 ICLR 2019會議上提出的「彩票假說」是一致的。該假設認為,對於每一個大型神經網絡,如果它們的參數已經根據幸運中獎值初始化,就會有較小的子網絡可以收斂到一個解決方案,因此稱為「彩票」命名法。

生命遊戲論文的作者寫道: 「彩票假說認為,當訓練一個卷積神經網絡時,小型幸運子網絡會迅速聚集到一個解決方案上。」。「這表明,梯度下降優化不是通過權值空間廣泛搜索最優解,而是可能依賴於幸運的權值初始化,這些權值恰好將子網定位在接近網絡收斂到的合理局部極小值的位置。」

斯普林格說: 「我認為這些結果肯定會激勵人們研究改進的搜索算法,或者提高大型網絡效率的方法。」

相關焦點

  • 任天堂的「無限遊戲」
    遊戲的玩法很簡單:玩家會在一個未知的時間段裡不停的輪迴,在每一世都轉生成為任天堂公司的社長,負責經營這家公司。問題來了,你打算如何給玩家設計遊戲劇本呢?遊戲劇本包含了遊戲主題、目標、以角色為基礎創作的故事線等。神秘客戶並沒有給出對於遊戲的期待,或者任何形式的「參考值」。這確實令人頭疼。如果你暫時還沒想好,我這裡有一個現成的劇本大綱,供你參考。
  • 為什麼神經網絡難以理解生命遊戲?
    我們可以發現對生命遊戲顯然有效的,幾組神經網絡的初始參數解;但隨機輸入初始參數和選擇樣本的神經網絡,卻極難理解生命遊戲,成功收斂到最優解需要一定「運氣」。我們也可以選擇,提高神經網絡的複雜性,得到較優解,但這使資金和能耗水漲船高,不可持續。這種現狀要求我們探索新的學習算法。
  • 「遊戲之外」由茱莉亞的減壓症簡單聊聊危機四伏的潛水
    「遊戲之外」由茱莉亞的減壓症簡單聊聊危機四伏的潛水 茱莉亞是不久前的恐怖交互式電影《黑相集:棉蘭號
  • 獨家首發|脈衝神經網絡迎新進展,「悠潭科技」完成天使+輪融資
    創業邦獨家獲悉,「悠潭科技」已於近日完成近千萬元天使+輪融資,本輪投資方為鼎行晟資本。創業邦持續關注的「悠潭科技」(https://www.cyzone.cn/article/553652.html)成立於2019年4月,是一家專注於研發第三代人工智慧「脈衝神經網絡」的技術研發商,以「PaaS+AIaaS」形態輸出,致力於將類腦人工智慧技術在大文娛和自動駕駛領域實現商業化應用落地。
  • 淺析電子遊戲中的「留白」藝術
    在這個場景裡,你不會遇到棘手的敵人,這次營救也不是什麼輕鬆有趣的任務,但在找到奇異之人之前要走一段長長的臺階。樓梯就像這座監牢裡的其他組成一樣扭曲且分布散亂,你需要花數十秒才能走完這段路。在《暗黑破壞神 3》這樣一款節奏緊湊、體驗刺激的作品中,這種「空虛」且寂靜的瞬間尤為少見。
  • 遊戲「AMNESIA失憶症」TV動畫化決定 新遊戲明年發售
    遊戲「AMNESIA失憶症」TV動畫化決定 新遊戲明年發售 動漫 網絡 ▪ 2012-08-06 15:35:59
  • 從「失控」走向「必然」,Facebook 們要學會玩一場「無限遊戲」
    證詞中,他第一次正面承認錯誤:「這是我的錯,我創立了 Facebook,並負責它的運營,我對當前發生的一切負有責任,我為此感到抱歉。」Facebook 數據洩露事故爆發後在數周內,「劍橋分析利用 FB 用戶數據操縱美國大選」,「Facebook 忽視用戶隱私數據保護」、「Facebook 出賣用戶隱私數據牟利」,成為外媒報導的幾大主題。《紐約時報》等外媒也不斷利用新的細節、證據,加強、加深事件的影響。用戶隱私數據的收集、使用、保護是一個全球化的話題。
  • 2020,穿山甲要幫遊戲開發者重新定義「變現」
    而作為一個互動廣告平臺,Rubeex 所不同的地方,還在於它具備數據分析、優化診斷等方面的能力。簡單來說,它能夠在素材創意上給予開發者一定的指導。綜上來看,轉變廣告的樣式和形態,是爭取更多用戶注意力的思路。針對此,穿山甲提升了產品能力,支持更多的廣告樣式,引入更多的品牌廣告預算,並且著力解決互動廣告在製作上的痛點。不加廣告,反而是不尊重用戶群體?
  • 小時候常玩的「扮家家酒」遊戲臺語該怎麼說?
    還記得任天堂紅白主機剛開始流行時,握在手上的搖杆的密碼是「上上下下左左右右 ABAB」,接著超級任天堂出來了,手上的搖杆密碼變成「上 X 下 BLYRA」。不過當時卻又保留著上一輩的傳統遊戲,在學校裡、假日同學家中,可能還是有同學玩著鬥片(尪仔標),也會拿著當時熱門的忍者龜玩具,簡單的玩起來。
  • 乙女向遊戲改編動畫「AMNESIA失憶症」製作班底公開
    乙女向遊戲改編動畫「AMNESIA失憶症」製作班底公開 動漫 178動漫頻道 ▪
  • FSD Rewrite:特斯拉的模仿遊戲_易車網
    HW 3.0 晶片讓特斯拉有了量產車裡的最強大腦,4D 視覺讓特斯拉看得更遠、更廣和更準,但所謂感知,有「感」亦要有「知」,特斯拉的神經網絡裡既有視覺神經也有思考神經,和人一樣,它們也需要學習和積累認知。特斯拉寄予 Autopilot FSD 的期望是讓它成為可以在全世界所有道路上駕駛的司機,這就意味著 FSD 要學的東西非常多了。
  • 《Oddity》團隊淺談「業餘遊戲設計師」的堅守與執念
    多年來,該項目一直在緩慢發展著,製作團隊起初把它定名為《地球冒險 4》,出於多方原因,最終還是選擇了「Oddity」這個更吸引眼球的名字。「遊戲製作完成後,我會與各位分享數不盡的(有關《Oddity》開發的)細節,」遊戲導演 Pastel 說,「這是一個很酷的項目,有一群很酷的人參與其中。
  • 生命遊戲
    然後,還可以繼續一代又一代地演化下去,周而復始。 這個「生命遊戲」看起來太簡單了,到底有什麼意義呢? 四 在這個遊戲裡,充滿了隨機性和湧現。 後來,因揭示DNA結構而獲得諾貝爾獎的三位科學家,都聲稱《生命是什麼》在他們通向雙螺旋之路上發揮了重要作用。 讓我們再回到「生命遊戲」和「元胞自動機」。 元胞自動機對於生物現象的最大影射在於: 生命的起源更像是一種相變,而進化則像是秩序和混沌之間的掙扎。
  • VR太空射擊遊戲「Impact」登陸Oculus應用商店
    VR太空射擊遊戲「Impact」登陸Oculus應用商店 2021-01-11 10:44  93913虛擬實境
  • 神經網絡和深度學習簡史(全)
    重點是——我們繪製線條的聯繫只是一個非常簡單的監督機器學習例子:要點在於訓練集(X為輸入,Y為輸出),線條是近似函數,用這條線來為任何沒有包含在訓練集數據裡的X值(輸入值)找到相應的Y值(輸出值)。別擔心,接下來的歷史就不會這麼幹巴巴了。讓我們繼續吧。
  • 遊戲王:「元素英雄卡組」構築思路
    遊戲王:「元素英雄卡組」構築思路 遊戲王作為史上第一桌遊(個人認為),樂趣就在於玩法多樣,而所有卡組均沒有標準答案
  • 別再微信裡求人了,這些免費遊戲加速器,都給你們找來了
    (強行找藉口)影響遊戲體驗的兩大罪魁禍首就是「掉幀」和「網絡延遲」了。特別是玩刺激戰場國際服時,剛落地連槍都撿不起來,瘋狂下蹲起立。在「網易UU」裡,除了國服加速、海外加速功能,還提供了各種海外熱門手遊的下載。最近上線內測的LOL雲頂之弈也能下載,不過註冊帳號還是要靠自己滴。
  • XANOVA XH200遊戲耳機評測:給你個「模塊化」的未來
    「XANOVA 是誰」,這麼個問題已經在此前評測中解答。而其端出來的首款作品,也就是 XH300-U 遊戲耳機所表現出來的,也足夠讓人有所期待。於是並不意外的,定位與定價更為親切些的 XH200 也應運而生。
  • 系列恐怖遊戲「青鬼3」手遊今年冬天配信!預約參與周邊抽選!
    系列恐怖遊戲「青鬼3」手遊今年冬天配信!預約參與周邊抽選! 動漫 178ACG ▪ 2017-11-07 18:10:35 由日本遊戲廠商UUUM和GOODROID共同開發中的恐怖遊戲青鬼系列新作「青鬼3」(iOS
  • 《賽博朋克 2077》再次放鴿子,為什麼遊戲大作總是「跳票」?
    《賽博朋克 2077》再次放鴿子,為什麼遊戲大作總是「跳票」?最近因為遊戲《賽博朋克2077》跳票,激動的粉絲紛紛在微博抵制開發公司CDProject(下文縮寫為CDPR),又因為CDPR發布的跳票通知剛好是一張黃顏色的圖片