通過程序生成一個有趣的電子視頻遊戲環境不僅具有挑戰性,而且非常耗時。利用機器學習生成場景的Promethean AI等工具有望在一定程度上減輕設計負擔。但困難依然存在。
這就是Facebook、洛林大學和倫敦大學學院的研究人員在一份預印本論文中研究用AI方法創建遊戲世界的原因。他們利用基於文本的奇幻多人冒險遊戲《LIGHT》中的內容,設計了能夠生成位置和角色並即時動態生成新內容的模型。
該論文中寫道:「我們展示了機器學習算法如何學會組裝不同的元素,安排位置,並用字符和對象填充它們。此外,我們證明了這些工具可以幫助人類交互式地設計新的遊戲環境。」
讓我們回顧一下,LIGHT是由同一組科學家在今年3月份發表的一篇論文中提出的,它是一個基於文本的遊戲形式的研究環境,在這個遊戲中,人工智慧和人類作為玩家角色進行交互。大致來說,它包括基於一組區域和生物群落的663個位置的眾包自然語言描述,以及3462個對象和1755個字符。
在這項最新的研究中,該團隊構建了一個模型來生成遊戲世界,這需要製作位置名稱和包含背景信息的描述。他們使用劃分為測試集和驗證集的相鄰位置的例子來訓練模型,這樣每個位置在集合中都是不同的。一個模型只訪問位置的名字,另一個只訪問位置描述信息,架構,在考慮了兩個排名模型的基礎上進行架構設計,以便在創建新世界時,得到幾個評分較高的候選。
為了創建一款新遊戲的地圖,模型預測了每個現有位置的鄰近位置,並為每個新添加的位置填充了周圍環境。一個位置最多可以連接到四個相鄰的位置(儘管不是所有的連接都需要填充),並且位置不能在一個地圖中出現多次。
一組單獨的模型產生可以與角色交互的對象。每個對象都有一個名稱、描述和一組表示對象相應屬性的信息,如「能得到的」和「可飲用的」等。研究人員使用與LIGHT位置相關聯的字符和對象,創建了數據集來訓練放置算法位置中的對象和角色,以及對象中的對象(例如,錢包內的硬幣)。
另一個從世界創建任務中獲取語料庫的模型庫,通過利用20億Reddit評論預訓練Transformer架構,創建了新的遊戲元素,如位置、角色、對象等。這些模型之所以被選中是因為它們的極舒適的類自然人類對話,因為它們表現出「創造力和講故事的要素」。它根據位置名稱預測了背景和描述;賦予對象名稱的角色和描述;或給出對象名稱的描述和啟示。
那麼它是如何協同工作的呢?首先,初始化一個空的地圖網格來表示可能的位置數量,並將網格位置的一部分標記為不可訪問,以使探索變得更有趣。中心位置是隨機填充的,性能最好的模型迭代填充鄰近位置,直到填充整個網格。然後,對於每個放置的位置,一個模型預測哪些字符和對象應該填充該位置,然後另一個模型預測是否應該將對象放置在現有對象中。
研究人員還提出了一個人類輔助設計範例,其中的模型可以提供建議,哪些元素放置。如果人類設計師輸入數據集中不存在的遊戲元素的名稱,生成模型就會寫出描述、角色和啟示。
在實驗中,該團隊使用他們的框架生成了5000個世界,最大可容納50個位置。數據集中大約65%和60%的字符和對象是在完整的5000張地圖之後再生成的。最常被放置的位置是「國王的住所」(佔生成世界的34%),而最不常被放置的位置是「邊緣運河」,80%的世界有超過30個位置。
儘管生成模型並沒有充分利用現有的所有實體,但研究人員表示,他們生成的地圖總體上是有凝聚力的、有趣的和多樣化的。他們寫道:「這些步驟展示了一條用眾包內容創建有吸引力的遊戲世界的道路,它既可以讓人使用輔助模型來創建,也可以使用完全自動化的生成。」