谷歌新款「怪物製造機」,用GAN一鍵生成定製版「哥斯拉」

2020-12-02 新智元

【新智元導讀】你想像中的「怪獸」是什麼樣的?長著老虎的身體、恐龍的腦袋?還是有著貓的爪子、鷹的翅膀?谷歌的一個研究團隊推出了一款名為 Chimera Painter 畫圖工具,使你可以將生物的頭、爪、耳朵、爪子等隨意組合,然後一鍵生成一隻屬於你自己的「怪獸」。

「亞古獸進化,暴龍獸!」

隨著一聲召喚,一隻萌萌的數碼寵獸變身為體型巨大的數碼戰鬥獸。

相信很多80、90後的同學都對這一部《數碼寶貝》印象深刻,童年他們也曾幻想能夠擁有一隻屬於自己的數碼獸。

而現在,谷歌的一個 Chimera Painter 畫圖工具,或許可以圓了你童年的夢。

通過Chimera Painter ,你可以在體統提供或者自己上傳的生物輪廓上進行「怪物創作」,點擊「轉換」按鈕後,系統便會生成一個屬於你自己的3D效果的「怪獸」。

強大的「怪獸製造器」背後,還是GAN

谷歌的研究團隊創建了一個數字卡片遊戲原型,這個原型的概念是把生物組合成新的混合體(怪獸),然後這些混合體(怪獸)可以互相「戰鬥」。

在這個遊戲中,玩家可以從真實世界的動物卡片(比如,美西螈或鯨魚)開始,然後將它們組合起來,使它們變得更加「誇張」(可怕的美西螈-鯨魚嵌合體)。

這為演示圖像生成模型提供了一個創造性的環境,因為可能的嵌合體的數量需要一種方法來快速設計大量可以自然結合的藝術元素,同時仍然保留原始生物可識別的視覺特徵。

研究團隊的目標是在用戶輸入的指導下創建高質量的生物卡片圖像,因此在用戶反饋的指導下,嘗試使用生成對抗網絡(GANs)來創建適合幻想卡片遊戲原型的生物圖像。

GAN 將兩個卷積神經網絡組合在一起: 一個生成器網絡用於創建新圖像,另一個判別器網絡用於確定這些圖像是否是來自訓練數據集(在這種情況下,是用戶創建的圖像)的樣本。

研究團隊使用了一種稱為 條件 GAN 的變體,其中生成器接受一個單獨的輸入來指導圖像生成過程。有趣的是,這個方法嚴格偏離了其他GAN的工作,後者通常專注於照片寫實。

為了訓練 GANs,研究團隊創建了一個全彩色圖像數據集,其中包含單種生物的輪廓,這些輪廓改編自3D 生物模型。這種生物的輪廓描述了每種生物的形狀和大小,並提供了一張分割地圖來識別身體的各個部分。

模型的任務是生成多物種嵌合體,基於藝術家提供的輪廓,經過模型訓練,得到表現最好的模型之後被納入到 Chimera Painter。

圖:生成的卡片藝術集成到卡片遊戲,原型顯示基本的生物

通過結構生成生物,語義細節也逼真

使用GAN生成生物的一個問題是,渲染圖像的細微或低對比度部分時,可能會失去空間連貫性,儘管這些對人類具有很高的感知重要性。這樣的例子包括眼睛,手指,甚至在具有相似紋理的重疊身體部位之間進行區分。

GAN 生成的圖像顯示不匹配的身體部位

生成嵌合體需要一個新的非攝影幻想風格的數據集,該數據集必須具有獨特的特徵,例如戲劇性的視角,構圖和照明。現有的插圖存儲庫不適合用作訓練ML模型的數據集,因為它們可能會受到許可限制,樣式衝突或缺少此任務所需的多樣性。

為了解決這個問題,研究團隊開發了一種新的用戶主導的半自動化方法,用於從3D生物模型創建ML訓練數據集,這使得團隊能夠進行大規模工作並根據需要快速迭代。

在此過程中,用戶將創建或獲取一組3D生物模型,每種所需的生物類型(例如鬣狗或獅子)都應建立一個模型。然後,用戶製作了兩組紋理,並使用虛擬引擎將其疊加在3D模型上——一組具有全彩色紋理(左圖),另一組每個身體部位(例如頭,耳朵,脖子, 等),稱為「細分地圖」(右圖)。

然後在訓練中將第二部分身體部位細分提供給模型,以確保GAN了解到各種生物特定於身體部位的結構,形狀,紋理和比例。

實例數據集訓練圖像及其配對分割圖

這些3D生物模型都被放置在一個簡單的3D場景中,同樣使用了虛幻引擎。然後,一組自動化的腳本將採用這個3D場景,並在不同的姿勢、視點和每個3D生物模型的縮放級別之間進行插值,創建全彩色圖像和分割地圖,形成 GAN 的訓練數據集。

使用這種方法,研究團隊為每個3D 生物模型生成了10,000多張圖片 + 分割圖對,與手動生成這些數據相比,用戶們節省了數百萬小時的時間(每張圖片大約20分鐘)。

感知損失+Fine-Tuning,讓怪物更「怪」

GAN 具有許多可以調整的超參數,導致輸出圖像的質量不同。為了更好地了解該模型的哪個版本比其他版本更好,向用戶提供這些模型生成的不同生物類型的樣本,並將其歸納為幾個最佳示例。

該研究團隊收集了有關這些示例中存在的所需特徵的反饋,例如深度感,有關生物紋理的樣式以及面部和眼睛的真實感等。

此信息不僅用於訓練模型的新版本,而且能在模型生成成千上萬的生物圖像之後,從每種生物類別(例如瞪羚,山貓,大猩猩等)中選擇最佳的圖像。

使用條件 GAN 創建生成的嵌合體

研究團隊通過關注感知損失對GAN進行了優化。該損失函數組件(也用於Stadia的Style Transfer ML中)使用從單獨的卷積神經網絡(CNN)提取的特徵來計算兩幅圖像之間的差異,該卷積神經網絡之前已經對ImageNet數據集中的數百萬張照片進行了訓練。

從CNN的不同層提取特徵,並對每個特徵施加權重,這會影響特徵對最終損耗值的貢獻,這些權重對於確定最終生成的圖像的外觀至關重要。

使用不同的感知損失重量生成的恐龍-蝙蝠嵌合體

這是由GAN訓練產生的一些生物,它們具有不同的感知損失權重,展示了模型可以處理的一小部分輸出和姿勢。

使用不同模型生成的生物

谷歌的該團隊希望,這些GAN模型和Chimera Painter演示工具可以激發人們新的藝術創作思路——使用機器學習作為畫筆時,可以創建什麼?

參考連結:

https://ai.googleblog.com/2020/11/using-gans-to-create-fantastical.html

相關焦點

  • 冷知識丨「哥斯拉」為什麼叫「哥斯拉」?
    在《哥斯拉》宇宙中,「ゴジラ」的日文漢字對應為「呉爾羅」,起源於一個有關「大戶島」的妖怪傳說。在1954年初版《哥斯拉》電影中,「ゴジラ」最早現身於人類面前的地點就是「大戶島」。在傳說中,「呉爾羅」通常長眠於海底,並會在睡醒之後將近海生物一食而盡,甚至會襲擊陸地上的人類。
  • 1.9K star量,解救無聊網友,小姐姐的「動畫師」項目可一鍵生成個人...
    Pose Animator 從計算機圖形學中借鑑了「基於骨骼」的動畫思想,並將其應用於矢量字符。在此骨骼動畫裡,通常展現的任務角色由兩部分組成:用於繪製該角色的曲面一組分層且相互連接的「骨頭」,其用途是使得曲面能夠移動,同時也可活躍起來。
  • 美國好萊塢3D電影版「哥斯拉」推出全新中文版預告PV
    動漫   將在2014年5月16日於北美上映的美國好萊塢3D版「哥斯拉」(GODZILLA)公開最新中文版預告PV,繼最初「神龍見首不見尾」的PV
  • 精工GS推出「哥斯拉」限量版機械腕錶!
    雖然Grand Seiko的品牌一直都提倡腕錶典型及優雅的美感,不過身為一個起源於日本的鐘表品牌,它們仍十分喜歡推出向日本流行文化致敬的產品,比如早前曾推出的《機動戰士高達》主題腕錶以及與Nissan聯乘推出的「GT-R」主題腕錶。
  • 東寶特攝博物館系列 「哥斯拉1954 & 哥斯拉2004」開訂
    東寶特攝博物館系列 「哥斯拉1954 & 哥斯拉2004」開訂 動漫 178遊戲網 ▪ 2016-03-04 16:44:45
  • 「EVA」初號機與哥斯拉融合!「G」覺醒形態手辦模型誕生!
    「EVA」初號機與哥斯拉融合!「G」覺醒形態手辦模型誕生! 動漫 178ACG ▪ 2016-07-30 14:00:00 動畫「新世紀福音戰士」的初號機與特設電影
  • 【究極大盤點】劇場版「強者世界」中的怪物
    你知道經典劇場版「強者世界」中一共登場了幾種怪物嗎?
  • 「哥斯拉」新作總導演與導演確定
    「哥斯拉」新作總導演與導演確定 動漫 178動漫頻道 ▪ 2015-04-01 10:18:06
  • 將科幻變成現實,谷歌百度用神經機器翻譯踐行人類的「巴別塔之夢」
    這種方法能提供「字符」-delimited models 的靈活性和「詞」-delimited models 的有效性之間的平衡、能自然地處理罕見詞的翻譯、並能最終提升系統的整體準確度。谷歌的波束搜索技術使用了一個長度規範化過程,並使用了一個覆蓋度懲罰,其可以激勵很可能能覆蓋源句子中所有的詞的輸出句子的生成。
  • X-PLUS 東寶大怪獸系列「哥斯拉(2002)」發光版
    由日本 PLEX 公司製作、X-PLUS 公司發行,以東寶電影旗下怪獸為主題的怪獸軟膠模型『東寶大怪獸』系列日前發表了出自 2002 年電影《哥斯拉x機械哥斯拉》的最新商品「哥斯拉(2002)限定版」預計於 2021 年 05 月發售的消息,此商品僅在 X-PLUS 官方網絡商店少年
  • 庵野秀明執導的「真·哥斯拉」票房突破53億日元 超過福音戰士!
    庵野秀明執導的「真·哥斯拉」票房突破53億日元 超過福音戰士!,從7月29日上映至今,觀影人數超過360萬人,票房已突破53億日元,超過了「福音戰士新劇場版:Q」!
  • 野獸國推出「玩具總動員」銀河配色限定版和豪華版「三眼仔火箭」
    野獸國推出「玩具總動員」銀河配色限定版和豪華版「三眼仔火箭」 每日翻看微博,總是能刷出幾條有關《玩具總動員4》的最新資訊。
  • 你要「老婆」不要?某程式設計師僅用20行代碼,得了個二次元「老婆」
    用 GAN 生成的 2D 二次元「老婆」已經過時了。這一充滿「惡意」的項目引發了讀者的集體不適,大家紛紛請求 up 主「整點兒陽間的東西」(聽說粉絲毫不見漲,這鍋機器之心不背)。Mars 在視頻中提到,因為生成二次元「老婆」這個主題有很多人都做過了,而且效果不錯,所以他就想到一個主題類似但表達方式不同的點子——用 AR 來做。
  • B站UP主製作「老婆一鍵生成器」,網友:為所欲為
    至今油管哥都被那個「禿頭器」的恐懼所支配,不管油管哥有多帥,一鍵過後大家都是張東升!這個充滿「惡意」的項目,也讓網友們感到集體不適。網友們萬人血書,希望UP「整點兒陽間的東西」。不過最近禿頭生成器的作者,又做了我想up主可能是聽到了大家的心聲,所以在網友的建議下,也是up主出於對粉絲的愛護和尊重,up主換了個方向研究起了「一鍵
  • 《哥斯拉》誕生65 周年,東寶推出限定「哥斯拉拉麵」
    日本東寶株式會社製作的怪獸電影系列《哥斯拉》,為日本影史最悠久、全球公認最經典有名的怪獸角色。最初亮相於1954 年,而日本最有名的美食莫過於「拉麵」,今年正巧是《哥斯拉》 誕生65 周年,東寶官方也推出限定「哥斯拉拉麵」。
  • 「哥斯拉」三部曲,超硬核科幻動畫,喜歡看特效的一定不要錯過!
    最近小初喜歡上看日本的硬核科幻動畫,從90年代的「攻殼機動隊」到今年的「副本:義體置換」都比較不錯,今天給大家推薦個好看的「哥斯拉」系列動畫。「哥斯拉」三部曲是在2017年~2018年上映的三部動畫電影,由靜野孔文和瀨下寬之擔任導演,Netflix(俗稱網飛)全球發行,大名鼎鼎的虛淵玄編輯,曾參與過「魔法少女小圓」,「心理測量者」等眾多優秀的作品。按動畫劇情來看,這三部曲的順序是「哥斯拉:怪獸行星」、「哥斯拉:決戰之都」、「哥斯拉:噬星者」。
  • 「九章」問世,超越谷歌「量子霸權」!潘建偉攜90後上Science
    【新智元導讀】實現「量子計算優越性」(即量子霸權),中國科學家取得裡程碑式進展——成功構建了76個光子的量子計算原型機「九章」。根據現有理論,其速度比目前最快的超級計算機快一百萬億倍,比去年穀歌發布的53個超導比特量子計算原型機「懸鈴木」快一百億倍。「量子霸權」再次被實現了嗎?
  • 《怪物獵人 崛起》公開「輕弩」「重弩」實機演示
    近日,CAPCOM公開《怪物獵人:崛起》最新實機演示,本次視頻內容為「輕弩」與「重弩」的武器招式介紹,同時展現了怪物飛雷龍在新作裡面的形象: 「輕弩」在本作的新增招式為「鐵蟲絲滑行」與「扇旋跳躍」。
  • 萬代發布1975年東寶版「哥斯拉」模型
    萬代發布全新「哥斯拉」模型,模型復刻自東寶大怪獸系列1975年版本「機械哥斯拉的逆襲」,採用了哥斯拉大戰泰坦龍的站立場景姿態,模型高約30釐米,採用ABS樹脂與PVC材質打造,背鰭部位裝上2節電池可發光。模型現已經開放預購,將在10月正式發貨。
  • 《怪物獵人 崛起》公開「太刀」「長槍」實機演示
    今天(12月15日),CAPCOM公開了旗下新作《怪物獵人:崛起》的最新宣傳片,本次宣傳片內容為介紹經典武器「太刀」與「長槍」的新增派生招式: 「太刀」在本作中的兩個新派生招式為「飛翔踢」和「水月架勢」,「飛翔踢」的後續動作與「氣刃兜割」相同,不同的是「飛翔踢」為藉助翔蟲起跳,踩在怪物身上進行的跳躍斬擊,目前可確認從「氣刃居合拔刀斬」後派生;「水月架勢」比較好理解