厲害了!谷歌AI一鍵生成定製版3D遊戲神獸,可在線體驗!

2021-01-16 雷鋒網

會畫畫的AI有多可怕?

你是否想像過把螞蟻和豬、螃蟹和鯨魚,或者100種生物的任意兩個組合起來會是什麼神奇的亞子?

現在,AI可以把這些天馬行空的想像全部變成現實!

而只需要我們點點滑鼠隨便塗個鴉,像這樣:

犀牛的犄角,老鷹的翅膀,恐龍的尾巴,組合起來就可以變成這樣:

妥妥地一幅專業創意作品,對繪畫小白簡直不要太友好。

更重要的是,它或許還能激發你的創意靈感,而這也是Google研究團隊推出這款工具的目的之一。

這款AI繪畫神器名為Chimera Painter,它是一個Web工具,其功能是基於動物簡圖生成高度逼真的「小怪獸」。

完成塗鴉後,只要點擊「轉換」按鈕,它就會自動生成3D效果的「怪獸」。

有意思的是,Googel研究團隊還把Chimera Painter創作的怪獸形象用來搭建了一個數字紙牌遊戲。

圖中每張紙牌的攻擊值由上面的怪獸決定,這些怪獸的技能由他們所組合的兩種物種決定。

據了解,這款AI工具的研發靈感就來自我們平時在遊戲中看到的「怪獸」。Googel研究人員認為,這些怪獸的創作往往需要遊戲美術師有高度的藝術創造力和技術知識,而AI可以充當畫筆,幫助他們節省藝術創作的時間,比如一鍵完成3D渲染,甚至還可以增強他們的創造力。

假如遊戲中有100種動物,每種動物都可以相互融合,那麼它會給任何藝術家帶來很大的工作量,但這對於機器學習來說,是很輕鬆的事。

那麼,它是如何做到的呢?

基於GAN的生成模型

Chimera Painter,是一種機器學習(ML)模型。為了可以生成高質量且任意組合的怪獸形象,研究團隊向模型提供數千張生物圖像,並標記了如爪,腿,腿,眼睛等特殊部位,以供模型進行訓練。

該模型的訓練過程利用的仍然是生成式對抗網絡(GAN),GAN我們已經非常熟悉,它可以基於兩個卷積神經網絡:生成器和判別器生成高清且逼真的新圖像。其工作原理是,生成器用來創建新圖像,鑑別器用來確定這些圖像是否來自訓練數據集。

不過,在這裡研究人員提出了一種被稱為條件GAN的變體,其中生成器採用單獨的輸入來指導圖像生成過程。有趣的是,這種方法與其他GAN的工作完全不同,因為後者通常側重於照片真實性,而該工具的目的是融合不同的物種生成一種嵌合體。

為了訓練 GAN,研究團隊創建了一個全彩色圖像數據集,其中包含單種生物的輪廓,這些輪廓改編自3D 生物模型。這種生物的輪廓描述了每種生物的形狀和大小,並提供了一張分割地圖來識別身體的各個部分。

訓練後的模型,可以基於藝術家提供的輪廓,生成表現最好的多物種嵌合體並嵌入到 Chimera Painter中。

創建有結構的生物數據集

使用GAN生成新物種時會遇到一個問題,即在繪製圖像細節或低對比度部分時,可能會失去空間的連貫性,包括眼睛、手指,甚至是具有相似紋理的重疊身體部位之間的區分。

因此,它對訓練數據集提出了一定的要求。現有的插圖庫不適合用作訓練ML模型的數據集,原因是它們可能具有衝突樣式,或者缺少多樣性。生成嵌合體的數據集需要具備獨特性,如戲劇性的視角、構圖和燈光等。

為了解決這個問題,研究人員開發了一種用戶主導的半自動方法,即從3D生物模型中創建ML訓練數據集。在這個過程中,用戶們將創建並獲得一組3D生物模型。

具體來說,他們將用虛幻引擎製作兩組紋理,併疊加在3D模型上——一組具有全彩色紋理(左圖),另一組顯示身體每個部位(如頭,耳朵,脖子等),稱為分割圖(右圖)。

其中,圖二身體細分部分會提交給模型進行訓練,以確保GAN了解各種生物身體部位的特定結構、形狀、紋理和比例。

三維生物模型都被放置在一個3D場景中,並同樣使用虛幻引擎。一組自動化腳本將採用這個3D場景,並在不同的姿勢、視點和每個3D生物模型的縮放級別之間進行插值,創建全彩色圖像和分割地圖,形成 GAN的訓練數據集。

使用這種方法,研究人員為每個3D生物模型生成10000多個圖像+分割圖對,與手動創建這些數據相比,用戶每張圖像可以節省大約20分鐘。

生成高保真度圖像

GAN的超參數大小會影響模型輸出圖像的質量。為了驗證該模型哪個版本的性能最佳,研究團隊收集並分析了模型生成不同生物類型的樣本,並從中提取了一些顯著特徵,如深度感,有關生物紋理的樣式,以及面部、眼睛的真實感等。

這些信息不僅將用於訓練模型的新版本,而且能在模型生成成千上萬的生物圖像之後,從每種生物類別(例如瞪羚,山貓,大猩猩等)中選擇最佳的圖像。

具體來說,研究團隊通過感知損失( Perceptual Loss)對GAN進行了優化。該損失函數組件使用從單獨的卷積神經網絡(CNN)提取的特徵來計算兩幅圖像之間的差異,該卷積神經網絡之前已經對ImageNet數據集中的數百萬張照片進行了訓練。

從CNN的不同層提取特徵,並對每個特徵施加權重,這會影響特徵對最終損耗值的貢獻,這些權重對於確定最終生成的圖像的外觀至關重要。

下面是來自不同感知損失權重訓練GANs的結果。

圖片中的顏色變化主要是數據集導致的,其原因是數據集中的一個生物往往包含多種紋理(比如蝙蝠的紅色版和灰色版),不過,忽略顏色變化,許多差異也直接與感知損失值的變化有關。

研究人員發現,特定值會產生更清晰的面部特徵,使生成的生物更具真實感。

下面是一些由GAN生成的生物,它們使用了不同的感知損失權重進行訓練,展示了模型可以處理一小部分輸出和姿勢。

在線體驗

總之,對於藝術創作者或者繪畫愛好者來說,Chimera Painter只需調整生物的局部形狀、類型或者位置,就可輕鬆創建大量圖像,而不是從頭繪製幾十種類似的生物。同時,該模型還允許使用外部程序(如Photoshop)創建的生物輪廓。

谷歌團隊在博客中表示,希望這些GAN模型和Chimera Painter演示工具可以激發人們新的藝術創作思路。

那麼,使用機器學習作為畫筆時,你想創建什麼呢?(點擊連結即可體驗~)

https://storage.googleapis.com/chimera-painter/index.html

引用連結:

https://techcrunch.com/2020/11/17/google-has-created-an-ai-powered-nightmare-creature-generator/

https://ai.googleblog.com/2020/11/using-gans-to-create-fantastical.html

雷鋒網雷鋒網雷鋒網

相關焦點

  • 新型AI平臺一鍵點擊可生成多國語言配音
    打開APP 新型AI平臺一鍵點擊可生成多國語言配音 站長之家 發表於 2020-12-18 11:01:17 人工智慧技術越來越強大,不僅被應用於寫作、畫畫甚至是創作音樂場景中,現在有要來搶「配音」演員的飯碗,一鍵點擊就能生成多國語言配音。
  • 谷歌 AI 開源 Deepfake 檢測數據集,3000+ 真人...
    type=preview&sign=g3d2q7B6dqqAdnGqs6V5YoCdn5aEh33agquWoQ)該數據集一共包含了來自 28 個不同場景下,由真人演員現場拍攝的 3000 多段視頻。谷歌希望能夠通過這些視頻數據,更好的維護整個社會的網絡安全環境,並使得開發者能夠利用這些數據,開發新的 Deepfake 檢測工具,更高效地識別 Deepfake 假視頻。
  • 谷歌發布地圖「時光機」:100年前,你家街道長啥樣?
    這樣一臺「時光機器」的引擎,是谷歌推出的基於瀏覽器的工具集rǝ(音return),主要由3部分組成:一個眾包平臺。用戶可以上傳城市歷史地圖,將其與現實世界的坐標進行匹配,完成地理修正,並將其矢量化。一個時空地圖伺服器。能顯示城市地圖是如何隨時間變化的。一個3D體驗平臺。
  • 谷歌發布地圖「時光機」:100年前,你家街道長啥樣?
    這樣一臺「時光機器」的引擎,是谷歌推出的基於瀏覽器的工具集rǝ(音return),主要由3部分組成:一個眾包平臺。用戶可以上傳城市歷史地圖,將其與現實世界的坐標進行匹配,完成地理修正,並將其矢量化。 一個時空地圖伺服器。能顯示城市地圖是如何隨時間變化的。 一個3D體驗平臺。運行在rǝ地圖伺服器之上,利用深度學習,根據有限的歷史圖片和地圖數據重建3D建築,創造3D體驗。
  • 阿里巴巴達摩院黑科技再次亮相雲棲大會--【足幫幫】3D腳型掃描儀
    其設備自動生成腳型3d模型,支持3d列印與鞋墊定製,以3d腳模型為核心,整合3d鞋楦列印技術,支持大規模數據採集以及客戶腳型資料庫建立。  測量設備端3秒完成三維模型重建,7秒輸出35項測量和足部健康評估腳型報告,精準測量行業領先,多端信息聯動,品牌專屬視覺風格流程簡單,學習成本低,沉浸式用戶體驗用戶手機端掃碼獲取專業腳型報告,健康足部評估與運動建議,串聯智能選款,腳型專屬推薦,線上款式個性定製,一鍵下單試穿,
  • 一鍵「脫衣」AI軟體再現!68萬女生成受害者
    如今社交平臺的發達讓很多漂亮的小姐姐們很喜歡在網絡上曬出自己妹妹的照片或者短視頻,但殊不知這世界上已經有一些邪惡的人利用邪惡的軟體正在用這些漂亮MM的照片或者視頻做著一些邪惡的事情——一鍵生成「果照」!
  • 騰訊START雲遊戲TV版上線!遊戲體驗首選北通電視雲遊戲手柄!
    是一款大福降低遊戲入門門檻,提升雲遊戲體驗的專用手柄外設。深度定製一鍵呼出START平臺深度定製可一鍵呼出START平臺,拿起手柄立刻開玩。高精度的搖杆與手感舒適的動作按鍵可滿足電視雲遊戲的休閒、競速、角色扮演、動作、親子類等遊戲的操作需求。同時基於標準安卓手柄協議優化的北通手柄,可用於安卓智能電視、機頂盒、投影儀等,支持各家遊戲平臺。
  • 移動端實時3D目標檢測,谷歌開源出品,安卓下載就能用
    今日,谷歌宣布推出 MediaPipe Objectron,這是一種適用於日常物體的移動端實時 3D 目標檢測 pipeline,它能夠檢測 2D 圖像中的目標,並通過新創建 3D 數據集上訓練的機器學習模型來估計這些目標的姿態和大小。
  • 這個AI可一鍵實現多國語言本地化配音
    這個AI可一鍵實現多國語言本地化配音 站長之家(ChinaZ.com)12月17日 消息:人工智慧技術越來越強大,不僅被應用於寫作、畫畫甚至是創作音樂場景中,現在有要來搶「配音」演員的飯碗,一鍵點擊就能生成多國語言配音。
  • 擁有三星Galaxy S20+5G BTS定製版,是一種什麼樣的體驗?
    因此,三星Galaxy S20+ 5G BTS定製版在系統中預裝了明星社區軟體Weverse,這樣一來就全國各地的粉絲在使用愛豆定製手機時,也能快速獲取自己愛豆的資訊,遠程為自己的愛豆打Call。不僅如此,三星Galaxy S20+ 5G BTS定製版也內置了BTS主題,將自己對愛豆的熱愛更深層次的融入生活。
  • 創建三維頭像只需一張自拍,AI 技術即將開啟 3D 社交時代?
    加州初創公司推出智能 3D 模型軟體 Loom.ai ,利用機器學習和計算機視覺技術,根據用戶 2D 平面照片,生成 3D 頭像。該公司表示,該技術能做到:口說無憑,我們來看看實際效果。開發者上傳了一幫名人的照片,給 Loom.ai 站臺。結果成了這個樣子:
  • 谷歌發明的由2D圖像生成3D圖像技術解析
    打開APP 谷歌發明的由2D圖像生成3D圖像技術解析 嘉德IPR 發表於 2020-12-24 12:55:23 谷歌發明的由2D圖像生成3D圖像的技術,利用3D估計神經網絡圖像信息的補全以及預測,融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術對於三維建模以及工業應用都具有極大的指導意義。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    >>查看詳情ai.baidu.com/tech/face/darkcircles 人臉 3D 虛擬形象生成能力開放邀測根據用戶上傳的自拍圖,生成臉型、五官分布相似的人臉模型基底飛槳企業版-零門檻 AI 開發平臺 EasyDL EasyDL 經典版4項能力上新及優化1. 物體檢測、圖像分割數據標註支持全屏,提供更佳的標註體驗。2.
  • 安卓11正式版更新了什麼 Android11更新內容匯總
    安卓11正式版更新了什麼 Android11更新內容匯總 在9月9日凌晨,谷歌推送了安卓11的正式版本,Pixel
  • Android智能機已可普遍體驗谷歌Stadia遊戲串流服務
    谷歌已經啟用了針對部分 Android 設備的 Stadia 遊戲串流服務支持,由於當前仍在開發完善階段,因此不要指望每款設備都可以收穫完美的體驗。 通過在測試階段收集到的反饋,谷歌將陸續帶來新功能和相關 bug 修復。
  • 三翼鳥廚房迎「神獸」打卡團:4歲男童學做月餅
    9月26日上午10:00,海爾食聯網「神獸寶焙」在青島海爾智家食聯網001號店開課。繼上線三翼鳥廚房後,001號店首次迎來了「神獸」打卡團。  現場,9組親子家庭不僅參觀了三翼鳥廚房,還進行了一場智慧烘焙之旅。在專業烘焙師的指導下,小神獸們親自動手製作了中秋月餅。在烘焙過程中,三翼鳥廚房一鍵烘焙、智慧烹飪等操作則讓現場家長心動不已。
  • 這個AI能幫女朋友自拍:照片生成3D視頻
    只要幾張照片,它能從中生成各種角度的自拍。 然後,你可以在AI生成的視頻裡,找到一個自認為最美的角度,分享到朋友圈。這個AI就是華盛頓大學和谷歌聯合開發的nerfies。這種方法不需要太複雜的設備,只要智慧型手機的攝像頭和CPU就能完成運算和渲染。這可比iPhone 12 Pro用內置雷射雷達來生成3D圖像的成本低多了。
  • 3d建模軟體手機版有哪些?這3款好用的手機3d建模軟體你一定要有
    3d建模軟體手機版有哪些?對於一些三維設計師來說,能夠在手機上隨時隨地進行三維建模是一件很方便的事。本期,模型云為您整理了這3款好用的手機3d建模軟體介紹,快來和我們一起看看吧!3款好用的手機3d建模軟體3d建模軟體手機版一:MeshMixerMeshMixer是一款操作簡單的手機3d建模工具,其主要功能包括3D列印改進、製造切片工具、拖放及把原本組合在一起的多個不同的幾何體分成單獨的對象等,且支持PLY二進位格式、3Dconnexion空間滑鼠。
  • 喜馬拉雅定製版下載_喜馬拉雅定製版官網下載_18183軟體下載
    喜馬拉雅定製版擁有中國最大的聲音庫,包括有聲小說、相聲、評書、新聞、音樂、英語、兒歌、兒童故事等等,功能非常多,非常全面,同時還有海量優質聲音為你誦讀,讓你不僅聽得方便,更聽得快樂,聽書、聽課、聽段子,4.5億用戶的選擇!
  • 《3D定製女僕2》VR版評測:更加老司機的互動體驗
    但是目前真正像樣的成人影片可以說幾乎沒有,但是在遊戲界,Kiss社出品的《3D定製女僕2(Custom Maid 3D 2)》來拯救大家寂寞的內心了!半路殺入的VR成人遊戲  《3D定製女僕2》並非一款原生VR遊戲,也就是說它並非針對VR進行設計開發,而是在之後通過補丁來加上對VR頭顯的支持,讓你可以從不同的視角來進行體驗。VR補丁適配Oculus Rift以及HTC Vive兩大設備。