使用GAN繪製像素畫,用機器學習的方式協助繪畫者更快地完成作品

2020-12-23 deephub

Sprite生產的幾個階段。 即草圖,線條圖,底紋,區域上色和索引。

上面的圖片來自Trajes Fatais:Feats of Fate遊戲,我作為首席開發者從事該遊戲的製作。 長話短說,每個精靈要繪製大約一小時,每個角色平均要繪製五百個精靈。 在「遊戲的機器學習輔助資料生成:像素繪畫Sprite表格研究」中,我們探索了Pix2Pix架構來自動生產Sprite的流程,將每個Sprite花費的平均時間減少了15分鐘(25%)。 這是我們首次發表的有關精靈生成的工作,我們希望在將來進一步改進它。

該論文獲得了2019年巴西遊戲與數字娛樂研討會(SBGames 2019)的最佳論文獎。

像素繪畫是視頻遊戲中最受歡迎的美學之一。 它致力於重現任天堂和Arcade舊遊戲的外觀。 在90年代,像素繪畫是大多數遊戲機的唯一選擇。 屏幕解析度有限,並且大多數設備無法實時執行高級技術。 如今,像素繪畫已成為一種選擇-一種昂貴的選擇。

為了實現街機遊戲的外觀和感覺,繪畫者必須受顏色數量限制。 最初的Game Boy只有四種綠色。 它的繼任者Game Boy Color可同時顯示多達56種不同的顏色。 後來的設備稱為16位生成器,每個像素點最多允許256種顏色,這是美學上的重大突破。 在我們的遊戲中,我們限制為每個角色256個顏色。

每個像素點都有自己的256種顏色

通常,像素點是「索引精靈」與「調色板」的混合體。 繪畫時,繪畫者使用與調色板的256種顏色之一相關的「索引」對每個像素進行著色。 在遊戲中,每個索引精靈都用其關聯的顏色替換,從而構成最終圖像。 此過程使設計人員可以為每個角色創建不同的「皮膚」,從而允許用戶自定義其體驗並為角色創建「邪惡」版本。 下圖描繪了索引精靈,調色板和渲染的混合。

索引精靈,調色板和渲染

將繪畫者的顏色選擇限制為256種是不科學的。 這使得選擇陰影很難。 為了簡化此任務,在語義上對工作進行了劃分。 在我們的通道中,生成了兩個中間的精靈:「陰影」精靈和「區域」精靈。 前者最多使用6個選擇來表示「燈光」,而後者最多使用42個選擇來表示精靈的「區域」,例如手臂,頭髮,腿等。將兩個精靈像素相乘 -之後我們獲得了索引精靈,它最多可以支持252種顏色(6 * 42)。 下圖顯示了陰影,區域和索引精靈的示例。 此過程將256色問題轉換為兩個簡單的子問題,每個子問題分別具有6和42色。

從左到右,陰影,區域和索引精靈。

最終,每個角色都是由一個人設計的,他這將為其所有動畫進行繪製。 它們以「草圖」子圖形顯示,後來又被精煉為「藝術線條」子圖形。 前者用於在遊戲中快速製作新動畫的原型,後者用於與其他繪畫者交流最終精靈的外觀。 這樣,設計人員可以在幾天內概念化整個角色,並將其餘工作外包給繪圖團隊。 以下是草圖和藝術線條精靈的示例:

草圖和藝術線條

設計師將所有動畫放在一起,通過繪製每個動畫的草圖,然後製作各自的藝術線條來創建角色。 這些線型精靈將按順序傳遞給繪圖團隊,後者將繪製它們的著色和區域。 最後,使用腳本將兩者結合起來以生成可用於遊戲的索引精靈。

總共大約需要一個小時。 草圖,線條圖和區域精靈的製作平均需要10分鐘,而陰影則需要花費其餘時間才能完成。 跟蹤每個圖紙花費的確切時間幾乎是不可能的。 為了計算它們,我們檢查了生產日誌,採訪了團隊,並以可控的方式測量了12個精靈的繪製步驟。

假設使用機器學習模型可以生成陰影和彩色圖片,那麼生成的精靈必須足夠好,以至於人類繪畫者可以用比從頭開始繪製更少的時間來完善它。

生成對抗網絡入門

在這項工作中,我們解決了兩個圖像映射問題:線條到陰影和線條到區域。 形式上,我們必須創建一個生成器G(x),該生成器從線條藝術中接收輸入,並在陰影/區域中生成輸出。 此問題也稱為圖像翻譯。

為了保證G(x)是有用的映射,我們將創建一個鑑別器D(x,y),該鑑別器查看x和y並說明y是否是一個優質子畫面。 換句話說,G是我們的「虛擬藝術家」,D是我們的「虛擬鑑賞家」。 如果我們能讓G使D開心,那麼我們就有一個有用的映射。

更詳細地說,考慮一下我們有幾個線條藝術精靈(x)以及已經繪製的人類繪畫者的陰影和區域精靈(y)。 我們知道這些通過了質量控制,因此D(x,y)將很高興。 現在我們的任務是訓練G給定x產生(對實y的模仿)。 如果複製良好,D將批准; 否則,它將予以譴責。 最後,我們會修正D的對與錯,並要求D提供有建設性的反饋。

我剛剛描述的過程稱為對抗訓練。 從某種意義上說,兩種模式「競爭」,一種正在試圖擊敗另一種。 在我們的案例中,G試圖擊敗D使其認為是y,而D則拼命試圖說出什麼是真實的,什麼是假的。 隨著時間的流逝,G將成為成功的藝術家,而D可能會被解僱。

通過使用神經網絡實現G和D,我們得到了所謂的生成對抗網絡。 將標題分解為「條件」是因為G接受x而不是隨機噪聲作為輸入,「對抗」是因為它訓練對手成為輸入器,而「網絡」則是(神奇!)神經網絡 。

從算法上來說,對於每個線條藝術x和陰影/區域精靈y:

使用G從x生成使用D評估是否看起來逼真使用y和D的反饋來訓練G訓練D認識到是假的而y是真的。多次對整個數據集重複執行此過程,最終將融合為一個G網絡(創建逼真的繪畫)和一個D網絡(無法分辨出圖像是真實的或偽造的)。

Pix2Pix架構

Pix2Pix體系結構為基於U-Net生成器和基於補丁(Patch)的鑑別器。 下圖顯示了組合的體系結構。 鑑別器經過訓練,可將每個32x32圖片分類為真實或偽造,並經過交叉熵損失訓練。 反過來,訓練生成器以使y和之間的L1損失最小,並使鑑別器損失最大。

高級Pix2Pix架構。

U-Net模型是基於編碼器-解碼器思想的全卷積神經網絡。 對於每個編碼器層,將跳過全連接添加到解碼器層。 這允許網絡利用來自編碼層的「原始」信息和通過解碼器層的「已處理」信息。 這裡給出了該體系結構及其相應出版物的全面概述。

鑑別器是一個截斷的網絡,輸出對多個補丁圖像的判斷,而不是對整個圖像的判斷。 因此,鑑別器向生成器提供詳細的反饋,指出哪些區域看起來是真實的,哪些區域看起來是偽造的。 可以在此處找到該體系結構內部細節的完整概述。

與原始網絡相比,我們進行了以下更改:

我們使用了Y型網絡。 一個編碼器,兩個解碼器和兩個鑑別器。 這樣一來,即可解決陰影和區域問題。使用分叉架構,每個分支都有兩個損失。 同樣,我們使用L2範數代替L1範數,因為它顯示出更好的結果。原始論文使用LeakyReLU單位。 我們使用了ELU單位。在編碼器中,我們對每次下採樣使用了兩次卷積運算,而不是一次卷積。數據集

在Trajes Fatais遊戲中,我們選擇了Sarah和Lucy角色作為數據集,以評估Pix2Pix體系結構。 莎拉(Sarah)角色只有87個完成的精靈,還有207個需要繪製。 它也是一個中等複雜的圖片,具有多個平滑複雜的區域。 另一方面,露西(Lucy)角色已完成,因此它具有530個完全繪製的精靈,並且非常容易繪製,具有大部分平滑的特徵。

從某種意義上說,露西是我們的上限。 它具有我們希望得到的所有數據,並且很容易繪製。 如果該算法無法處理露西,那麼其他任何數據都可能會失敗。 相比之下,莎拉是我們常見的情況:一個中等複雜的人物,只有幾十個精靈可以訓練。 如果算法對莎拉有用,那麼它可能對我們有價值。

結果

可以看出,該算法對於陰影問題和區域精靈的問題具有很好的結果。 因為顏色變化了,並且精靈周圍有一些噪聲。 對於著色精靈,只檢測到了較小的問題,例如第二行中的肩膀和腿部。

在第二批中,可以找到更多問題。 在生成的陰影列中,可以在陰影區域看到許多偽圖像,例如在女孩(第一個行),鴨嘴獸的背部(第2行)和鴨嘴獸的喙(第3行)上。 對於彩色畫面,會存在大量噪聲,使這些子畫面無法使用,因為人類很難去除噪聲。

第三批的作品來自207個精靈,僅提供藝術線條。 因此,這些需要主觀分析來評價效果。 這些行分別由類似於訓練中使用的子圖形,以前不曾看到的精靈的子圖形和其他精靈的子圖形組成。

儘管第一行最有用,但是第二和第三行上的彩色圖像會迅速惡化。 著色精靈的質量基本保持一致。 但是,著色精靈的第三列不一致。 第二行中的正面小精靈的臉應更亮,並且右下角的小精靈的亮度不連續。

現在,我們可以確定的假設著色精靈可以使用,但是區域精靈卻不能使用,因為它們噪聲太大並且存在色移問題。 讓我們將注意力轉移到露西。

露西精靈的數據多了五倍,與莎拉相比改善更加明顯。 陰影精靈幾乎完美,陰影區域的毛髮很小,頭髮的差異可忍受。 但是,區域精靈仍然遠非最佳。 色移問題和噪點仍然存在。 這表明增加數據集大小並不能使這些問題得到明顯改善。

第二批包含我們手動選擇的精靈,因為它們與大多數其他精靈有很大的不同。 儘管如此,陰影精靈仍然與人類繪製的精靈幾乎相同。 彩色圖像的質量也並沒有像莎拉一樣嚴重下降。 但是,它仍然遠遠達不到理想的結果。

考慮到這些結果,可以說增加數據集的大小可以顯著改善陰影,但不能改善區域。 由於露西是我們的最佳情況,因此可以假設我們需要另一個問題表述/體系結構來解決區域精靈問題。

為了更客觀地量化所生成內容的質量,我們計算了兩個數據集的MSE,MAE和SSIM分數。

從表中可以看出,在所有這三個指標上,陰影精靈的均值(μ)和方差(σ)比彩色圖像更好。 同樣,75%的四分位數與最大可見值之間的差異很大,這表明分布偏斜。

此外,露西(Lucy)的結果始終好於莎拉(Sarah)的結果,其方差低得多,而且歪斜度也大大降低。

SSIM評分的範圍從0(完全不相似)到1(完全相同),並衡量兩個圖像的感知相似度。 雖然MSE和MAE純粹是數學概念,但SSIM分數與人類感知更加相關。 在表中,陰影精靈的得分接近1,表明它們與平均觀察者幾乎相同,而彩色圖像則並非如此。

作為第三次也是最後一次評估,我們要求設計團隊對207個為莎拉生成的精靈進行評論。 他們的反饋意見大多是積極的,稱讚了著色精靈的質量並丟棄了彩色精靈。 總之,他們發表了四點評論:

幾乎一半的著色精靈有用,可以在20到30分鐘內完善。 彩色精靈不可用。該算法在單個動畫中效果不穩定,這可能會使子畫面失效。某些姿勢下即使是著色精靈也會產生可怕的結果。將色彩數量固定為使用6和42種顏色時,會引入一些不必要的噪音。下圖說明了觀點2、3和4。

八幀動畫中的身體明亮度不一致

使用與訓練中使用的姿勢相差太大的姿勢會產生較差的結果。

在量化為6和42種顏色數量時,會引入一些噪音。 在輪廓中可以很容易看到。

結論

在這項工作中,我們評估了使用現代生成模型來解決像素藝術生成問題的效果。 即,我們採用了改進的Pix2Pix架構,取得了一定程度的效果。 更詳細地講,著色精靈被藝術團隊認為是有用的,而彩色小精靈則被認為是無用的。

對於著色精靈,團隊提出平均需要20到30分鐘來完善每一個精靈,比從頭開始繪製一個要少10到30分鐘。 保守的估計是,每個有用的精靈都會節省10分鐘的勞動時間,這意味著生產力提高了約15%。

儘管具有更多的顏色,但對於設計團隊而言,區域精靈所花費的時間並不多於著色精靈。 正如首席美術師所解釋的那樣,動畫中的區域更容易預測,並且可以輕鬆地從一個精靈複製到另一個精靈。 因此,不生成它們不是大問題。

從技術角度來看,這項工作證明了當前模型可以有效地用作創造性任務的助手。 其他動漫領域也發現了類似的結論,動漫領域主要是由平坦而豐富的顏色組成,並且比像素藝術具有更少的限制。 此外,Pix2Pix模型適用於現實世界的圖片,也適用於像素藝術和動漫數據,這證明了其普適性。

未來的工作

我們當前的系統基於Pix2Pix模型,基於像素。 但是,我們的問題可以根據圖像分割名詞來表述為按像素分類。 這樣的思路可能會大大改善我們的結果。

有時,簡化問題可能使其更易於處理。 區域精靈共有42種顏色,但每個精靈僅出現大約十二種顏色,並且這些顏色佔據所有精靈中很大一部分。 將問題縮小為更具選擇性的陰影可能會減輕生成器的工作壓力。

Pix2Pix創始於2017年。自那時以來,GAN取得了一些進步,包括更好的損失函數,注意力機制和改進的方法。 使用更先進的技術可能會大大改善結果。

U-Net和Pix2Pix的參考資料

O. Ronneberger, P. Fischer, and T. Brox, 「U-net: Convolutional networks for biomedical image segmentation」 2016

P. Isola, J.-Y. Zhu, T. Zhou, and A. A. Efros, 「Image-to-image translation with conditional adversarial networks」 2017

作者:Ygor Rebouas Serpa

deephub翻譯組:孟翔傑

相關焦點

  • 像素畫新手教程:怎樣開始畫像素畫?
    導出Web或遊戲時,可以使用Control+Alt+Shif+S或文件>導出。Aseprite 在導出窗口中有非常好用的Resize功能。它只能按100%的成倍數字縮放你的作品。如果將作品重新縮放107%,它會破壞像素,將會一團糟;如果你縮放200%,每個像素現在將是2像素寬和高,看起來會很漂亮。
  • 像素畫數字填色
    像素畫數字填色 學習辦公 大小: 27.99M
  • 0基礎的繪畫小白,也能用牙籤畫出漂亮的作品, 裝飾效果一流
    對於很多人來說,繪畫並不是一件輕鬆容易的事,尤其是讓初學者也能快速學會繪畫方式少之又少,大多數都需要長年累月的練習,從線條開始畫起,然後再畫各種各樣的幾何體石膏,正常情況也需要3,5個月才能學會如何去畫一幅畫。 當然,這個時候只是學會了如何畫畫,離創作作品還有一段距離。
  • PS教程:畫者福音,簡單幾步繪製彩鉛畫
    素材1顏色減淡2.執行濾鏡-其他-最小值,數值在一個像素左右即可數值在一個像素左右即可3.Ctrl+T調整好大小和位置4.將混合模式改為正片疊底,並添加一個圖層蒙版,前景色設置為黑色,使用畫筆工具>,將畫筆硬度調為0%5.將素材1周邊生硬的地方進行擦除隱藏即可6.彩鉛畫完成
  • derekyu像素畫教程:小尺寸像素畫角色&像素畫格式和分享
    derekyu像素畫教程:小尺寸像素畫角色&像素畫格式和分享上一篇教程,我們畫了一個96x96像素的大獸人,在這種尺寸下,感覺很像傳統繪畫
  • 怎麼畫好古風衣服?古風繪畫必知的服飾繪製技巧
    怎麼畫好古風衣服?古風繪畫必知的服飾繪製技巧!怎樣才能畫好衣服?畫好衣服有哪些技巧?想必這些問題都是繪畫初學者們比較傷腦筋的問題,今天微課菌就在網絡上收集整理了關於衣服怎麼畫?教程非常簡單,趕緊來看看吧!
  • 畫風不同怎麼選擇合適的繪畫軟體?
    一些小小建議,還請各位小主笑納~ 秋秋群~:8978//4800//11、畫厚塗,選擇PSPS工具擅長厚塗以及圖像處理,表現厚重真實的質感和光影,或者搭配強大的筆刷拓展模仿紙上或布面質感的繪畫,曲線工具調整畫面也十分的好用吶,即使是以其他繪畫軟體作為主力工具,PS也需要作為成稿最後調整的輔助工具,是一款值得入手安排的好軟體
  • 小學生素質教育第11課:擁有並且使用一本素描本學習一個月的時間
    今天我們學習第四主題「創造創意」「讓想像插上翅膀」中的內容:擁有並且使用一本素描本學習一個月的時間。那麼接下來問大家一個問題:人類最早出現的是「畫」還是「字」? 學生回答:答案不一。老師:據考古者證實是畫。我國最早出現的漢字是甲骨文。但是目前已在寧夏中衛大麥地發現的大量獨立巖畫群中,發現了比甲骨文還要早幾千年的我國最古老的圖畫文字。
  • 我怎樣在繪畫中使用油畫刀?
    油畫刀是畫油畫的常用工具,我不僅用於調色,在繪畫中也會使用,一般使用在風景畫、寫生作品的創作中,在戶外寫生時,為了在有限時間內快速完成作品,經常使用厚塗法,把顏料迅速塗抹在畫布上,線條硬朗、概括性強,形成的厚重的顏料肌理,使畫面整體產生出粗曠、生動的效果,而且在繪畫過程中,畫家比用畫筆繪畫時更有創作激情
  • 動漫角色如何畫Q版的繪畫技巧
    動漫角色如何畫Q版的繪畫技巧 ,怎樣才能繪畫萌系人物?Q版人物應該怎麼畫?學習繪畫難嗎?怎樣才能學好繪畫?,元素的排列方式應使原始字符的圖像不會移位。在兩件衣服的情況下,輪廓通常以柔和的曲線繪製,但是在三件衣服的情況下,畫圖區域變寬,因此最好添加一些皺紋。這是帕爾米第三人生的完成!5.其他要點,最後,我將解釋繪製變形的要點。首先,我曾經在粗糙的階段用線條畫衣服的圖案,但是當我複製它時,我只用顏色表示它,而沒有畫線圖。這將減少線條畫並使它看起來更漂亮。
  • ...畫如其人,書畫家的個人性情對自己的繪畫作品有著潛移默化的影響
    畫如其人,這句話其實在我看來說的是非常到位的,因為不同的人畫出的相同的題材作品都是千差萬別的,這不僅僅是因為畫家所擅長的繪畫種類不同,而且跟畫家的性情有著分不開的關係,有的畫家較為細膩,他筆下的繪畫作品也會隨之變得細膩工整,有的人是較為豪放,所以他筆下的繪畫作品就給人以樸實敦厚的繪畫之風,總之不同的人畫出相同的題材作品呈現是不同的
  • 一鍵生成人臉像素圖,還能上傳到動森!這個項目很好玩
    此外,她還做了另一個有趣的項目 PixelMe,可以將輸入圖像一鍵轉換成像素畫。還在用 PS 把圖像轉換成像素畫嗎?日本獨立開發者 Sato neet 自學人工智慧技術,開發出網站 PixelMe,可以將人像照片一鍵轉換成像素畫,生成的圖像還可以導入到最近大熱的遊戲《動物森友會》。
  • 如何繪製毛髮?怎麼學習PS?
    毛髮是我們在繪畫和貼圖繪製的過程中常見,但同時也是我們經常畫卻又畫不好的物體,那麼我們該如何繪製毛髮呢?花個半小時好好學一下吧!毛 發 繪 制 步 驟大概畫出顏色和毛髮的走向,邊緣普遍下垂,中部向上立起的較少,邊緣把大輪廓畫出來(當然,這裡也可以通過線稿來完成第一步)。
  • 電焊界的繪畫天才:用電焊畫出一條巨龍,繪畫技巧勝過很多專家
    這一位農村電焊工就把這二個不相干的工種結合到了一起,下面我們一起來欣賞一下他的電焊畫作品吧。作品非常漂亮,尤其是經過他的打磨之後是一件不錯的藝術作品,其實這一位大叔不僅僅是焊了一條巨龍,平時他也喜歡焊一些其他的人物造像,非常有意思。電焊界的繪畫天才:用電焊畫出一條巨龍,繪畫技巧勝過很多專家!
  • 動漫繪畫教程:如何畫出好看的頭髮?
    動漫繪畫教程:如何畫出好看的頭髮?各種女性髮型繪製教程大全, 動漫中的女生總會有五花八門的髮型,其中有些髮型只是為了人物設定時的效果,在現實中根本無法實現,而有些髮型就很適合在現實中重現。因此,今天輕微課繪畫網校小編給到各位小夥伴帶來了不同髮型繪畫練習,以後再也不擔心不會畫頭髮了!
  • 世界名畫是怎麼畫出來的 AI可能在尋找答案
    【環球網智能報導 記者張陽】Amy Zhao和她的團隊成員正在進行一個新項目研發,名為「時間飛船」(Timecraft)他們希望使用機器學習來幫忙分析重現一幅畫作的繪畫過程,在他們題為《繪製過去,合成繪畫延時視頻》的論文中,他們描述了如何利用繪畫過程的延時視頻訓練機器學習算法,以實現重現一幅畫作的繪製步驟
  • 百米長卷美術作品《畫說京杭大運河》創作完成
    新華社石家莊9月21日電(記者馮維健、王民)記者從河北衡水中國書畫博物館獲悉,由多位畫家歷時一年聯合創作的百米長卷美術作品《畫說京杭大運河》近日在衡水市繪製完成。據介紹,《畫說京杭大運河》共分5卷,全卷通高1.12米,總長106米。按照冬、秋、春、夏的季節特點,由北向南勾勒出大運河沿岸的歷史文化、地理標誌、人文風情。將穿越京、津、冀、魯、蘇、浙六省市的大運河沿岸風光落於紙上。「我詳細研究了清光緒年間的《清代京杭運河全圖》,又進行了實地採風,歷經半年時間完成了前期策劃和構思工作。」
  • 中國大寫意畫是中國繪畫最高的藝術形式!
    中國書畫同源而異派,書法的表現對象漢字是象形字,而繪畫的表現對象是各種具體事物,中國書法與中國畫都大量使用各種線條,用毛筆完成,因此中國書法與中國畫有相通性,中國繪畫必須使用書法線條,因此才有「書畫」這個稱謂,「書」放在「畫」之前,表明學習的次序,先有「書」才有「畫」,「書」的藝術性實際上要高於
  • 兒童畫作業單——欣賞馬格裡特作品,繪畫練習想像力
    10歲學畫、21歲接觸當地先鋒派藝術活動。他作為超現實主義運動的主要成員之一,挑戰著觀眾對於現實的認知,他在畫面上所營造的世界讓觀眾們興趣盎然的同時也感到驚異。他的作品後來影響了波普藝術、極簡主義和觀念藝術。
  • 怎麼樣去畫白描?白描是什麼?一種完全用線來造型的繪畫方法藝術
    白描基礎知識白描是中國畫的一種技法,指用單純的墨線勾勒形象而不加任何色彩,是古代「白畫」的發展,也是中國畫中唯一一種完全用線條來表現物象的畫法,所以又被稱為「單線平塗」法。在中國畫中 通常人物、花卉、動物等都可通過這種繪製手法來表現,但大多數情況下該技法用來畫人物和花卉。