資源| 用自注意力GAN為百年舊照上色:效果驚豔,多圖預警!

2020-12-17 機器之心Pro

選自GitHub

作者:Jason Antic

機器之心編譯

參與:路、張倩

本文介紹了一個舊照片著色&修復神器DeOldify,包括修復效果、技術細節等。

項目地址:https://github.com/jantic/DeOldify/blob/master/README.md

該項目的目的是為舊照片著色並將其修復。本文將簡要介紹技術細節。首先,先來看一下 DeOldify 對舊照片的修復效果!(大部分原圖像來自 r/TheWayWeWere subreddit。)

和人體骨骼一起拍照的醫學生(約 1890 年)

Whirling Horse(1898)

19 世紀 80 年代的巴黎

20 世紀 20 年代的愛丁堡俯瞰

倫敦滑鐵盧車站人們第一次看到電視機(1936)

抽鴉片的大清子民(1880)

非常舊和質量差的照片也能修復得很好:

南達科他州枯木鎮(1877)

家庭合照(1877)

但,模型效果並不總是完美的。下圖中紅手讓人抓狂:

塞內卡原住民(1908)

該模型還能對黑白線稿進行著色:

技術細節

這是一個基於深度學習的模型。具體來說,我所做的是將以下方法組合在一起:

帶自注意力機制的生成對抗網絡。生成器是一個預訓練 Unet,我將它修改為具有光譜歸一化和自注意力。這是一個非常簡單的轉換過程。不過,之前我拼命地嘗試用 Wasserstein GAN,但效果並不好,直到用上這個版本,一切都變了。我喜歡 Wasserstein GAN 的理念,但它在實踐中並沒有成功。我愛上了帶自注意力的 GAN。

受 GAN Progressive Growing 的啟發(參見《Progressive Growing of GANs for Improved Quality, Stability, and Variation》)設計出的訓練結構。不同之處在於層數保持不變——我只是不斷改變輸入的尺寸並調整學習率,以確保尺寸之間的轉換順利進行。似乎基本最終結果是相同的——訓練更快、更穩定,且泛化效果更好。兩個時間尺度上的更新規則(參見《GANs Trained by a Two Time-Scale Update Rule Converge to a Local Nash Equilibrium》)。這個也非常簡單,只是一個一對一生成器/critic 迭代及較高級別的 critic 學習率。生成器損失分為兩個部分:一部分是基於 VGG16 的基本感知損失(或特徵損失)——這只是偏向生成器模型來複製輸入圖像。另一部分是來自 critic 的損失分數。感知損失本身不足以產生好的結果,只會帶來大量的棕色/綠色/藍色填充——測試的時候作弊可是神經網絡的強項!這裡要理解的重點是:GAN 本質上是在為你學習損失函數——這實際上是朝著我們在機器學習中追求的理想邁進了一大步。當然,讓機器學習你以前手工編碼的東西通常會得到更好的結果。在這個例子中就是這樣。

該模型的美妙之處在於,它可能適用於所有類型的圖像修復,效果也應該很好。上文展示了很多模型結果,但這只是我想開發的流程的一個組件。

接下來,我想做的是「defade」模型。我已經做了一些初步努力,截至本文寫作時,它還在訓練階段。大體上,是訓練同樣的模型用於重建使用過分的對比度/亮度調整後的圖像。我已經看到了一些還不錯的試驗結果:

關於該項目

該項目的重點是:我想利用 GAN 使舊照片變得好看,更重要的是,做一個有用的項目。我對視頻很感興趣,但是首先我需要先解決如何處理模型和內存的關係。如果該模型在 1080TI 上的訓練時間不用花費兩三天就太棒了(然而 GAN 通常需要這麼長時間……)我將積極更新和改進代碼,並嘗試使該項目對用戶友好。

開始操作

該項目基於 Fast.AI 庫構建。不過,我使用的是舊版本庫,即將更新為新版本。構建該項目的先決條件是:

舊版本 Fast.AI 庫。埋頭該項目兩個月後,我有點疑惑,因為標註為「old」的舊版本 Fast.AI 庫和我用的庫不一樣。因此建議使用這裡的庫:https://github.com/jantic/fastai。不管 Fast.AI 的依賴項是什麼,總有方便的 requirements.txt 和 environment.yml。Pytorch 0.4.1(需要 spectral_norm,因此需要最新的穩定版本)。Jupyter LabTensorboard(即安裝 Tensorflow)和 TensorboardX (https://github.com/lanpa/tensorboardX)。ImageNet:很棒的訓練數據集。強大的 GPU:我想要比 GeForce 1080TI (11GB) 更大內存的 GPU。內存越少花費時間就會越多。Unet 和 Critic 非常大,但是它們規模越大,獲得的結果也會越好。

至於想要立刻開始轉換自己的圖像的人:如果要立刻開始使用自己的圖像而不訓練模型的話,你需要我上傳預訓練權重。我正在做這件事。做好之後,你可以在可視化 notebook 中看到。我將使用 ColorizationVisualization.ipynb。你需要設置 colorizer_path = IMAGENET.parent/('bwc_rc_gen_192.h5')。我上傳的權重文件用於生成器(著色器)。

然後你就可以把想轉換的任意圖像放在/test_images/文件夾,然後在 notebook 內部看到結果:

vis.plot_transformed_image("test_images/derp.jpg", netG, md.val_ds, tfms=x_tfms, sz=500)

我把圖像大小設置為 500px 左右,你需要在足夠內存的 GPU 上運行(比如 11 GB GeForce 1080Ti)。如果內存過少,你需要將圖像調小或者嘗試在 CPU 上運行模型。我試過後一種方法,非常慢……我還沒有研究具體原因。

本文為機器之心編譯,轉載請聯繫本公眾號獲得授權

相關焦點

  • 資源|帶自注意力機制的生成對抗網絡,實現效果怎樣?
    在前一段時間,Han Zhang 和 Goodfellow 等研究者提出添加了自注意力機制的生成對抗網絡,這種網絡可使用全局特徵線索來生成高解析度細節。本文介紹了自注意力生成對抗網絡的 PyTorch 實現,讀者也可以嘗試這一新型生成對抗網絡。
  • TC外傳大黃蜂上色實拍圖公布,造型媲美可動模型!
    去年11月底第三方廠家TC公布了外傳大黃蜂的灰模實物圖,極其出色的人形還原度真的是相當驚豔,一時間還以為是threezero DLX那款外傳大黃蜂呢。時隔大半年TC外傳大黃蜂終於又有了新的動態,廠家在微博上公布了一組上色實拍圖,我們一起來看看!
  • 小哥把黑白舊照都「彩」後,幾十上百年的歷史,生動了~
    對歷史有強烈興趣的他,這些年卻迷上了藝術圈裡越來越流行的一種活動——彩化舊照片。彩化舊照片就是運用PS等工具軟體,把古老的黑白照變成彩色,這樣的上色不是憑空發揮,而查閱大量資料,結合但是的歷史背景,人物環境,做出儘可能精準的色彩還原。
  • AI為黑白電影和照片上色:效果驚豔在線可玩,網友大呼鵝妹子嚶
    在Facebook的F8大會上,國外技術小哥Jason Antic展示了一種叫DeOldify的AI模型,這種技術為老電影上色效果堪稱驚豔。不信?直接看效果:比如,1960年的美國驚悚恐怖電影《驚魂記》:用AI上色後的毫不違和,人臉部分的妝容也不彆扭:黑白電影時代的幽默大師卓別林,第一次在鏡頭下有了顏色:89年前的美國電影Reefer Madness,就這樣被輕鬆還原了:
  • 62公分外傳擎天柱上色圖來了,居然有半透明效果?
    香港廠家Yolopark的62公分外傳擎天柱可動模型最近又有了新動態,廠家在官方微博上發布了一張上色圖,我們起來看看效果如何!圖片轉自微博用戶@YOLOPARK官方從上色效果圖上不難看出這款產品的塗裝跟threezero家的有的一拼,都是寫實做舊戰損效果,而且畢竟是62公分的巨大尺寸,所以細節呈現則更加出色
  • DS大力神Giant Axe破壞者上色圖發布
    DS01即將發售,該廠家發布了DS02 Giant Axe的上色圖,一起看看看吧!載具形態,可以看到履帶明顯有鏽化做舊效果,考慮到設計上履帶並不接地,塗裝磨損應該會很小。駕駛艙使用白色啞光漆面,黑色零星做舊。從後面看履帶可能是油性漆整塊上色,掉漆機率真的很小了。鏟鬥部分為鐵灰色打底外加白色薄噴,最後才是黑色點綴。整體效果其實不算驚豔,如果載具形態下能保持較好的一體性還是值得期待的。
  • 這個AI「大師級」簡筆畫水平,驚豔到了網友:竟然不用GAN
    雖然人物眾多,但出來的簡筆畫效果,依舊還是能分清劇中的人物。 如果毛髮特別濃密的人物照,AI還能hold得住嗎? 也正因如此,ArtLine的效果真真兒的驚豔到了網友。 那麼,它是如何做到的呢?
  • TF - GAN入門:TensorFlow 2.0 的輕量級 GAN 庫
    他們的早期思想為當今的許多深度學習前沿研究奠定了基礎,包括 LSTM、元學習、注意力機制和強化學習等。>>> 人工智慧改變中國,我們還要跨越這三座大山 | 獻禮 70 周年用於機器學習的軟體庫往往對研究成功至關重要,因此軟體庫的更新速率必須能夠跟上機器學習研究發展的腳步。
  • 別人家的高中生:入大學前,Ta詳細梳理了GAN的發展脈絡
    論文地址:https://arxiv.org/abs/1406.2661代碼實現地址:https://github.com/goodfeli/adversarial其他資源:https://arxiv.org/abs/1701.00160DCGAN: 深度卷積生成對抗網絡DCGAN 的思路可以簡單概括為:卷積神經網絡=處理圖像效果好生成對抗網絡
  • 資源 | NIPS 2017 Spotlight論文Bayesian GAN的TensorFlow實現
    你可以查看 synth.iptnb,進一步探索合成實驗,並生成詹森-香農差異圖。MNIST、CIFAR10、CELEBA、SVHNbayesian_gan_hmc 腳本允許在標準和自定義數據集上訓練模型。下面,我們將介紹如何使用該腳本。
  • 日本皇后美智子絕版舊照,第五幅圖,舉手投足盡顯高貴優雅
    日本皇后美智子絕版舊照,第五幅圖,舉手投足盡顯高貴優雅日本皇后美智子,這位當年驚豔一時的美人。日本皇室為了維持血統的純潔,一直實行的是近親結婚(局限在皇族跟華族內),從來沒有接納過民間的女子,日本舊貴族紛紛中傷美智子,而且他們的婚事也受到明仁的母親良子皇后的反對,美智子的父親也是反對的,甚至不願意女兒跟皇太子再接觸。最終1959年4月10日美智子與皇太子明仁親王結婚,成為皇太子妃。現在來一組日本皇后美智子絕版舊照,一起見證這位溫婉的佳人。
  • 「民國四大美女之一」陸小曼絕版的舊照,你被驚豔到了嗎?
    「民國四大美女之一」陸小曼絕版的舊照,你被驚豔到了嗎?陸小曼,民國典型的名門閨秀,京城著名的交際花,民國四大美女之一,她的容貌極為的豔麗,眉如新月,臥蠶彎月,巧麗靈動,一顰一笑盡顯風情萬種。現在來一組「民國四大美女之一」陸小曼絕版的舊照,你被驚豔到了嗎?陸小曼精通英語法語,會彈鋼琴,寫得一手漂亮的蠅頭小楷,繪畫、朗誦、唱戲無一不通,她更是北平不可不看的一道風景,二十三歲嫁給了徐志摩,成為其最嬌寵的女人。1931年11月19日,徐志摩因飛機失事罹難,獨留陸小曼一人,她幾乎眾叛親離,此後她洗盡鉛華,不再踏足社交圈,一心整理出版亡夫的遺作。
  • TW軍艦天火上色實物圖公布,軍艦造型很亮眼!
    出貨速度慢得一匹的TW終於又有新動態了,之前跟兄弟們分享過的軍艦版天火已經有了上色實拍圖,咱們一起先睹為快!圖片轉自微博用戶@玩具人小木這是內容物一覽圖,東西不算多,除了天火主體外,還有軍艦形態的展示底座以及大砍刀一把。
  • 三水河口江畔舊照:貨如輪轉通四方 百年關口今猶在
    遠處的江岸,一座4層的英式洋樓矗立在一群民房中,顯得鶴立雞群,它就是建於1897年的三水百年海關大樓。三水河口海關大樓是英國在中國設立的早期海關之一。三水關外籍稅務司自1897年起至1938年止,每年都向粵海關總稅務司編制「三水關口岸貿易報告」。及至1938年三水在抗戰中淪陷,口岸被封鎖,海關被撤銷。目前,這棟已經擁有120年歷史的建築仍然保存較為完整。
  • 圖深度學習入門教程(六)——注意力機制與圖注意力
    (4)用concat函數把計算h次之後的最終結果拼接起來。其中,第(4)步的操作與多分支卷積(在下冊會詳細介紹)技術非常相似,其理論可以解釋為:(1)每一次的注意力機制運算,都會使原數據中某個方面的特徵發生注意力轉化(得到局部注意力特徵)。(2)當發生多次注意力機制運算之後,會得到更多方向的局部注意力特徵。
  • 舊的辦公家具不要扔,用自噴漆簡單噴一噴,變廢為寶!
    之所以會留下這張凳子,很大原因就是用久了,有感情了。相信很多人都有這樣的經歷,家具用久了之後,都會有感情,捨不得扔了。這些差點被扔掉的家具,很多情況下並不是因為它不能用了,而是它外觀問題的影響。現在,有了迪確美自噴漆,舊物改造變得很容易。
  • 告別自注意力,谷歌為Transformer打造新內核Synthesizer
    實驗顯示,即使不進行token之間的attention交互計算,synthesizer在翻譯、語言模型、GLUE等任務上也可以達到很好的效果。前言什麼是自注意力?Transformer 的關鍵在於 query-key-product 的點積注意力,token 被完全連接,能夠對遠距離的依賴關係進行建模。Transformer 存在的問題點積自注意力提供了強大的建模能力,但同時作者對點積自注意力提出了質疑,它的計算可能是不必要的。
  • 歷史絕版舊照:圖1洗盡鉛華的趙四小姐,圖4金庸的夢中情人
    歷史絕版舊照:圖1洗盡鉛華的趙四小姐,圖4金庸的夢中情人趙一荻原名趙綺霞,出身頗有名望的官宦家庭,接受較好的教育,容貌清麗典雅,氣質出眾,在16歲時第一次見到張學良,兩人一見鍾情。圖為趙四小姐洗盡鉛華的留影,依稀可見其清麗容顏。黃金榮和杜月笙(右一)、張嘯林的合影,三位大佬同框實屬罕見,他們都是當年上海灘響噹噹的青幫老大,人稱「青幫三大亨」,其中以杜月笙最具傳奇色彩,他從一個小嘍嘍混進黑幫,成長為黑幫老大。
  • 沈騰舊照被站姐式P圖,秒變膚白貌美日系花美男,網友:男團門面
    1月4日,有網友用站姐式p圖方法給沈騰的舊照精修一般,瞬間引起熱議。沈騰原來的五官就已經非常帥氣,該網友則是把他的皮膚修得更加白皙細膩,眼睛也p得更大了一點,更符合當下花美男的審美,精修過後的沈騰顏值完全不輸現在娛樂圈中的小鮮肉。
  • 超火的漫畫線稿上色AI出新版了!無監督訓練,效果更美好 | 代碼+Demo
    Demo也一併放出,用戶可以隨意試玩~△ Demo界面據作者說,style2paints 2.0比一代效果更好,而且模型的訓練過程是無監督的。效果驚豔只需線稿一張,輕點一下,就能給你珍藏的心愛萌妹上個色。△ 上面線稿的轉換效果贊贊的!