來源:GitHub
編輯:肖琴
【新智元導讀】一個模型可以實現多個圖像修改任務!本文作者結合自注意力GAN、逐漸增大的訓練方式等技術,實現了驚豔的舊照片著色效果。圖像著色、圖像增強、恢復舊圖像等是計算機視覺領域的熱點問題,不過,用一個模型很好地實現多個任務的研究不多。
近日,GitHub用戶Janson Antic發布了一個名為DeOldify的項目,這是一個給舊照片著色和修復的神器。
地址:https://github.com/jantic/DeOldify
讓我們先看看效果:
Maria Anderson as the Fairy Fleur de farine and Lyubov Rabtsova as her page in the ballet 「Sleeping Beauty」 at the Imperial Theater, St. Petersburg, Russia, 1890.
Woman relaxing in her livingroom (1920, Sweden)
Medical Students pose with a cadaver around 1890
Surfer in Hawaii, 1890
Whirling Horse, 1898
Interior of Miller and Shoemaker Soda Fountain, 1899
Paris in the 1880s
Edinburgh from the sky in the 1920s
(更多結果圖像請點擊文末連結查看)
這是一個基於深度學習的模型。具體來說,我結合了以下方法:
這個模型的驚豔之處在於,它對各種各樣的圖像修改都很有用,而且應該能做得很好。上面舉例的是著色模型的結果,但這只是pipeline的一個部分,用同樣的模型可以開發更多任務。
我用這個模型開發的下一個任務是修復舊圖像,使它們看起來更好,所以我的下一個項目是「defade」模型。我已經做了最初的努力,在我寫這篇文章時已經處於模型訓練的早期階段。基本上,它只是訓練相同的模型來重建圖像,使用誇張的對比度/亮度調整來增強圖像,作為褪色照片和使用舊/壞設備拍攝的照片的模擬。我已經看到了一些有希望的結果:
以上就是這個項目的要點——我希望用GAN讓老照片看起來更好,更重要的是,讓項目有用。
這個項目是用Fast.AI library建的。不幸的是,用的是舊版本,我還沒有升級到新版本。 因此,先決條件是:
舊版本的Fast.AI library:https://github.com/jantic/fastai
Fast.AI已有的dependencies:已有方便的requirements.txt和environment.yml
Pytorch 0.4.1(需要spectral_norm,因此需要最新的穩定版本)。
Jupyter Lab
Tensorboard(即安裝Tensorflow)和TensorboardX(https://github.com/lanpa/tensorboardX)。 需要注意的是,默認情況下, progress images將每200次迭代寫入Tensorboard,因此可以持續方便地查看模型正在執行的操作。
BEEFY顯卡。我的是GeForce 1080TI(11GB),真希望有比11 GB更大的內存。Unet和Critic都非常大,但越大效果越好。
對於想要立即開始轉換自己的圖像的人:.好吧,你需要等我先上傳預先訓練好的權重。 一旦可用,就可以在可視化筆記本中引用它們。我將使用ColorizationVisualization.ipynb。你只需要用我上傳的生成器(colorizer)的權重文件替換colorizer_path = IMAGENET.parent /('bwc_rc_gen_192.h5')
假設你在內存足夠大的GPU(例如11 GB GeForce 1080Ti)上運行這個程序,我將保持大小約為500px。如果內存小於11GB,你可以將圖像縮小,或嘗試在CPU上運行。
項目地址:
https://github.com/jantic/DeOldify
【加入社群】
新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號:aiera2015_3 入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。