資源| 用自注意力GAN為百年舊照上色:效果驚豔,多圖預警!

2020-12-17 機器之心Pro

選自GitHub

作者：Jason Antic

機器之心編譯

參與：路、張倩

本文介紹了一個舊照片著色&修復神器DeOldify，包括修復效果、技術細節等。

項目地址：https://github.com/jantic/DeOldify/blob/master/README.md

該項目的目的是為舊照片著色並將其修復。本文將簡要介紹技術細節。首先，先來看一下 DeOldify 對舊照片的修復效果！（大部分原圖像來自 r/TheWayWeWere subreddit。）

和人體骨骼一起拍照的醫學生（約 1890 年）

Whirling Horse（1898）

19 世紀 80 年代的巴黎

20 世紀 20 年代的愛丁堡俯瞰

倫敦滑鐵盧車站人們第一次看到電視機（1936）

抽鴉片的大清子民（1880）

非常舊和質量差的照片也能修復得很好：

南達科他州枯木鎮（1877）

家庭合照（1877）

但，模型效果並不總是完美的。下圖中紅手讓人抓狂：

塞內卡原住民（1908）

該模型還能對黑白線稿進行著色：

技術細節

這是一個基於深度學習的模型。具體來說，我所做的是將以下方法組合在一起：

帶自注意力機制的生成對抗網絡。生成器是一個預訓練 Unet，我將它修改為具有光譜歸一化和自注意力。這是一個非常簡單的轉換過程。不過，之前我拼命地嘗試用 Wasserstein GAN，但效果並不好，直到用上這個版本，一切都變了。我喜歡 Wasserstein GAN 的理念，但它在實踐中並沒有成功。我愛上了帶自注意力的 GAN。

受 GAN Progressive Growing 的啟發（參見《Progressive Growing of GANs for Improved Quality, Stability, and Variation》）設計出的訓練結構。不同之處在於層數保持不變——我只是不斷改變輸入的尺寸並調整學習率，以確保尺寸之間的轉換順利進行。似乎基本最終結果是相同的——訓練更快、更穩定，且泛化效果更好。兩個時間尺度上的更新規則（參見《GANs Trained by a Two Time-Scale Update Rule Converge to a Local Nash Equilibrium》）。這個也非常簡單，只是一個一對一生成器/critic 迭代及較高級別的 critic 學習率。生成器損失分為兩個部分：一部分是基於 VGG16 的基本感知損失（或特徵損失）——這只是偏向生成器模型來複製輸入圖像。另一部分是來自 critic 的損失分數。感知損失本身不足以產生好的結果，只會帶來大量的棕色/綠色/藍色填充——測試的時候作弊可是神經網絡的強項！這裡要理解的重點是：GAN 本質上是在為你學習損失函數——這實際上是朝著我們在機器學習中追求的理想邁進了一大步。當然，讓機器學習你以前手工編碼的東西通常會得到更好的結果。在這個例子中就是這樣。

該模型的美妙之處在於，它可能適用於所有類型的圖像修復，效果也應該很好。上文展示了很多模型結果，但這只是我想開發的流程的一個組件。

接下來，我想做的是「defade」模型。我已經做了一些初步努力，截至本文寫作時，它還在訓練階段。大體上，是訓練同樣的模型用於重建使用過分的對比度／亮度調整後的圖像。我已經看到了一些還不錯的試驗結果：

關於該項目

該項目的重點是：我想利用 GAN 使舊照片變得好看，更重要的是，做一個有用的項目。我對視頻很感興趣，但是首先我需要先解決如何處理模型和內存的關係。如果該模型在 1080TI 上的訓練時間不用花費兩三天就太棒了（然而 GAN 通常需要這麼長時間……）我將積極更新和改進代碼，並嘗試使該項目對用戶友好。

開始操作

該項目基於 Fast.AI 庫構建。不過，我使用的是舊版本庫，即將更新為新版本。構建該項目的先決條件是：

舊版本 Fast.AI 庫。埋頭該項目兩個月後，我有點疑惑，因為標註為「old」的舊版本 Fast.AI 庫和我用的庫不一樣。因此建議使用這裡的庫：https://github.com/jantic/fastai。不管 Fast.AI 的依賴項是什麼，總有方便的 requirements.txt 和 environment.yml。Pytorch 0.4.1（需要 spectral_norm，因此需要最新的穩定版本）。Jupyter LabTensorboard（即安裝 Tensorflow）和 TensorboardX (https://github.com/lanpa/tensorboardX)。ImageNet：很棒的訓練數據集。強大的 GPU：我想要比 GeForce 1080TI (11GB) 更大內存的 GPU。內存越少花費時間就會越多。Unet 和 Critic 非常大，但是它們規模越大，獲得的結果也會越好。

至於想要立刻開始轉換自己的圖像的人：如果要立刻開始使用自己的圖像而不訓練模型的話，你需要我上傳預訓練權重。我正在做這件事。做好之後，你可以在可視化 notebook 中看到。我將使用 ColorizationVisualization.ipynb。你需要設置 colorizer_path = IMAGENET.parent/('bwc_rc_gen_192.h5')。我上傳的權重文件用於生成器（著色器）。

然後你就可以把想轉換的任意圖像放在/test_images/文件夾，然後在 notebook 內部看到結果：

vis.plot_transformed_image("test_images/derp.jpg", netG, md.val_ds, tfms=x_tfms, sz=500)

我把圖像大小設置為 500px 左右，你需要在足夠內存的 GPU 上運行（比如 11 GB GeForce 1080Ti）。如果內存過少，你需要將圖像調小或者嘗試在 CPU 上運行模型。我試過後一種方法，非常慢……我還沒有研究具體原因。

本文為機器之心編譯，轉載請聯繫本公眾號獲得授權。

相關焦點

資源|帶自注意力機制的生成對抗網絡,實現效果怎樣?

在前一段時間，Han Zhang 和 Goodfellow 等研究者提出添加了自注意力機制的生成對抗網絡，這種網絡可使用全局特徵線索來生成高解析度細節。本文介紹了自注意力生成對抗網絡的 PyTorch 實現，讀者也可以嘗試這一新型生成對抗網絡。
TC外傳大黃蜂上色實拍圖公布,造型媲美可動模型!

去年11月底第三方廠家TC公布了外傳大黃蜂的灰模實物圖，極其出色的人形還原度真的是相當驚豔，一時間還以為是threezero DLX那款外傳大黃蜂呢。時隔大半年TC外傳大黃蜂終於又有了新的動態，廠家在微博上公布了一組上色實拍圖，我們一起來看看！
小哥把黑白舊照都「彩」後,幾十上百年的歷史,生動了~

對歷史有強烈興趣的他，這些年卻迷上了藝術圈裡越來越流行的一種活動——彩化舊照片。彩化舊照片就是運用PS等工具軟體，把古老的黑白照變成彩色，這樣的上色不是憑空發揮，而查閱大量資料，結合但是的歷史背景，人物環境，做出儘可能精準的色彩還原。
AI為黑白電影和照片上色:效果驚豔在線可玩,網友大呼鵝妹子嚶

在Facebook的F8大會上，國外技術小哥Jason Antic展示了一種叫DeOldify的AI模型，這種技術為老電影上色效果堪稱驚豔。不信？直接看效果：比如，1960年的美國驚悚恐怖電影《驚魂記》：用AI上色後的毫不違和，人臉部分的妝容也不彆扭：黑白電影時代的幽默大師卓別林，第一次在鏡頭下有了顏色：89年前的美國電影Reefer Madness，就這樣被輕鬆還原了：
62公分外傳擎天柱上色圖來了,居然有半透明效果?

香港廠家Yolopark的62公分外傳擎天柱可動模型最近又有了新動態，廠家在官方微博上發布了一張上色圖，我們起來看看效果如何！圖片轉自微博用戶@YOLOPARK官方從上色效果圖上不難看出這款產品的塗裝跟threezero家的有的一拼，都是寫實做舊戰損效果，而且畢竟是62公分的巨大尺寸，所以細節呈現則更加出色
DS大力神Giant Axe破壞者上色圖發布

DS01即將發售，該廠家發布了DS02 Giant Axe的上色圖，一起看看看吧！載具形態，可以看到履帶明顯有鏽化做舊效果，考慮到設計上履帶並不接地，塗裝磨損應該會很小。駕駛艙使用白色啞光漆面，黑色零星做舊。從後面看履帶可能是油性漆整塊上色，掉漆機率真的很小了。鏟鬥部分為鐵灰色打底外加白色薄噴，最後才是黑色點綴。整體效果其實不算驚豔，如果載具形態下能保持較好的一體性還是值得期待的。
這個AI「大師級」簡筆畫水平,驚豔到了網友:竟然不用GAN

雖然人物眾多，但出來的簡筆畫效果，依舊還是能分清劇中的人物。如果毛髮特別濃密的人物照，AI還能hold得住嗎？也正因如此，ArtLine的效果真真兒的驚豔到了網友。那麼，它是如何做到的呢？
TF - GAN入門:TensorFlow 2.0 的輕量級 GAN 庫

他們的早期思想為當今的許多深度學習前沿研究奠定了基礎，包括 LSTM、元學習、注意力機制和強化學習等。>>> 人工智慧改變中國，我們還要跨越這三座大山 | 獻禮 70 周年用於機器學習的軟體庫往往對研究成功至關重要，因此軟體庫的更新速率必須能夠跟上機器學習研究發展的腳步。
別人家的高中生:入大學前,Ta詳細梳理了GAN的發展脈絡

論文地址：https://arxiv.org/abs/1406.2661代碼實現地址：https://github.com/goodfeli/adversarial其他資源：https://arxiv.org/abs/1701.00160DCGAN: 深度卷積生成對抗網絡DCGAN 的思路可以簡單概括為：卷積神經網絡=處理圖像效果好生成對抗網絡
資源 | NIPS 2017 Spotlight論文Bayesian GAN的TensorFlow實現

你可以查看 synth.iptnb，進一步探索合成實驗，並生成詹森-香農差異圖。MNIST、CIFAR10、CELEBA、SVHNbayesian_gan_hmc 腳本允許在標準和自定義數據集上訓練模型。下面，我們將介紹如何使用該腳本。
日本皇后美智子絕版舊照,第五幅圖,舉手投足盡顯高貴優雅

日本皇后美智子絕版舊照，第五幅圖，舉手投足盡顯高貴優雅日本皇后美智子，這位當年驚豔一時的美人。日本皇室為了維持血統的純潔，一直實行的是近親結婚（局限在皇族跟華族內），從來沒有接納過民間的女子，日本舊貴族紛紛中傷美智子，而且他們的婚事也受到明仁的母親良子皇后的反對，美智子的父親也是反對的，甚至不願意女兒跟皇太子再接觸。最終1959年4月10日美智子與皇太子明仁親王結婚，成為皇太子妃。現在來一組日本皇后美智子絕版舊照，一起見證這位溫婉的佳人。
「民國四大美女之一」陸小曼絕版的舊照,你被驚豔到了嗎?

「民國四大美女之一」陸小曼絕版的舊照，你被驚豔到了嗎？陸小曼，民國典型的名門閨秀，京城著名的交際花，民國四大美女之一，她的容貌極為的豔麗，眉如新月，臥蠶彎月，巧麗靈動，一顰一笑盡顯風情萬種。現在來一組「民國四大美女之一」陸小曼絕版的舊照，你被驚豔到了嗎？陸小曼精通英語法語，會彈鋼琴，寫得一手漂亮的蠅頭小楷，繪畫、朗誦、唱戲無一不通，她更是北平不可不看的一道風景，二十三歲嫁給了徐志摩，成為其最嬌寵的女人。1931年11月19日，徐志摩因飛機失事罹難，獨留陸小曼一人，她幾乎眾叛親離，此後她洗盡鉛華，不再踏足社交圈，一心整理出版亡夫的遺作。
TW軍艦天火上色實物圖公布,軍艦造型很亮眼!

出貨速度慢得一匹的TW終於又有新動態了，之前跟兄弟們分享過的軍艦版天火已經有了上色實拍圖，咱們一起先睹為快！圖片轉自微博用戶@玩具人小木這是內容物一覽圖，東西不算多，除了天火主體外，還有軍艦形態的展示底座以及大砍刀一把。
三水河口江畔舊照:貨如輪轉通四方百年關口今猶在

遠處的江岸，一座4層的英式洋樓矗立在一群民房中，顯得鶴立雞群，它就是建於1897年的三水百年海關大樓。三水河口海關大樓是英國在中國設立的早期海關之一。三水關外籍稅務司自1897年起至1938年止，每年都向粵海關總稅務司編制「三水關口岸貿易報告」。及至1938年三水在抗戰中淪陷，口岸被封鎖，海關被撤銷。目前，這棟已經擁有120年歷史的建築仍然保存較為完整。
圖深度學習入門教程(六)——注意力機制與圖注意力

（4）用concat函數把計算h次之後的最終結果拼接起來。其中，第（4）步的操作與多分支卷積（在下冊會詳細介紹）技術非常相似，其理論可以解釋為：（1）每一次的注意力機制運算，都會使原數據中某個方面的特徵發生注意力轉化（得到局部注意力特徵）。（2）當發生多次注意力機制運算之後，會得到更多方向的局部注意力特徵。
舊的辦公家具不要扔,用自噴漆簡單噴一噴,變廢為寶!

之所以會留下這張凳子，很大原因就是用久了，有感情了。相信很多人都有這樣的經歷，家具用久了之後，都會有感情，捨不得扔了。這些差點被扔掉的家具，很多情況下並不是因為它不能用了，而是它外觀問題的影響。現在，有了迪確美自噴漆，舊物改造變得很容易。
告別自注意力,谷歌為Transformer打造新內核Synthesizer

實驗顯示，即使不進行token之間的attention交互計算，synthesizer在翻譯、語言模型、GLUE等任務上也可以達到很好的效果。前言什麼是自注意力？Transformer 的關鍵在於 query-key-product 的點積注意力，token 被完全連接，能夠對遠距離的依賴關係進行建模。Transformer 存在的問題點積自注意力提供了強大的建模能力，但同時作者對點積自注意力提出了質疑，它的計算可能是不必要的。
歷史絕版舊照:圖1洗盡鉛華的趙四小姐,圖4金庸的夢中情人

歷史絕版舊照：圖1洗盡鉛華的趙四小姐，圖4金庸的夢中情人趙一荻原名趙綺霞，出身頗有名望的官宦家庭，接受較好的教育，容貌清麗典雅，氣質出眾，在16歲時第一次見到張學良，兩人一見鍾情。圖為趙四小姐洗盡鉛華的留影，依稀可見其清麗容顏。黃金榮和杜月笙（右一）、張嘯林的合影，三位大佬同框實屬罕見，他們都是當年上海灘響噹噹的青幫老大，人稱「青幫三大亨」，其中以杜月笙最具傳奇色彩，他從一個小嘍嘍混進黑幫，成長為黑幫老大。
沈騰舊照被站姐式P圖,秒變膚白貌美日系花美男,網友:男團門面

1月4日，有網友用站姐式p圖方法給沈騰的舊照精修一般，瞬間引起熱議。沈騰原來的五官就已經非常帥氣，該網友則是把他的皮膚修得更加白皙細膩，眼睛也p得更大了一點，更符合當下花美男的審美，精修過後的沈騰顏值完全不輸現在娛樂圈中的小鮮肉。
超火的漫畫線稿上色AI出新版了!無監督訓練,效果更美好 | 代碼+Demo

Demo也一併放出，用戶可以隨意試玩~△ Demo界面據作者說，style2paints 2.0比一代效果更好，而且模型的訓練過程是無監督的。效果驚豔只需線稿一張，輕點一下，就能給你珍藏的心愛萌妹上個色。△ 上面線稿的轉換效果贊贊的！

資源| 用自注意力GAN為百年舊照上色:效果驚豔,多圖預警!

相關焦點

資源|帶自注意力機制的生成對抗網絡,實現效果怎樣?

TC外傳大黃蜂上色實拍圖公布,造型媲美可動模型!

小哥把黑白舊照都「彩」後,幾十上百年的歷史,生動了~

AI為黑白電影和照片上色:效果驚豔在線可玩,網友大呼鵝妹子嚶

62公分外傳擎天柱上色圖來了,居然有半透明效果?

DS大力神Giant Axe破壞者上色圖發布

這個AI「大師級」簡筆畫水平,驚豔到了網友:竟然不用GAN

TF - GAN入門:TensorFlow 2.0 的輕量級 GAN 庫

別人家的高中生:入大學前,Ta詳細梳理了GAN的發展脈絡

資源 | NIPS 2017 Spotlight論文Bayesian GAN的TensorFlow實現

日本皇后美智子絕版舊照,第五幅圖,舉手投足盡顯高貴優雅

「民國四大美女之一」陸小曼絕版的舊照,你被驚豔到了嗎?

TW軍艦天火上色實物圖公布,軍艦造型很亮眼!

三水河口江畔舊照:貨如輪轉通四方 百年關口今猶在

圖深度學習入門教程(六)——注意力機制與圖注意力

舊的辦公家具不要扔,用自噴漆簡單噴一噴,變廢為寶!

告別自注意力,谷歌為Transformer打造新內核Synthesizer

歷史絕版舊照:圖1洗盡鉛華的趙四小姐,圖4金庸的夢中情人

沈騰舊照被站姐式P圖,秒變膚白貌美日系花美男,網友:男團門面

超火的漫畫線稿上色AI出新版了!無監督訓練,效果更美好 | 代碼+Demo

三水河口江畔舊照:貨如輪轉通四方百年關口今猶在