機器之心報導
編輯:張倩、蛋醬
朱元璋、林黛玉、兵馬俑、杜甫…… 這些歷史人物到底長什麼樣?B 站 up 主「大谷」幫我們用 AI 還原出了一種可能。
無論是理科還是文科的同學,想必都對中學歷史課本上的「朱元璋」畫像印象深刻。這幅畫像裡的朱元璋長了一張「鞋拔子臉」,只能用帝王特有的「異相」來解釋。
然而,在故宮南燻殿所藏的官方正式版歷代帝王畫像中,朱元璋的長相就正常多了:
朱元璋到底長什麼樣?其實這個問題一直都有爭議。很多人認為,故宮收藏的官方畫像似乎更有說服力,因為這兩幅畫的相貌相似程度和隨年齡的演變不容易造假。
雖然畫像可以大體還原古人的長相,但總不及照片來得寫實、清晰。最近,國內外似乎掀起了一場用 AI 還原古人的潮流,先是有 設計師用 GAN 和 PS 復原了,後有 B 站 up 主「大谷」用 AI 還原中國皇帝朱元璋,還是能動的那種:
居然有點帥是怎麼回事?
此外,大谷此次還復原了林黛玉、徐悲鴻等人的畫像以及蔣兆和、黃胄等人經典畫作中的人物:
林黛玉。
蔣兆和《老伴》。
徐悲鴻。
黃胄《于闐歌舞圖》。
就連博物館的兵馬俑也有了寫實的長相:
評論區有人說:「想看秦始皇,以後轉帳的時候好對比一下。」
前面說到課本,還記得你當年塗過的杜甫嗎?作為課本塗鴉界最受歡迎的人物,杜甫也在新一期的視頻中出鏡了,而且還唱上了奧特曼主題曲《奇蹟再現》,有望成為 B 站新一輪鬼畜素材。
大谷在視頻中簡單介紹了這些成果和他所用的方法(友情提示:不關彈幕可能看不到作品)。或許,我們離哈利波特的魔法世界真的不遠了。
修復技術細節
大谷在視頻中介紹稱,影片的 AI 工作流來自海外博主 Denis Shiryaev 的教程,Denis 曾在 AI Stuff 系列中修復了很多西方經典油畫人物,我們可以將其稱為「神經網絡的藝術」。
比如神秘的蒙娜麗莎:
墨西哥傳奇女畫家弗裡達《戴荊棘和蜂鳥項鍊的自畫像》:
還有《戴珍珠耳環的少女》:
《維納斯的誕生》:
完整視頻如下:
Denis Shiryaev 的 youtube 主頁:https://www.youtube.com/user/shirman88
Denis 在這一視頻中所使用的修復技術有五種,分別是 Face-Image-Motion-Model、StyleGAN2-Face-Modificator、DAIN、ESRGAN 和 Artbreeder。
Face-Image-Motion-Model
項目地址:https://github.com/tg-bomze/Face-Image-Motion-Model
該模型基於「First Order Motion」這一核心模型,方法來源於 NeurIPS 2019 論文《First Order Motion Model for Image Animation》。機器之心此前介紹過的視頻會議換臉軟體「」,也是基於這一技術實現人臉處理的。
論文連結:https://papers.nips.cc/paper/8935-first-order-motion-model-for-image-animation.pdf
「First Order Motion」框架由兩個主要模塊組成:「運動估計模塊」和「圖像生成模塊」。運動估計模塊的目的在於預測密集的運動場,此處假設存在一個抽象的參考坐標,並預估存在「from reference to source」和「from reference to driving」兩種轉換。因此可以獨立處理源幀和驅動幀。做這樣的處理是因為模型在測試時會接收從不同視頻中採樣的源圖像幀和驅動幀的組,從視覺上來說可能會很不同。
「First Order Motion」方法概述圖。
StyleGAN2-Face-Modificator
StyleGAN2-Face-Modificator 項目效果圖。
項目地址:https://github.com/tg-bomze/StyleGAN2-Face-Modificator
是英偉達在 2019 年 12 月開源的高解析度圖像生成方法,相比於前輩「StyleGAN」,它在解決生成圖像偽影問題的同時,還能得到細節更好的高質量圖像。「StyleGAN2-Face-Modificator」則是基於這一技術開發的人臉編輯器工具。
論文連結:https://arxiv.org/abs/1912.04958
DAIN
項目地址:https://github.com/baowenbo/DAIN
DAIN 模型來源於 CVPR 2019 論文《Depth-Aware Video Frame Interpolation》,在這一研究中,上海交通大學、加州大學默塞德分校、谷歌等機構的研究者,針對基於深度學習的視頻插幀任務中的常見問題進行了優化,提出了一種利用深度信息檢測遮擋的視頻幀插值方法。Denis 在多個修復視頻中都使用了這一技術。
論文地址:https://arxiv.org/pdf/1904.00830.pdf
ESRGAN
項目地址:https://github.com/xinntao/ESRGAN
Denis Shiryaev 視頻中所用到的解析度擴增方法為「ESRGAN」,該方法來源於 ECCV 2018 Workshop 論文《ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks》,研究者在 * *SRGAN 的基礎上進行了改進,包括改進網絡的結構、判別器的判別形式,以及更換了一個用於計算感知域損失的預訓練網絡,提出了一種 Residual-in-Residual Dense Block (RRDB) 的網絡單元。
論文連結:https://arxiv.org/pdf/1809.00219.pdf
Artbreeder
Artbreeder 是一款在線生成程序,該網站擁有大量不同風格的面部圖像,用戶可以手動進行調整,將不同的圖像混合在一起,生成全新的圖像。
近日,設計師 Daniel Voshart 利用 Artbreeder,結合手動調整,修復了 800 張羅馬皇帝半身像的照片,在社交網絡上引起熱議。
網站地址:http://artbreeder.com/
此外,Denis Shiryaev 還在自己的 YouTube 頻道發布了許多修復視頻,如果你有興趣的話,可以在他的網站觀看更多作品:https://neural.love/
註:本文視頻素材來自 B 站帳戶「大谷的遊戲創作小屋」,轉載已獲授權。
Amazon SageMaker 是一項完全託管的服務,可以幫助開發人員和數據科學家快速構建、訓練和部署機器學習 模型。SageMaker完全消除了機器學習過程中每個步驟的繁重工作,讓開發高質量模型變得更加輕鬆。
現在,企業開發者可以免費領取1000元服務抵扣券,輕鬆上手Amazon SageMaker,快速體驗5個人工智慧應用實例。
© THE END
轉載請聯繫本公眾號獲得授權
投稿或尋求報導:content@jiqizhixin.com
原標題:《AI還原的朱元璋、兵馬俑來了!杜甫激燃演唱奧特曼主題曲,B站Up主大谷新作》
閱讀原文