如果你這幾天在海外社交網絡上出沒,應該也注意到了一股神奇的風潮:所有人都在分享自己40年後的照片……
當然,人類還沒有發明出時光機器。這些照片,並非來自真正的40年以後,只是效果太過於真實和美好。並且,似乎每一位帥哥靚女,在40年後都變成了英俊大叔和時尚女魔頭:
喬納斯大叔組合(原圖 Jonas Brothers):
復聯組合:
說唱歌手 Drake:
歌手碧梨:
就連三十年逆生長的蟻人 Paul Rudd,也終於變成了帥大叔:
除了變老之外,FaceApp 還支持去皺紋、變性別、加笑臉、拼圖等功能。
從美圖秀秀,到 Instagram、Snapchat,許多軟體都以臉部濾鏡見長。即便如此,許多人還是第一次見到了如此惟妙惟肖的人工智慧臉部合成效果。
FaceApp 到底是怎麼做到的?
其實在最近爆紅之前,FaceApp 已經存在很久了。它的開發公司位於俄羅斯聖彼得堡,創始人雅羅斯拉夫·岡查洛夫 (Yaroslav Goncharov) 是「俄國版 Google」 Yandex 的前高管。
岡查洛夫曾經透露,FaceApp 所依賴的正是深度神經網絡,也即人工智的背後技術。
具體來說,FaceApp 採用的是「深度生成式卷積神經網絡」(deep generative convnets)。
人工神經網絡是粗略仿照人腦神經連接結構而人工構建的電腦程式。就像信號在人腦的神經元之間傳遞那樣,科學家用數學的方式在節點之間傳遞和計算。最終,神經網絡得到了識別特徵的能力。
FaceApp 從你的人像照片裡提取關鍵的特徵點(比如臉型、五官的相對位置、髮型等),同時對其它非重要的特徵點(比如皮膚顏色、皮膚材質、發色等)進行修改。最終,因為重要特徵被保留,你得到了一張看起來老了40歲的照片。
FaceApp 所採用的深度生成式卷積神經網絡,屬於生成式對抗網絡,也即最近在圈子裡很流行的「GAN」(generative adversarial network) 的一種形式。
微軟亞洲研究院提供了一段描述,對於理解 GAN 的工作機制很有幫助:
男:哎,你看我給你拍的好不好?
女:這是什麼鬼,你不能學學XXX的構圖嗎?
男:哦
男:這次你看我拍的行不行?
女:你看看你的後期,再看看YYY的後期吧,呵呵
男:哦
男:這次好點了吧?
女:呵呵,我看你這輩子是學不會攝影了
男:這次呢?
女:嗯,我拿去當頭像了
男生一直試圖拍出像優秀攝影師一樣的好照片,女生一直以挑剔的眼光找出「自己男朋友」和「別人家的男朋友」拍的照片的區別。兩者的交流過程:男生拍照 ->女生分辨男生拍的和自己喜歡照片的區別->男生根據反饋改進技術,拍新照片->女生根據新照片繼續提改進意見->……,直到均衡出現:即女生不能再分辨出「自己男朋友」照片和「別人家的男朋友」照片的區別。
正因為此,GAN 很適合用來人工合成虛假的,但看起來很「真實」的視覺素材,比如圖像,甚至視頻。
目前,網上可以找到的大部分 FaceApp 老年照片,在第一次老化時的效果最好。但如果你連續多次進行老化處理,就會發現 FaceApp 使用人工神經網絡的線索:
在第三張照片裡,你已經能清楚地看到人工神經網絡是如何從第二張照片裡提取並強化皺紋特徵的。而在第四張裡,皺紋的強化效果太過於明顯,出現了失真。
在人臉上,GAN 可以做很多事情。FaceApp 的變老、去皺紋、變性別、加笑臉等等,都是 GAN 實現的。用 Instagram、Snapchat、抖音等 app,還可以實現瘦臉、化妝、加貓耳朵等效果。這一類改變,我們可以將其命名為特徵修改。
用美圖秀秀,可以把人臉照片換成動漫風格;之前有一個app 曾經火過一段時間,名叫 Prisma,能把任何照片改成類似梵谷《星夜》那樣的風格。這種改變,叫做風格遷移 (style transfer):
GAN 還有一個方向,就是像很多科幻電影裡那樣,對一張模糊照片進行超解析度清晰化 (super-resolution)。
下圖中,左邊為故意模糊的初始照片,中間為超解析度的效果,右邊為模糊處理之前的原圖。可以看出,儘管復原的照片和原圖仍有可分辨的區別,但至少清晰化的效果令人震驚。
儘管 GAN 可以做很多事情,從2017年上線以來,FaceApp 一直堅持在用 GAN 「寫實」的方向上努力。岡查洛夫曾經宣稱,市面上沒有其它的產品或者論文研究,能夠在寫實效果上超越 FaceApp 的水準。
「誰可以真實反映一個人的臉:攝影師、鏡子,還是畫家呢?」畢卡索曾經這樣說過。
現在,人工神經網絡不但能真實反映人臉,甚至還可以生成全新的、足以以假亂真的人臉……