大熱的抖音「變身漫畫」濾鏡,背後用了什麼黑科技?

2020-12-13 澎湃新聞

原創 王司圖 果殼

最近,抖音推出了一款動漫特效濾鏡「變身漫畫」,能夠讓用戶在直播中,把自己的現實形象瞬間轉變為二次元「畫風」。對於動漫二次元愛好者來說,「打破次元壁,變身紙片人」這種自娛自樂方式可謂久玩不膩,在此之前,各種美顏修圖和視頻直播類app也都紛紛開發了類似功能,但沒有一個能夠讓用戶擁有「二次元分身」。那麼,這種能夠「動起來」的二次元濾鏡,背後隱藏什麼黑科技呢?

著名電競選手PDD秒變二次元美少年,觀眾紛紛表示:「裂開了」

神奇的風格遷移

從計算機視覺製作的角度講,把一張圖片與另一張的視覺要素相混合,稱為風格遷移(style transfer)。

把日本著名浮世繪作品《神奈川沖浪裏》遷移到一匹駿馬皮膚表面的效果 | www.theverge.com

一張照片的風格遷移,可以由人工操作,利用視覺編輯軟體完成。當然,像抖音這樣在全球擁有上億用戶的短視頻社交平臺,同時要應對如此多用戶的視覺濾鏡呈現,就需要人工智慧算法加持,尤其是「卷積神經網絡」(Convolutional Neural Network, CNN)。

今天, 「深度學習」之所以是個熱門概念,都可以追溯到卷積神經網絡在2012年的橫空出世。不要被這個高大上的名詞嚇到,它的原理其實也不複雜,用小學數學就可以解釋:在AI眼裡,任何圖片都是像素構成的矩陣(左),卷積核(kernal)是另一個小矩陣(中),它們疊加在一起,對應位置的數值相乘再求和,得到「特徵映射」(右)。

卷積核一般都不大,有的5x5,有的3x3,好比工兵的地雷探測器,去探測圖片裡存在的模式。信息逐級加工,最終得到一個分類識別的結果。

今天的AI,要想識別視覺形象,必須首先教它「學會」特徵提取 | www.cnblogs.com

提醒大家,千萬不要以為現在人工智慧就是科幻電影裡的超級電腦,全知全能。其實它現在的「認知能力」非常弱,幾乎只等於0到4歲的兒童。如上圖所示,科學家們如果想要人工智慧識別一些基礎物體,比如人臉、汽車、動物,和椅子,那麼首先就要把這些物體的特徵「提取」出來,也就是上圖第二行圖中那些五官、車輪、象鼻、椅背什麼的,交給人工智慧去「記憶」。然而可憐的人工智慧「智商捉急」,只能再把這些特徵進一步簡化為第三行圖中的簡單形狀符號,加以「死記硬背」 。而人工智慧領域的科學家,就必須像耐心的父母教育小朋友那樣,不斷調整,優化這些最基礎的形狀符號,把它們變成機器能夠理解的「卷積核參數」。

卷積核裡的數字決定了它能探測到什麼樣的特徵,或者是輪廓,或者是形狀,也可能是紋理,而「風格」就是各式特徵的組合。這些負責判斷不同圖形特徵的卷積核分層排列在一起,就成了卷積神經網絡。

ImageNet成立後,每年還會組織一次全球視覺識別挑戰賽(ILSVRC),鼓勵全球科研團隊拿出自己的 AI圖像識別算法進行PK | www.medium.com

小朋友識別物體,最好的辦法就是與周邊環境多接觸,或者看繪本畫冊。對於AI這個小朋友來說,它看的繪本,是ImageNet:一個具有1000類、數千萬張圖片的超大型數據集。卷積神經網絡就像一個笨笨的小朋友,成天在ImageNet裡面玩著「看圖識物」的訓練遊戲,久而久之,它逐漸具備了相當的特徵提取能力。

要讓人工智慧實現對大批量的實時圖像進行批量風格遷移,就好比讓這個笨笨的小朋友先瀏覽一大堆物品的形狀和顏色,然後再訓練他提取不同的特徵,最後形成圖像。好比說,如果要讓孩子畫一張「紫色大象「的圖片,父母就必須給孩子出示兩張照片,一張是非洲草原能上的大象,一張是紫色色卡。

那麼,AI這位小朋友就開始了作畫(計算),首先把這兩張照片傳送到同一個神經網絡,加以合成,要求這張新畫作上圖像的外形儘量與大象接近,顏色儘量靠近紫色,那麼AI經過反覆的內容與風格特徵提取,最終可能會達到一個滿意的效果

讓AI自己學會作畫

那麼AI有沒有可能像部分聰明的小朋友那樣,不用科學家(父母)的指導,而開始自學呢? 科學家們想出來一個點子:對抗網絡(Generative Adversarial Network),由兩套獨立的人工智慧網絡構成,分別是生成網絡(G)與判別網絡(D)。生成網絡就是那個畫畫的笨孩子,判別網絡就像是個嚴格的美術老師,負責給孩子的作品打分。

對抗網絡圖像識別與鑑定流程圖 | https://www.kdnuggets.com

判別網絡的任務很簡單,就是區分真假。何為真?自然拍攝的圖片就是真,而人工合成的圖片稱為「假」。生成網絡G會產生一批假數據,對判別網絡進行訓練,剛開始的假數據很粗糙,肯定通不過,所以判別網絡只需要很初步的識別能力就可以鑑定,這是一個「菜雞互啄」的階段。

D有了進步,G也要迎頭趕上,再對生成網絡進行訓練,目標是生成更加擬真的數據,騙過當前的判別網絡。這些新的數據又用來訓練判別網絡,自己生產,自己消化,如此循環,左右互搏。

在這個不斷博弈的過程中,兩個網絡的能力都得到了提升。如同武俠小說裡的「梯雲縱」,左腳踩右腳,右腳踩左腳,武功高強的大俠就能飛簷走壁。訓練完成之後,判別網絡作為「工具人」就可以暫時領便當休息了,留下生成網絡(G),用以產生圖像。

現在,AI這個畫畫的小朋友能夠不用指導,自己根據圖像進行臨摹了,然後還自學了填色(風格遷移)。不過這個時候,嚴格的美術老師判別網絡D又要登場了。這次不僅要鑑別圖像是否為真,還要看在填色(風格遷移)的過程中,有沒有出現其他偏差。

如圖所示,大部分現實物體中,能夠形成對應關係的並不多,所以需要兩個生成網絡各司其職,相互檢驗制約 | https://mc.ai

當然,現實生活中能夠形成嚴格對應關係的物體並不多。為了確保精度,AI工程師會同時引入兩套生成網絡。比如我們要把一匹馬的照片變成斑馬,但很明顯,現實中你可以找到兩隻除了顏色外,一模一樣的鞋子,但不可能存在兩匹體型和五官特徵完全相似的馬與斑馬,所以就需要兩個生成網絡各司其職。生成網絡A完成從馬到斑馬的轉換,另一個生成網絡B負責從斑馬轉換到馬。這樣在優化過程中,雙方能夠互相檢驗與制約,這就是近年來應用場景不斷增多的深度學習算法CycleGAN。

有了CycleGAN算法,我們就像有了仙女棒,隨意變老變小變漂亮 | https://mc.ai

這套算法,就是隱藏在現在市場上大多數美圖軟體濾鏡後的幕後功臣,什麼「LOMO風格」,「甜美日系」,「黑白簡筆」,「美白磨皮」,都可以讓用戶輕鬆一鍵搞定,完成瞬間「變身」。

美圖秀秀的各種濾鏡,相信大家已經用得駕輕就熟 | www.show.meitu.com

Landmark Assisted CycleGAN生成的卡通形象,最左為真人形象,最右為最終輸出結果 | www.medium.com

不過,要把自己的視覺形象在抖音裡轉化為相似的二次元紙片人,還有最後一個門檻,因為次元壁並不是那麼好打破的,真實人臉和卡通人臉之間的結構差別太大,很難捕捉面部基本特徵。所以,專家們設計出了一個優秀的助手Landmark Assisted CycleGAN,來幫助AI,讓這個笨笨的小朋友能根據真實用戶人臉「畫」出相應的卡通形象。簡單來說,它的訓練機制就是,每當CycleGAN提供一張人臉圖像,它就先對臉部關鍵點進行標記,然後再根據這些標記點生成最初的卡通形象,並把這些標記輸入判別網絡。然後,啟動兩個CycleGAN中兩個圖像生成網絡,讓卡通形象和人臉形象之間不斷地相互進行識別,反映到屏幕上,就是你看到了一個和自己酷似,惟妙惟肖的二次元紙片人。

更重要的是,這些二次元形象,還必須跟隨著視頻中的真人形象「動起來」,這就涉及到巨量的運算。成千上萬的用戶同時使用濾鏡,就會形成海量的運算數據,如果單純依靠雲端計算,分析這些視頻數據,再想辦法為每個用戶量身定製,畫出二次元形象,那麼很可能造成卡頓,進而會影響用戶的體驗感。為了避免卡頓,這些經過訓練之後的面部識別模型,會隨著軟體更新,「下發」到每個用戶的手機上,把每個抖音用戶手機裡的CPU和GPU運算力也「動員」起來,進行實時的推理(inference)計算。根據抖音技術團隊透露,「變身漫畫」濾鏡啟用了字節跳動自研的推理引擎ByteNN,高效利用了移動端的計算能力,使AI算法快速落地到每一臺用戶的行動裝置。這就好比一個工廠自身生產能力不足,把一部分加工程序,連同加工設備,外包給千千萬萬個工廠外的家庭小作坊一樣。

日本Botsnew VR公司推出的一款以龍珠為主題的VR眼鏡,利用AI圖像識別推理機制,自己在遊戲中能夠變身龍珠風格的動漫角色,身邊的NPC角色能夠和自己同步行動,比如發出著名的龜派氣功波 |http://www.poppur.com

能夠自行根據模板進行創造的AI圖像生成技術,未來可能為我們開闢許多不可思議的電子互動娛樂場景與模式。想想看,戴上擁有這項功能的VR/AR設備隨手一揮,畫廊中莫奈的名畫變成了搖曳生姿的實景AR景觀,動動手指,屏幕上的電影或二次元動漫角色就打破次元壁來到你身邊——自己和兒時的偶像,「龍珠」中的小悟空並肩戰鬥,在VR場景中一起發出龜派氣功波,有多麼熱血!

一個如夢似幻,打破了次元壁的世界,你期待嗎?

作者:王司圖

原標題:《大熱的抖音「變身漫畫」濾鏡,背後用了什麼黑科技?》

閱讀原文

相關焦點

  • 抖音漫畫濾鏡怎麼弄 抖音漫畫濾鏡在哪裡怎麼操作
    抖音短視頻中目前很流行讓你自己的變成卡通的形象,大頭的特效,那麼抖音漫畫濾鏡怎麼弄?抖音漫畫濾鏡在哪裡玩?下面和小編一起去了解一下吧。  抖音漫畫濾鏡怎麼弄?  大家可以按照下面的使用步驟進行操作就可以玩轉了:  1.選擇一個信息打開之後,點擊左下角的表情臉蛋圖片,然後選擇視頻點擊左下角的花紋符號;  2.在彈出的界面中選擇小猴子,可以看到彈出來一系列漫畫大頭,大家就可以選擇一個自己喜歡的了;  3.同時添加上各種有色彩的濾鏡之後讓整個視頻看起來會更加有藝術感!
  • 抖音變身奧義變身教程 抖音漫畫臉變身技巧方法
    抖音變身奧義怎麼變?最近抖音推出了一款特效,叫變身奧義,只要在臉上畫一些符號,就可以變身漫畫人物,那麼怎麼才能變成自己喜歡的漫畫人物的造型呢?下面小編就為玩家帶來抖音變身奧義變身教程,一起來看看吧。最近抖音推出了一款特效,叫變身奧義,只要在臉上畫一些符號,就可以變身漫畫人物,那麼怎麼才能變成自己喜歡的漫畫人物的造型呢?下面小編就為玩家帶來抖音變身奧義變身教程,一起來看看吧。
  • 一鍵變身漫畫!抖音特效火上熱搜 背後技術揭秘
    在名為 #特效都整不大李榮浩的眼睛# 的話題下面,有一個李榮浩楊丞琳二人結婚照的換臉視頻,只見換臉後的李榮浩眼睛完全變成了一條線,孫紅雷也轉發微博「五十步笑百步」:這個特效太過分了,李先生,有人黑你!細心的人可能留意到了視頻裡的抖音 APP logo。沒錯!上面這個對小眼睛群體不怎麼友好的功能正是抖音新上線的「變身漫畫」特效。
  • 抖音漫畫濾鏡特效功能在哪裡弄 怎麼拍圖文教程分享
    抖音漫畫濾鏡怎麼弄?現在還是有很多的用戶不知道這個要怎麼拍攝,今天為大家整理了相關的製作教程,不過首先你得確定一下你得手機是蘋果X或者最新的蘋果手機,蘋果7或者8,以及更低型號的蘋果手機還有安卓手機都是沒有這個功能的,下面就一起來了解下吧。
  • 乾貨 | 抖音漫畫效果解密
    點擊上方「AI算法與圖像處理」,選擇加"星標"或「置頂」重磅乾貨,第一時間送達作者是CSDN
  • 抖音水冰月變身視頻怎麼拍 立足尖水冰月變身什麼梗
    ­  抖音上的視頻很容易引起大家的關注,像水冰月就是這樣子的不是嗎?水冰月是90後的童年的一部分,即使過了這麼多年還是受到了很多人的喜愛,並且經典臺詞代表月亮消滅你,現在還是被很多人用著。  最近,水冰月的變身視頻與經典招牌姿勢又火了,引起大家的紛紛模仿。  立足尖水冰月變身是什麼梗,其實說的就是《美少女戰士》水冰月變身的經典畫面。
  • 抖音拍視頻用什麼軟體 抖音拍視頻如何關閉美顏和濾鏡
    18183首頁 食物語 抖音拍視頻用什麼軟體 抖音拍視頻如何關閉美顏和濾鏡 抖音拍視頻用什麼軟體 抖音拍視頻如何關閉美顏和濾鏡 來源:18183
  • 抖音濾鏡有多強大?韓國人看完抖音美女後直言:換頭級美顏
    其中最具有代表性的就是抖音、快手等短視頻APP。抖音濾鏡有多強大?如果你抖音玩的很秀,變美可以只靠抖音!一、漫畫臉近期有一個視頻剪輯火了,內容是:韓國人看抖音特效。剛出場的是一個小哥哥,韓國女生以為他很難過,而後他就「變身了」。
  • 抖音變身奧義怎麼拍 奧義變身詳細拍攝步驟教程
    首頁 > 部落 > 關鍵詞 > 抖音最新資訊 > 正文 抖音變身奧義怎麼拍 奧義變身詳細拍攝步驟教程
  • 抖音「變身漫畫」,戚薇都玩上癮了
    ——「變身漫畫」,簡直火到不行。可以看到,這個特效基於人物的面容,很好的轉換成了二次元漫畫風格。尤其是眼睛的處理,把張藝興慵懶的眼神、戚薇水汪汪的大眼睛,詮釋的淋漓盡致。當然髮型也都是「滿分轉換」,分叉、造型等細節可以說是絲毫不差了。抖音網友們直呼:終於看到這個特效啦!早就想看偶像的漫畫風,圓夢了!
  • 別被抖音裡的帥哥美女們給騙了,美顏濾鏡一開,醜小鴨變成靚天鵝
    ,還能瘦臉瘦胳膊細腿的,真的是讓人大開眼界俗話說理想很豐滿,現實很骨感,也許朋友們在抖音上關注的帥哥靚女未必是真實的面貌,或許關閉美顏濾鏡後,你們會大驚一跳我靠,這些都是些什麼鬼一、美顏濾鏡前後女神們模樣正眼一看,在抖音上這些美女們不敢說有多漂亮
  • 插畫風格自拍照用什麼軟體app 美圖黑科技立等可見
    ­  打開「美圖秀秀」App,繪畫機器人幫你畫畫的「美圖黑科技」的入口直接映入眼帘。點擊進入會看到有「Garden」和「Dream」2 種風格、30 多種效果的插畫。­  自拍時,把人物對準劃定的區域內,一張具有插畫風格的自拍照立等可見。­  在「Garden」和「Dreanm」2 種風格下,分別設了 7 種不同的場景。
  • 玩抖音應該用什麼剪輯軟體? 好用的視頻軟體推薦
    玩抖音,視頻小白和短視頻達人之間,往往只存在一個剪輯軟體的差距~推薦幾款剪輯軟體給你,讓你的作品也能高大上起來。大家一起來看看吧。
  • 美圖秀秀推出「黑科技」濾鏡,美國人瞬間燃爆了
    趁著這股東風,美圖秀秀推出了一組號稱「黑科技照片」的手繪自拍和跨次元相機,讓你的照片1秒變成唯美的手繪風。小探的各種社交網絡一時間被各種古裝言情風格的照片佔領,於是已在P圖界歸隱多年的本探都忍不住再次出山小試牛刀。不過看著看著就覺得很眼熟,這不就是以前地攤上小言情書、到現在泛濫的「霸道總裁」系列最愛的封面圖嗎?怎麼就突然火遍大江南北了呢?
  • 「斬首」漫畫後續:被拉黑後,DRX反手給GEN·G加上黑白濾鏡?
    可憐chovy夾在粉絲中間被狂噴GENG輸了之後,BDD有點難過,說自己看了這個漫畫有點不舒服,但是俱樂部首席運營問BDD要不要回應這個漫畫的時候,BDD說「不用,我們只需要在下次擊敗他們就好了。」雖然BDD本人不想再回應這個漫畫,但是俱樂部官方還是很生氣的,官推去回復了首席運營的推特說:「希望以後看到的都是好東西。」還附上了拉黑DRX官推的截圖。
  • 輕顏相機和抖音是一家嗎 抖音拍照視頻都用它
    輕顏相機貌似就是專門為抖音服務的,是不是一家呢。
  • 抖音變身腳藝人bgm是什麼
    抖音變身腳藝人bgm是什麼?相信很多小夥伴最近經常可以刷到腳藝人的視頻,各大網紅爭前恐後的模仿,那麼小夥伴們知道腳藝人的背景音樂是什麼嗎?背景音樂也是這個魔性視頻重要的一部分,那麼接下來小編為大家帶來抖音變身腳藝人bgm是什麼,一起來看看吧。
  • 抖音視頻製作軟體app哪裡下載_視頻軟體哪款好用
    抖音視頻的百萬播放量背後,都用了哪些強大的視頻剪輯軟體?
  • 百事如何藉助抖音AR黑科技,打破年輕人的「次元壁」?
    在鈦媒體與巨量觀察室聯合推出的營銷方法論專題中,我們先後對惠氏、Make Up For Ever短視頻營銷策划進行深度梳理,在巨量觀察室的第五期,我們邀請到了百事亞太區CMO Lilly 葉莉女士,分享最懂年輕人的百事如何運用抖音的黑科技創新,以「技術+」營銷激發社交互動,用霸屏活動引發社交裂變,打入Z世代圈層。
  • 主播教程:近日很火的抖音變身奧義怎麼拍
    抖音變身奧義特效怎麼拍?最近很多都在拍這個變身奧義特效,你會了嗎?是不是還有很多小夥伴都不是很清楚呢?下面是小編帶來的抖音變身奧義特效拍攝方法分享。