GAN進階版:一鍵實現圖像視頻卡通化

2020-12-13 騰訊網

相信大家對將照片卡通化的圖像處理功能都不陌生,通過軟體後臺對所選照片進行一定處理,將原圖變成了一張具有卡通風的圖片。市面上已有不少具備卡通化功能的軟體以及app,很多都可以「一鍵」輕鬆生成用戶想要的效果,方便處理使用。

目前該技術又迎來了新一輪的進步,只需一鍵上傳你拍攝的圖像或視頻,就可以在很短時間內將它卡通化。其核心技術來自CVPR 2020的投稿論文,其中提出了用白盒卡通表徵實現圖像卡通化。這項工作利用生成對抗網絡(GAN)框架來學習提取的表示並將圖像卡通化,已在GitHub獲得1400個Stars。作者稱,他們還計劃很快將開源所有代碼。下一步,他們的目標是通過將模型移植來適應實時視頻推理。

圖像卡通化挑戰重重

卡通相信大家都不陌生,從小時候的動畫片開始發展至今,已經成了一種流行的藝術形式,且廣泛應用於各種場景。現代卡通動畫工作流程允許藝術家使用各種資源來創作內容。通過將真實世界的圖片轉換為可用的卡通場景素材,創造了一些著名的漫畫,該過程被稱為圖像卡通化。

但是圖像卡通化聽起來簡單,實現起來可不容易。各種卡通風格需要基於特定任務或者先驗知識才能開發可用的算法。例如,某些卡通工作流程更加關注全局調色板主題,但是線條的清晰度卻是次要問題。而在其他一些工作流程中,稀疏和乾淨的色塊在藝術表達中起著主導作用,但是主題卻相對較少強調。

這些變量因素給黑盒模型帶來了不小的挑戰。例如,當面對不同用例中藝術家的不同需求時,僅靠更改訓練數據集是無濟於事的。因此有了用於圖像卡通化的CartoonGAN網絡,其中提出了一種具有新穎邊緣損失的GAN框架,並在某些情況下取得了良好的效果。但是,使用黑盒模型直接擬合訓練數據會降低其通用性和風格化質量,在某些情況下會導致較差的效果。

Joey doesn't share food 視頻卡通化效果

進階版GAN優化卡通質量

在該論文中,作者提出了一種基於GAN的白盒可控的圖像卡通化框架,該框架可以從真實圖像中生成高質量的卡通化圖像。輸入圖像被分解為三個卡通表徵:輪廓表徵,結構表徵和紋理表徵。然後使用相應的圖像處理模塊來提取用於網絡訓練的三個表徵,並且通過調整損失函數中每個表徵的權重來控制輸出風格。最後通過廣泛的定量和定性實驗驗證了文中方法的性能。同時消融實驗也證明了每個特徵表示的作用。

作者通過對人們繪畫的行為和不同風格的卡通形象進行了大量的觀察,並諮詢了少數幾位卡通藝術家,將圖像分解為幾種卡通表徵方式,並將它們列出如下:

第一步:提取一個帶權重的低頻內容表示圖片的輪廓特徵(surface representation)。這個低頻內容保留了邊緣/紋理等細節。這與藝術家畫卡通時通常先描繪形狀類似。

第二步:針對輸入圖像,提取一個分割圖,並且在每個分割區域上使用一個自適應的色彩算法來生成結構表徵(structure representation)。這是模仿畫卡通畫時,邊界清晰且色塊稀疏的膠片(celluloid)風格。

第三步:紋理表徵(texture representation)是用來保持繪畫細節和邊緣的。將輸入圖像轉換為僅保留相對像素強度的圖像,然後引導網絡獨立地學習高頻紋理細節。這與藝術家素描與上色是獨立的兩個過程類似。

結果表明,該方法可以生成色彩和諧,令人愉悅的藝術風格,清晰銳利的邊緣以及明顯更少的偽影。

目前該方法在圖像視頻卡通化中的應用已經在Cartoonize軟體上投入使用,以後極有機會推廣至更多平臺,這無疑是卡通愛好者的福音。AI通過不斷的加強從而為人類帶來新的體驗已經不是新鮮事了,期待它為我們帶來的一個新的動畫世界。

部分素材來源:網絡

相關焦點

  • 17種GAN變體的Keras實現請收好 | GitHub熱門開原始碼
    (CNN),能根據周圍像素來生成圖像上任意區域的內容。master/cogan/cogan.pyPaper:Coupled Generative Adversarial NetworksMing-Yu Liu, Oncel Tuzelhttps://arxiv.org/abs/1606.07536CycleGAN這個模型是加州大學伯克利分校的一項研究成果,可以在沒有成對訓練數據的情況下,實現圖像風格的轉換
  • 一鍵「脫」衣應用DeepNude迅速下線,來看看它涉及的圖像修復技術
    大數據文摘出品來源:Github發布者:yuanxiaosc上周,又一AI偏門應用DeepNude爆出,一鍵直接「脫掉」女性的衣服,火爆全球。應用也很容易上手,只需要給它一張照片,即可藉助神經網絡技術,自動「脫掉」衣服。原理雖然理解門檻高,但是應用起來卻毫不費力,因為對於使用者來說,無需任何技術知識,一鍵即可獲取。
  • GitHub 熱榜:人像卡通化!
    項目地址:https://github.com/minivision-ai/photo2cartoon人像卡通風格渲染的目標是,在保持原圖像 ID 信息和紋理細節的同時,將真實照片轉換為卡通風格的非真實感圖像。卡通圖像往往有清晰的邊緣,平滑的色塊和經過簡化的紋理,與其他藝術風格有很大區別。
  • 你也可以擁有「宋慧喬妝」,美圖MakeupGan妝容遷移算法開啟個性化妝容時代
    目前,美圖旗下美顏相機 APP 已上線基於 MakeupGan 妝容遷移算法的功能——「一鍵仿妝」,用戶可上傳自己的照片,選擇心儀的模特妝容進行仿妝操作。美圖「一鍵仿妝」現共有 60 個模特妝容可供選擇,妝容風格各有不同,如又純又欲的果凍妝、復古少女、奶油桃花妝等等。此外,更多妝容還在持續更新中。
  • 想一鍵實現可鹽可甜的漫畫特效?別著急,百度AI來安排!
    這麼說吧,微博超話#尋找最美漫畫臉#被大家閱讀了1.8億次,還有8萬條海量評論一同蓋樓,使用二次元特效拍攝製作的短視頻累計播放量2487萬,甚至上了熱搜。實際上這些可鹽可甜的二次元自拍並非來自真人畫手,而是在人工智慧技術的幫助下一鍵生成的。點開特效,手機中的自己就從3D變成2D,不僅保留了五官、臉型等個性特徵,而且還可以跟隨動作、表情的改變實時變化,輕鬆變身漫畫世界的主人公。
  • 谷歌程式設計師自製禿頭生成器,一鍵get張東升同款髮型
    不掏一分錢,也不用出門,在家編程就能實現自己禿頂的夢想。這可不就是程式設計師們常說的「代碼改變世界」?教程地址;https://medium.com/swlh/hairstyle-transfer-semantic-editing-gan-latent-code-b3a6ccf91e82這裡借用了湯曉鷗、周博磊等人在論文《Interpreting the Latent Space of GANs for Semantic Face Editing
  • 繼AI換臉之後,「一鍵去馬賽克」軟體出現,還原視頻「本來面目」
    繼AI換臉之後,「一鍵去馬賽克」軟體出現,還原視頻「本來面目」自從網際網路進入我們的日常生活,關於網絡隱私的討論就沒有中斷過。儘管網際網路給我們帶來了許多便利,但許多應用程式在我們不知情的情況下收集了我們的一些信息。
  • ​美圖秀秀推「魔法照片」功能 可將靜態照片一鍵轉動態視頻
    6月12日消息,近日,美圖秀秀推出了基於AI技術的全新功能—「魔法照片」,包括頭髮流動、鮮花環繞、花瓣變身、濾色疊加、空間位移、火焰星雲等10多種魔法效果,用戶可以將靜態照片一鍵轉動態視頻。  美圖方面稱,「魔法照片」的靈感來源於哈利波特的魔法世界,在神奇的魔法加持下,一張靜態報紙中的人物竟然動了起來,現在這種神奇的效果使用美圖秀秀也能實現。
  • 卡通化的海報設計!
    文/羅勝京 卡通化海報的創作主題也不限於卡通、漫畫故事等方面,在有關建築設計、廣告設計、陶瓷藝術設計、環境藝術設計和服裝設計的海報中都可見到卡通的身影,突破了卡通化創作主題的局限,以新的方式闡釋了繽紛各異的設計主題。
  • 大疆發布御2行業進階版無人機 支持紅外熱成像可外接RTK模塊
    昨晚,大疆正式發布了一款全新的無人機,雖然此前有不少消息顯示這款新發布的無人機可能會是大疆的穿越機,不過這次發布的御2行業進階版並不是消費級無人機。儘管是行業應用方面的無人機,但它也有不少亮點值得一提,首先這款無人機搭載了1/2英寸的圖像傳感器,可拍攝4800萬像素靜態圖像,支持4倍無損變焦以及32倍數碼變焦,還支持10km的高清圖傳。
  • 盤點自媒體視頻工具PR日常中使用最多的插件,一鍵實現無縫轉場
    鑑於目前做Vlog的小夥伴比較的多呢,同時有需要學習使用視頻剪輯軟體,每天拍視頻拍的已經是天昏地暗了,在搞一個軟體,確實也是身心疲憊。那怎麼解決呢,當然是用更快速的/更高效的插件來解決了,一鍵轉場/自動降噪/視頻調色/字母輔助等等。怎麼樣,想一想是不是很激動!
  • 美圖影像實驗室推出MakeupGan妝容遷移算法,開啟個性化妝容時代
    對於這兩個問題,近些年的一些研究者提出了一些解決方案,具體可以總結如下:對於問題1,主要採用的解決辦法是:設計一種映射和反映射機制(也可以設計網絡結構來實現這樣的映射),將原圖像特徵映射為identity feature和makeup feature,這樣原圖的identity feature可以和目標圖的makeup feature進行組合,將組合特徵反映射為圖像特徵就可以顯式地讓網絡更好地感知妝容信息
  • 一鍵輕鬆實現視頻調色&校色!
    調色是一部優秀視頻作品不可或缺的環節,甚至很多時候它能直接影響作品的優秀與否
  • 36000元 大疆發布「御」2 行業進階版:搭載頂配熱成像相機
    12月16日消息,昨日,大疆官方正式發布全新行業級無人機—「御」2 行業進階版,該機配備了大疆頂配紅外熱成像傳感器和高清可見光傳感器,官方稱其為行業級無人機「小鋼炮」。  機身方面,「御」2 行業進階版沿用了「御」2 行業版系列便攜摺疊機身,可在1分鐘內完成部署起飛,且垂直爬升、降落速度更快。
  • 【一鍵修圖】後期強超級蒙版大師
    其實,Photoshop的最高境界就是實現無痕的調整,做完的作品看不到製作痕跡。美顏大師下載地址:http://www.houqiqiang.cn/down/show/1071/0/0.html該插件可以實現一鍵智能磨皮,智能增加皮膚質感,智能調整皮膚顏色,智能打造光線立體感,一鍵批量處理數百幅人像照片。美顏大師能助你在瞬間成為商業級別的人像修圖大神。
  • 朱俊彥團隊提出GAN壓縮算法:計算量減少20倍,GPU、CPU統統能加速
    預測可能的原因之一是,現有的生成器採用的圖像識別模型,可能不是圖像合成任務的最佳選擇。下面,作者展示了如何從現有的cGAN生成器中獲得更好的架構設計空間,並在該空間內執行神經架構搜索(NAS)。而且不僅能在GPU上加速,在各種各種各樣的CPU上也可以實現加速,而且加速效果在CPU上更明顯。代碼開源現在,這一GAN壓縮框架已經開源,數據集和預訓練模型均可下載。
  • 一鍵操作可使人像轉卡通、GIF表情包
    項目地址:https://github.com/minivision-ai/photo2cartoon人像卡通風格渲染的目標是,在保持原圖像 ID 信息和紋理細節的同時,將真實照片轉換為卡通風格的非真實感圖像。卡通圖像往往有清晰的邊緣,平滑的色塊和經過簡化的紋理,與其他藝術風格有很大區別。
  • 貴陽110微信一鍵式視頻報警上線
    新華社貴陽11月14日電(記者汪磊)為順應人民群眾對視頻報警渠道、警民實時互動的需要,貴陽市公安局指揮中心110報警服務臺微信一鍵式互動視頻報警程序14日正式上線。  據了解,貴陽110微信一鍵報警程序上線後,群眾打開微信關注「貴陽110」公眾號,便可通過相關功能實現視頻報警,而平臺能夠定位群眾報警地址,實現派警、出警、處置的全流程跟蹤。  貴陽市公安局指揮中心110報警服務臺主任徐燕說,通過微信視頻報警,群眾可與警察通過實時視頻對犯罪嫌疑人進行震懾和勸阻,還可為接警民警提供現場證據,達到中止違法犯罪、保護報警人的目的。
  • GAN初創者另有其人?IanGoodfellow:只是純策略版本
    2010 年 OlliNiemitalo 提出的思想Olli Niemitalo目前居住在芬蘭赫爾辛基,主要研究信號/圖像/視頻處理,他在Signal Processing Stack Exchange問答網站上回答了大量問題。
  • 有什麼軟體能將照片和視頻變成動漫風?武漢開發的動漫GAN可以實現
    由武漢大學和湖北工業學院組成的中國研究團隊開發的「 AnimanGAN:一種用於照片動畫的新型輕量級GAN 」是一項將現實世界中拍攝的圖片高速轉換為類似動漫圖像的技術。通過使用深度學習的輕量級框架,您可以創建看起來像動漫的高質量圖像,例如宮崎駿和新海誠的圖像。