不會編程也能做這麼酷炫的視頻風格遷移?這個工具衝上Reddit熱榜...

2020-12-05 澎湃新聞

賈浩楠 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

這兩天,Reddit上一則關於視頻風格遷移的帖子火了,發布僅一天就衝上了機器學習社區的熱榜第一。

明豔、華麗的Demo引起了網友們驚嘆。

著名的恐怖片《閃靈》經過處理後,變得色彩明豔,有了漫畫風格:

而電影《低俗小說》,處理效果像極了天主教堂五彩繽紛的玻璃窗:

大家紛紛留言追問「是不是對CNN的層過濾器進行過修改」?

但樓主卻說「我不是程式設計師,也不清楚CNN是什麼東西…….」

這就有點不可思議了,一個沒接觸過機器學習的小白,是怎麼做到效果這麼好的視頻風格遷移呢?

「一鍵式」視頻風格遷移工具

Reedit熱帖的樓主,是一位純藝術從業者,沒學過計算機和編程。

但是他卻卻藉助一款「一鍵式」的傻瓜工具,輕鬆完成了視頻風格遷移。

這款工具名叫Deep Dream Generator。

熟悉圖像風格遷移的讀者可能對Deep Dream很熟悉,早在2015年穀歌就公布了這個軟體。

最早Deep Dream是為2014年ImageNet視覺識別挑戰賽而開發的,主要的目的也是識別圖像中的人臉和其他目標。

但是隨後有人發現,經過訓練的Deep Dream能夠反向運行,將給定圖片的像素特徵整合到目標中。

隨後,Deep Dream開始在藝術創作圈流行,由它生成的風格遷移圖像頗具夢幻色彩,所以被叫做「Deep Dream」。

而製作這個工具的團隊將Deep Dream做成了簡單易上手,不需要任何計算機知識,能夠直接在網頁使用的版本。

使用很簡單,只需要上傳目標圖像和「風格」,一鍵點擊,就能生成。

生成的圖片效果完全由上傳的「風格」決定:

有了這工具,就算是既不懂藝術,也不懂編程的小白,也能批量生產藝術作品。

視頻風格遷移的兩種方法

儘管Deep Dream Generator官網上並沒有給出任何技術說明,但Deep Dream早已開源,並且風格遷移已經是深度神經網絡應用中輕車熟路的一個領域了。

一般常見的風格遷移遷移算法由兩種基本思路,一是優化法,第二種是在它之上優化而來的前饋法。

優化法

在這種方法中,其實並沒有使用真正意義上的神經網絡。

任務中並沒有訓練神經網絡來做任何事情。只是利用反向傳播的優勢來最小化兩個定義的損失值。

反向傳播到的張量是希望實現的圖像,從這裡開始我們稱之為「復刻」。希望轉移其風格的藝術品,稱為風格圖像。而要將風格轉移到其中的圖片,稱為內容圖像。

「復刻」被初始化為隨機噪聲。然後與內容和風格圖像一起,通過一個預先訓練過的圖像分類網絡的幾個層。

算法使用各個中間層的輸出來計算兩種類型的損失:風格損失和內容損失。在風格上,「復刻」與風格圖像有多接近,在內容上就有有多接近。

△內容損失公式

然後通過直接改變「復刻」,將這些損失降到最低。

經過幾次迭代,「復刻」就能夠具備風格圖像的風格和內容圖像的內容。它是原始內容圖像的風格化版本。

前饋法

優化法的缺點是運算成本較高,處理時間也比較長。

那麼有沒有好的方法能夠直接利用深度神經網絡的特性,減輕開發者的負擔呢?

前饋法的本質,是創建一個未經訓練的圖像轉換網絡,它的功能是將內容圖像轉換為對「復刻」的最佳猜測。

然後將圖像轉換網絡的輸出結果作為「復刻,與內容和風格圖像一起通過預訓練圖像分類網絡來計算內容和樣式損失。

最後,為了減少損失,需要將損失函數反向傳播到圖像轉換網絡的參數中,而不是直接到「復刻結果中。

任意風格遷移

雖然前饋法可以立即生成風格化的結果,但它只能對一個給定的風格圖像進行復刻。

是否可以訓練一個網絡可以接受任何風格圖像,並從這兩張圖像中產生一個風格化的結果呢?

換句話說,能不能做出一個真正任意的風格轉移網絡?

幾年前,有研究人員發現,圖像轉換網絡中的實例歸一化層是唯一重要的代表風格的層。

如果保持所有卷積參數不變,只學習新的實例正則化參數,就可以實現在一個網絡中表示完全不同的風格。

來自康奈爾大學的一個團隊首次將這個想法變成現實。他們的解決方案是使用自適應實例歸一化(Adaptive Instance Normalization),使用編碼器-解碼器架構從風格圖像中生成Instance Norm參數,取得了相當好的效果。

當然,以上介紹的這三種方法都要求一定的編程計算機基礎,但如果你只是想試玩Deep Dream Generator,可以直接點擊下方傳送門:

https://deepdreamgenerator.com/generator

參考連結

https://arxiv.org/abs/1703.06868

— 完 —

本文系網易新聞•網易號特色內容激勵計劃籤約帳號【量子位】原創內容,未經帳號授權,禁止隨意轉載。

原標題:《不會編程也能做這麼酷炫的視頻風格遷移?這個工具衝上Reddit熱榜,還能在線試玩》

閱讀原文

相關焦點

  • 不會編程也能做酷炫視頻風格遷移?這個工具衝上Reddit熱榜
    賈浩楠 發自 凹非寺量子位 報導 | 公眾號 QbitAI這兩天,Reddit上一則關於視頻風格遷移的帖子火了,發布僅一天就衝上了機器學習社區的熱榜第一。明豔、華麗的Demo引起了網友們驚嘆。這就有點不可思議了,一個沒接觸過機器學習的小白,是怎麼做到效果這麼好的視頻風格遷移呢?「一鍵式」視頻風格遷移工具Reedit熱帖的樓主,是一位純藝術從業者,沒學過計算機和編程。但是他卻卻藉助一款「一鍵式」的傻瓜工具,輕鬆完成了視頻風格遷移。
  • 神經風格遷移算法:讓人人能變成梵谷
    神經風格遷移應用,不僅僅是畫作如果你認為神經風格遷移只是一個升級版的photoshop濾鏡,那就大錯特錯了,很多案例表明,這一技術正在被應用于越來越多的領域之上。比如Flipboard軟體工程師曾經發布過一個將神經風格遷移應用在漢字字體上的項目。
  • 電影《一點就到家》助力脫貧攻堅 雲南咖啡衝上熱搜榜
    由省委宣傳部參與聯合攝製的電影《一點就到家》,自10月4日在全國上映以來屢次衝上熱搜,並帶動雲南咖啡衝上熱搜榜。  影片取景普洱市瀾滄拉祜族自治縣,以咖啡為主題,講述了3個性格迥異的青年因不同緣由從大城市回到雲南古寨開啟創業旅程,最終闖出一片天地的故事。  電影的熱映帶動雲南咖啡衝上熱搜榜。
  • 這個單位將它頂上「熱搜」榜
    尊重、關愛退役軍人是全社會的共同責任……」相關話題一度衝上支隊學習的「熱搜」榜,下面看一看官兵們如何將《退役軍人保障法》學習「熱」起來!「《退役軍人保障法》共十章八十五條,突出強調國家和社會尊重、優待退役軍人,明確退役軍人工作基本制度和方針原則,規範移交接收、退役安置、教育培訓、就業創業、撫恤優待、褒揚激勵等方面的制度……」原文學習就是幫助官兵系統掌握新規定、新要求,引導官兵做學法、知法、用法的明白人。
  • 換臉新潮流:風靡全球的人臉風格遷移技術引
    基於GAN的方法生成的換臉圖片相比3D方法更加真實自然,但是很難產生高清的換臉效果,另外源圖片姿態比較大時很難兼顧姿態的一致性和換臉的ID遷移能力。BIGO的算法團隊經過探索,提出了基於風格遷移+ID注入的FaceMagic方案,在生成高清自然人臉的同時能夠保持人臉姿態、屬性一致。目前FaceMagic已在線上運營,每日用戶使用量過百萬級。
  • OpenCV DNN 模塊-風格遷移
    他們提供了十種風格遷移的模型,模型的下載腳本在:https://github.com/jcjohnson/fast-neural-style/blob/master/models/download_style_transfer_models.sh。
  • 這個神操作衝上熱搜!和臉有關...
    這個神操作衝上熱搜!和臉有關...... 近日話題 #用臉就可測風速#上了微博熱搜
  • 堪比python,強於Excel的可視化,我拿這個工具做出來了
    經常會有人問我這麼一個問題:X哥,你說這次疫情過後,哪個行業會得到最大的發展?或者說哪個行業有機會突飛猛進?這個問題,我已經無數次在頭條、朋友圈和微博上評論過了,那就是大數據和數據可視化行業。其實這也不算是兩個行業,要是嚴格點來說,數據可視化是大數據的分支,也就是一種展現方式罷了。
  • 《陰陽師》緣結神版本逢魔活動強勢衝榜陣容怎麼玩 衝榜陣容推薦
    導 讀 陰陽師進入到了緣結神版本後開始進入到了大洗牌的階段,這個時候許多玩家想起了逢魔活動的衝榜了,下面九遊電子競技網就為玩家們帶來了陰陽師緣結神版本逢魔活動強勢衝榜陣容推薦
  • 酷炫有趣的測量工具
    直尺、捲尺、溫度計、秒表、電子秤等都是我們平時熟悉的測量工具。如今,隨著科技的不斷發展,測量工具也變得越來越酷炫了。智能滾動尺尺子是我們日常生活中最常見的計量器具之一。用戶只要單手捏著它,用它的側面接觸被測物體表面,然後向前滾動(速度不超過1米/秒),它就能自動記錄下滾過的長度,並將數值實時顯示在LED屏幕上。無論物體有多長,都能用ROLLOVA進行測量。而且,ROLLOVA同時適用於平面和曲面測量,它幾乎可以對任何外形複雜的物體進行精確測量,甚至可以測量腰圍、肩寬等,測量結果可精確至0.1釐米。
  • 《平行時空遇見你》楊超越侯明昊吻戲花絮衝上熱搜
    近期,騰訊視頻出品了一檔「高甜追劇式綜藝」《平行時空遇見你》,節目將真人秀與偶像劇雙線結合,創新開啟了「劇式追綜」的新模式,並邀請李一桐、秦嵐、楊超越、侯明昊、劉以豪、王彥霖擔任常駐嘉賓。《平行時空遇見你》六位藝人兩兩組隊,自主創作偶像劇劇本並進行演繹,為觀眾帶來三段在平行時空相遇的愛情故事。
  • B站上值得推薦的8個自學編程視頻
    嗶哩嗶哩,是國內最大的二次元視頻網站之一,就算你沒看過肯定也聽說過。B站裡不只有動漫、鬼畜,它也包含了各個方面的學習教程,有一群無私的up主為我們傳授各行業的專業知識。它是一個寶藏網站,裡面的教程質量都是極高的喔~我相信很多人都已經知道B站上的資源了,如果你還不知道的話就看看我的今日推薦吧!
  • 秒懂機器人編程與計算機編程的區別
    計算機編程:學的是編程的概念,注重計算機的思維,比如算法,函數,循環。它的理論性強,通常強調要以最有效的方式去解決問題,而且是在多場景通用的解決方法。編程對數學的要求更高,孩子學習編程就要學會對所見信息進行組織、分析,即培養邏輯思維,找到事物的相互關聯。
  • 《陰陽師》荒骷髏高分衝榜陣容怎麼樣 荒骷髏高分衝榜陣容介紹
    導 讀 陰陽師這個遊戲中,最近推出了很法,荒骷髏是最近推出一個比較厲害的boss,很家都在挑戰荒骷髏,但是不少玩家打不過這個
  • 神經風格遷移指南(第一部分)
    - 第一部分神經風格遷移學說在本系列中,我們會從神經風格的基礎開始,你將從中學到一種自下而上(從基礎開始)的方法。要回答這個問題,我們需要先退後一步,思考下別的問題,卷積神經網絡學習到的到底是什麼?這些卷積層以特徵圖或者卷積核形式進行編碼的到底是什麼?我們輸入一張圖片的時候,卷積網絡學習到了什麼表徵?讓我們先來搞清楚這些問題。卷積神經網絡最初被設計用來進行圖片分類工作,最近它也被應用到了其他諸如圖片分割,圖像風格遷移及其他有關計算機視覺方面的任務上,當然也有被用於自然語言處理的例子。
  • 矽谷裡的外星人:縱觀Reddit十年風雨路(上)
    獵雲網編輯君為您獨家編譯了這份將近2萬字的深度調查文章,希望能給創業者和創業道路上的迷茫者提供一些啟示。任何事情都能是問題,但用戶量永遠不是問題。史蒂夫和亞歷克西斯創建了許許多多假帳戶在Reddit上傳了各種連結,這樣遊客就不會看到一個過期頁面。
  • 四大頂級Java編程工具橫向對比
    許多開發人員在選擇新的編程工具時總會犯難,為了解開你心中的疑團,本文就對流行的Java開發工具做一次全面的橫向對比,看完本文說不定就不再犯難了。好吧,首先請各位選手登臺亮相吧,它們分別是:Eclipse,JetBrains IntelliJ IDEA,Netbeans和Oracle JDeveloper。
  • |python|電氣和電子工程師協會|編程...
    這也讓大家開始疑惑,為什麼李笑來突然轉戰Python項目,還受到大眾的熱捧?而潘石屹也在眾多程式語言裡,選中了 Python,這裡面是否暗藏著哪些秘密?「 我用這個小工具,30秒抓取到上千個資料 」為了解決這個疑問,我特意上知乎了解了一下,發現Python這門語言用處果真不簡單。有一位新媒體大佬,用Python做一個爬蟲工具拿到第一手資料。
  • 羊駝朝朱一龍吐口水上熱搜了?是怎麼回事?
    #羊駝朝朱一龍吐口水# 剛剛登上熱搜榜啦,排名第45。#羊駝朝朱一龍吐口水# 朱一龍和羊駝玩兒,沒想到有一隻脾氣不好的羊駝直接朝他吐口水了哈哈哈哈哈,怎麼那麼好笑 會火的微博視頻 #羊駝朝朱一龍吐口水#哈哈哈哈卑微小朱被羊駝欺負,哈哈哈太憨了!這隻羊駝脾氣很大實錘!
  • 【NLP】NLP文本風格遷移,秒變金庸風
    NewBeeNLP公眾號原創出品  公眾號專欄作者@山竹小果風格遷移是自然語言生成領域一個非常火的主題,對於文本風格遷移,先舉個例子:Input:謝謝Output(金庸):多謝之至Input:再見Output(金庸):別過!