18個生成對抗網絡(GAN)的絕妙應用!你確定不收藏一下?

2021-01-19 讀芯術

全文共6531字,預計學習時長13分鐘

圖片來源:pexels.com/@gravitylicious

生成對抗網絡(GAN)是生成模型的一種神經網絡架構。

生成模型指在現存樣本的基礎上,使用模型來生成新案例,比如,基於現存的照片集生成一組與其相似卻有細微差異的新照片。

GAN是使用兩個神經網絡模型訓練而成的一種生成模型。其中一個稱為「生成器」或「生成網絡」模型,可學習生成新的可用案例。另一個稱為「判別器」或「判別網絡」,可學習判別生成的案例與實際案例。

兩種模型(從博弈論的意義上來說)處於一種競爭狀態,生成器企圖愚弄判別器,而判別器則要同時處理生成案例和實際案例。

經學習,生成模型可生成所需的新案例。

生成對抗網絡具有極為具體的使用案例,一開始這些案例理解起來會有些困難。

本文將回顧大量GAN的有趣應用,有助於你了解其能夠解決的案例類型。以下列表或許並不完整,但其中包含了許多媒體介紹過的GAN使用案例。

應用案例可劃分為以下18種類型:

1. 生成圖像數據集案例

2014年,Ian Goodfellow等人發表論文《對抗式生成網絡》,提出了生成新案例這一應用。文中指出,GAN可為MNIST手寫數碼數據集、CIFAR-10小件圖片數據集、多倫多人像數據集生成新案例。

GAN可為圖像數據集生成新案例。圖片來自《生成對抗網絡》。

2015年,Alec Radford等人在一篇重要論文《使用深度迴旋生成對抗網絡進行無監督表示學習》,也表達了類似觀點。論文指出,深度迴旋生成對抗網絡展示了大規模培養穩定GAN的方法。論文展示了生成臥室新案例的模型。

GAN根據圖像數據集生成的臥室新案例。圖片來自《生成對抗網絡》。

同時,論文展示了GAN(在潛在空間中)運行向量運算的能力,只需輸入生成的臥室案例和人像案例即可。

GAN進行向量運算的案例。圖片來自《使用深度迴旋生成對抗網絡進行無監督表示學習》。

2. 生成人臉照片

Tero Karras等人在2017年發表的論文《GAN質量、穩定性及變化性的提高》展示了生成人臉照片的案例,照片十分逼真。因此,論文引起了媒體的廣泛關注。生成照片時以名人的臉作為輸入,導致生成的案例具有名人的臉部特徵,讓人感覺很熟悉,卻並不認識。

GAN生成人臉照片的案例。圖片來自《GAN質量、穩定性及變化性的提高》。

該方法同樣用於生成物品和場景案例。

GAN生成物品和場景的案例。圖片來自《GAN質量、穩定性及變化性的提高》。

2018年發表的報告《人工智慧的惡意使用:預測、預防及抑制》選用的也是以上案例,顯示了2014至2017年GAN的快速發展。

2014至2017年GAN的快速發展。圖片來自《人工智慧的惡意使用:預測、預防及抑制》。

3. 生成現實照片

Andrew Brock等人在2018年發表了題為《用於高保真自然圖像合成的GAN規模化訓練》的論文。論文展現了用BigGAN技術生成合成照片的案例。案例照片幾乎與真實照片無異。

用BigGAN技術生成合成照片的案例。圖片來自《用於高保真自然圖像合成的GAN規模化訓練》。

4. 生成動畫角色

金楊華(音譯)等人於2017年發表了題為《用GAN生成動畫角色》的論文。論文展示了如何訓練及應用GAN來生成動畫頭像(如日本動漫人物)。

GAN生成動畫人臉的案例。圖片來自《用GAN生成動畫人物》。

受動畫角色案例的啟發,一些人試圖利用GAN生成Pokemon這樣的角色,比如pokeGAN項目和使用深度迴旋GAN生成Pokemon項目。但目前成效甚微。

GAN生成口袋妖怪角色案例。圖片來自pokeGAN項目。

5. 圖像轉換

GAN在這方面幾乎無所不能,因為相關論文顯示GAN可以執行許多圖像轉換任務。

Phillip Isola等人於2016年發表題為《使用GAN技術進行圖像轉換》的論文。論文特別介紹了如何使用GAN的pix2pix技術進行圖像轉換。

以下是一些圖像轉換案例:

· 將語義圖像轉化成城市和建築景觀圖片

· 將衛星圖像轉化成谷歌地圖

· 將白天景觀轉化成夜晚景觀

· 將黑白圖片轉化成彩色圖片

· 將素描轉化成彩色圖片

使用pix2pix技術進行圖片日夜轉換的案例。圖片來自《使用GAN技術進行圖像轉換》。

使用pix2pix技術將素描轉化成彩色圖片。圖片來自《使用GAN技術進行圖片轉化》。

朱俊彥等人於2017年發表題為《使用一致循環生成網絡進行非配對圖像轉換》的論文。論文介紹了著名的CycleGAN技術以及大量圖片轉化的案例。

以下是一些圖像轉換案例:

· 將圖片轉化成藝術繪畫風格

· 將馬的圖片轉化成斑馬圖

· 將夏景轉化成冬景

· 將衛星圖轉化成谷歌地圖

使用CycleGAN技術進行圖片轉化的四個案例。圖片來自《使用一致循環生成網絡進行非配對圖片轉化》。

論文還介紹了其它案例,如:

· 將畫作轉化成圖片

· 將素描轉化成圖片

· 將蘋果圖轉化成橙子圖

· 將照片轉化成藝術畫作

使用CycleGAN技術將畫作轉化成照片的案例。圖片來自《使用一致循環生成網絡進行非配對圖片轉化》。

6. 文字-圖片轉化

Han Zhang等人於2016年發表題為《StackGAN:使用堆疊GAN技術進行文字-圖片轉化及合成》的論文。論文特別介紹了如何運用StackGAN將對於簡單物體(如花鳥)的文字描述轉化為現實圖片。

將鳥類文本描述轉化成現實圖片的案例。圖片來自《StackGAN:使用堆疊GAN技術進行文字轉圖片轉化及合成》。

Scott Reed等人於2016年發表了題為《使用GAN技術合成圖像》的論文。論文介紹了把對花、鳥等物體的文本描述轉化為圖像的案例。

將花鳥文本描述轉化成現實圖片的案例。圖片來自《使用GAN技術合成圖片》。

Ayushmen Dash等人於2017年發表了題為《TAC-GAN——受文本限制的輔助分類器GAN》的論文。文中介紹了幾近相同的數據集案例。

Scott Reed等人於2016年發表了題為《學習繪畫內容和地點》的論文。論文對GAN的此功能作了進一步介紹,並運用GAN完成文圖轉化,以及運用包圍盒和關鍵點推測描繪物體(如一隻鳥)的位置。

文圖轉化的案例及GAN提供的位置信息。圖片來自《學習繪畫內容和地點》。

7. 語義圖像-圖片轉化

Ting-Chun Wang等人於2017年發表了題為《使用條件性GAN進行高清圖片合成及語義操縱》的論文。文中介紹了使用條件性GAN根據語義圖像或素描生成現實圖片的方法。

語義圖像及GAN生成城市景觀照片的案例。圖片來自《使用條件性GAN合成高保真圖片及語義操縱》。

具體案例如下:

· 根據語義圖像合成城市景觀圖片

· 根據語義圖像合成臥室圖片

· 根據語義圖像合成人臉圖片

· 根據素描合成人臉圖片

論文同時介紹了一種可操縱所生成圖片的互動編輯器。

8. 生成正面人像圖片

Rui Huang等人於2017年發表了題為《人臉轉正:全球及地方GAN感知合成擬真正面人像圖片》的論文。文中介紹了使用GAN根據特定角度的人臉生成正面人像圖片(如臉朝前)的方法。此類技術可應用於人臉驗證或辨認系統。

使用GAN生成正面人像的案例。圖片來自《人臉轉正:使用全球及地方GAN感知合成擬真正面人像圖片》。

9. 生成新體態

Liqian Ma等人於2017年發表了題為《人體體態圖像生成》的論文。文中介紹了生成人體模型新體態的案例。

人體模型新體態的案例。圖片來自《人體體態圖像生成》。

10. 圖片轉表情

Yaniv Taigman等人於2016年發表了《無監督跨領域圖像生成》一文介紹了使用GAN跨領域轉化圖像的方法。比如,將街區數字轉化為MNIST手寫數碼,或將名人照片轉化為emoji或動畫表情。

將名人照片轉化為emoji表情的案例。圖片來自《無監督跨領域圖像生成》。

11. 圖片編輯

Guim Perarnau等人於2016年發表了題為《使用可逆條件性GAN編輯圖片》的論文。文中特別介紹了使用GAN的IcGAN技術根據特定的面部特徵如發色、髮型、表情甚至性別變化來重建人像圖片的方法,比如:

使用IcGAN技術編輯人臉圖片的案例。圖片來自《使用可逆條件性GAN編輯圖片》。

Ming-Yu Liu等人於2016年發表了題為《耦合性GAN》的論文。文中同樣介紹了如何利用發色、表情和眼鏡等特徵生成面部圖片。論文同時也展示了其他圖像的生成,如有顏色和深度變化的場景圖片。

使用GAN生成有或無金髮的人像圖片案例。圖片來自《耦合性GAN》。

Andrew Brock等人於2016年發表了題為《使用IAN進行神經圖片編輯》的論文。文中介紹了一種運用多種變化性自動編碼器及GAN的面部照片編輯器。此種編輯器可以快速對人臉特徵進行修改,包括修改發色、髮型、表情、體態,以及增補面部鬍鬚。

基於VAE和GAN使用神經圖片編輯器修改面部特徵的案例。圖片來自《使用IAN進行神經圖片編輯》。

He Zhang等人於2017年發表了題為《使用條件性GAN消除圖片中的雨》的論文。文中介紹了如何使用GAN編輯圖片,比如消除圖片中的雨雪。

使用GAN消除圖片中的雨的案例。圖片來自《使用條件性GAN消除圖片中的雨》。

12. 面部老化

Grigory Antipov等人於2017年發表了題為《使用條件性GAN進行面部老化處理》的論文。文中介紹了使用GAN生成不同年齡段人臉圖片的方法。

使用GAN生成不同年齡段的人臉圖片的案例。圖片來自《使用條件性GAN進行面部老化》。

Zhifei Zhang等人於2017年發表了題為《使用條件性對抗自動編碼器增齡/減齡》的論文。文中介紹了使用GAN對面部圖片進行減齡處理的方法。

使用GAN對面部圖片進行減齡處理的案例。圖片來自《使用條件性對抗自動編碼器增齡/減齡》。

13. 圖片混合

Huikai Wu等人於2017年發表了題為《GP-GAN:關於現實高保真照片的混合》的論文。文中展示了GAN在混合照片,尤其是混合田野、大山及其大型物體照片中的應用。

使用GAN混合圖片的案例。圖片來自《GP-GAN:關於現實高保真照片的混合》。

14. 超解析度

Christian Ledig等人於2016年發表了題為《使用GAN生成單幅高解析度圖像》的論文。文中特別展示了GAN的SRGAN模型在生成具有超高解析度圖像中的應用。

使用GAN生成超高解析度圖片的案例。圖片來自《使用GAN生成高解析度現實單圖》。

Huang Bin等人於2017年發表了題為《使用條件性GAN生成具有高質量、超高解析度的面部圖像》的論文。文中特別展示了GAN在構建不同版本人臉圖像中的應用。

生成高解析度人臉圖像的案例。圖片來自《使用條件性GAN生成高質量超高解析度面部圖像》。

Subeesh Vasu等人於2018年發表了題為《使用強化超高解析度感知網絡分析扭曲認知的折中參數》的論文。文中展示了一個使用GAN構建街景高解析度圖片的案例。

使用GAN生成高解析度建築圖片的案例。圖片來自於《使用強化超高解析度感知網絡分析扭曲認知的哲衷參數》。

15. 圖片修復

Deepak Pathak等人於2016年發表了題為《文本編碼器:通過圖片修復學習特徵》的論文。論文特別介紹了如何使用GAN的文本編碼器進行圖片修復或填充空缺,即填補圖片中某塊缺失的部分。

使用文本編碼器修復圖片的案例。圖片來自《文本編碼器:通過圖片修復學習特徵》。

Raymond A. Ye等人於2016年發表了題為《使用深度生成模型修復語義圖像》的論文。文中介紹了如何用GAN對故意損壞的人臉圖像進行填充和修復。

使用GAN修復人臉圖像的案例。圖片來自《使用深度生成模型修復語義圖像》。

Yijun Li等人於2017年發表了題為《人臉圖像生成性填充》的論文。文中同樣介紹了如何使用GAN對損壞的人臉圖像進行修復和重建。

使用GAN重建人臉圖像的案例。圖片來自《人臉圖像生成性填充》。

16. 服裝轉化

Donggeun Yoo等人於2016年發表了題為《像素級領域轉化》的論文。論文展示了如何根據身著服裝的模特照片,運用GAN生成類似服裝圖集或線上服裝店的服裝圖片。

輸入圖片及使用GAN生成服裝圖片的案例。圖片來自《像素級領域轉化》。

17. 視頻預測

Carl Vondrick等人於2016年發表了題為《生成場景動態視頻》的論文。文中介紹了如何使用GAN進行視頻預測,尤其是連續預測最長可至一秒的視頻幀,聚焦於場景中的靜態因素。

使用GAN生成視頻幀的案例。圖片來自《生成場景動態視頻》。

18. 3D列印

吳佳俊等人於2016年發表了題為《通過3D生成對抗模型學習物體形狀的可能潛在空間》的論文。論文展示了如何使用GAN生成物體的3D模型,比如桌椅、汽車和沙發。

使用GAN生成3D模型的案例。圖片來自《通過3D生成對抗模型學習物體形狀的可能潛在空間》。

Matheus Gadelha等人於2016年發表了題為《由2D物體視圖推導3D形狀》的論文。文中介紹了如何使用GAN根據多種視角的2D物體圖像生成3D模型。

由2D椅子視圖重建其3D模型的案例。圖片來自由《2D物體視圖推導3D形狀》。

留言 點讚 關注

我們一起分享AI學習與發展的乾貨

歡迎關注全平臺AI垂類自媒體 「讀芯術」

相關焦點

  • 生成式對抗網絡GAN的高級議題
    生成對抗網絡(GAN)就是一個幫你實現的新朋友。"GAN是過去10年機器學習中最有趣的想法。" - Facebook AI人工智慧研究總監Yann LeCun最近引入了生成對抗網作為訓練生成模型的新方法,即創建能夠生成數據的模型。它們由兩個"對抗"模式:生成模型G獲得數據和判別模型D來估計訓練數據提供的樣本的準確性。G和D可能是一個非線性映射函數,如多層感知。在生成對抗網絡(GAN)中,我們有兩個神經網絡在零和遊戲中相互對抗,其中第一個網絡,即生成器,其任務是欺騙第二個網絡,即鑑別器。
  • GAN(生成對抗網絡)萬字長文綜述
    GAN的基本介紹生成對抗網絡(GAN,Generative Adversarial Networks)作為一種優秀的生成式模型,引爆了許多圖像生成的有趣應用。GAN的基本概念GAN(Generative Adversarial Networks)從其名字可以看出,是一種生成式的,對抗網絡。再具體一點,就是通過對抗的方式,去學習數據分布的生成式模型。所謂的對抗,指的是生成網絡和判別網絡的互相對抗。
  • 萬字綜述之生成對抗網絡(GAN)
    文章目錄如下:GAN的基本介紹生成對抗網絡(GAN,Generative Adversarial Networks)作為一種優秀的生成式模型,引爆了許多圖像生成的有趣應用。GAN的基本概念GAN(Generative Adversarial Networks)從其名字可以看出,是一種生成式的,對抗網絡。再具體一點,就是通過對抗的方式,去學習數據分布的生成式模型。所謂的對抗,指的是生成網絡和判別網絡的互相對抗。
  • 不到200 行代碼,教你如何用 Keras 搭建生成對抗網絡(GAN)
    不斷重複這一過程,直到警察識別不出真假,那麼模型就訓練成功了。雖然 GAN 的核心思想看起來非常簡單,但要搭建一個真正可用的 GAN 網絡卻並不容易。因為畢竟在 GAN 中有兩個相互耦合的深度神經網絡,同時對這兩個網絡進行梯度的反向傳播,也就比一般場景困難兩倍。
  • 生成對抗網絡的最新研究進展
    ,生成對抗網絡是一類功能強大、應用廣泛的神經網絡。生成對抗網絡的工作原理給定一組目標樣本,生成器試圖生成一些能夠欺騙判別器、使判別器相信它們是真實的樣本。判別器試圖從假(生成)樣本中解析真實(目標)樣本。
  • 這些資源你肯定需要!超全的GAN PyTorch+Keras實現集合
    最近應用生成對抗網絡(generative adversarial networks/GAN)的無監督學習被證明是十分成功且有效的。LSGAN 比常規生成對抗網絡有兩個好處。首先 LSGAN 能夠比常規生成對抗網絡生成更加高質量的圖片。其次 LSGAN 在學習過程中更加地穩定。我們在五個事件數據集(scene datasets)和實驗結果上進行評估,結果證明由 LSGAN 生成的圖像看起來比由常規 GAN 生成的圖像更加真實一些。我們還對 LSGAN 和常規 GAN 進行了兩個比較實驗,其證明了 LSGAN 的穩定性。
  • 張東升,我知道是你!如何使用GAN做一個禿頭生產器
    看過這部劇後,我突然很想知道自己禿頭是什麼樣子,於是查了一下飛槳官網,果然它有圖片生成的模型庫。那麼,我們如何使用PaddlePaddle做出一個禿頭生成器呢。  生成對抗網絡介紹  說到圖像生成,就必須說到GAN,它是一種非監督學習的方式,通過讓兩個神經網絡相互博弈的方法進行學習,該方法由lan Goodfellow等人在2014年提出。生成對抗網絡由一個生成網絡和一個判別網絡組成,生成網絡從潛在的空間(latent space)中隨機採樣作為輸入,其輸出結果需要儘量模仿訓練集中的真實樣本。
  • 揭秘騰訊變臉魔法,生成對抗網絡GAN的威力是什麼?
    隨著GAN網絡在生成質量上的不斷提高,它越來越頻繁地落地到社交娛樂場景中,給用戶帶去最直觀、新鮮的AI體驗。左右互搏生成完美圖片,AI界的"網紅"技術那麼使得新型變臉特效得以實現的生成式對抗網絡 GAN,究竟是什麼?它是由美國科學家Ian Goodfellow發明,試圖讓計算機自己生成逼真圖片的AI技術。
  • 用Keras搭建GAN:圖像去模糊中的應用(附代碼)
    快速回憶生成對抗網絡GAN中兩個網絡的訓練相互競爭。生成器( generator) 合成具有說服力的假輸入來誤導判別器(discriminator ),而判別器則是來識別這個輸入是真的還是假的。這些只是對生成對抗網絡的一個簡單回顧,如果還是不夠明白的話,可以參考完整介紹。數據Ian Goodfellow首次使用GAN模型是生成MNIST數據。 而本篇文章是使用生成對抗網絡進行圖像去模糊。因此生成器的輸入不是噪聲,而是模糊圖像。
  • 乾貨| 直觀理解GAN背後的原理:以人臉圖像生成為例
    然後當一張圖片輸入時,辨別器會盡最大的努力試著辨別真的圖片和生成的圖片」生成器和辨別器會共同進步直到辨別器無法辨別真實的和生成的圖片。到了那時,生成式對抗網絡只能以 0.5 的概率猜一下哪張是真實的哪張是生成的,因為生成器生成的人臉圖片太真實了。
  • 機器不學習:生成對抗網絡-NIPS 2017對抗樣本攻防賽冠軍算法分享
    從上面可以看出,對抗樣本可以用來欺騙網絡,那麼我們如何生成這些對抗樣本來攻擊網絡呢?一種最簡單的攻擊方法叫做快速梯度法(見下圖),給定一張圖像,輸入給神經網絡,得到預測結果,然後用梯度下降法修改一下原圖使得預測結果變差。一個推廣的方法叫做迭代梯度法,就是對剛才的過程進行多次重複。
  • 程式設計師學習人工智慧,生成式對抗網絡(GAN)1,簡介與算法原理
    一、簡介生成式對抗網絡(GAN, Generative Adversarial Networks )是一種深度學習模型,是近年來複雜分布上無監督學習最具前景的方法之一。一個優秀的GAN應用需要有良好的訓練方法,否則可能由於神經網絡模型的自由性而導致輸出不理想。下面是使用GAN生成的可愛的人臉頭像。(圖片來源於:http://baijiahao.baidu.com/s?id=1568663805038898&wfr=spider&for=pc)可以看出生成的圖片相似度很高,很有趣。
  • 關於生成式對抗網絡(GAN) 還有這些開放性問題尚未解決
    從某些指標來看,在過去的兩年中,生成式對抗網絡(Generative Adversarial Networks,簡稱GAN)的研究已經取得了長足進展。對圖像合成模型進行的實際改進速度非常快,讓人有種跟不上技術進步步伐的感覺。然而,從其他指標來看,實際發生的情況可能並非如此樂觀。舉例來說,關於「應該如何評估GAN」仍然存在廣泛的分歧。
  • 一文看懂生成對抗網絡
    —Richard Feynman生成模型由一個參數數量比訓練數據少的多神經網絡構成,所以生成模型為了能夠產生和訓練數據相似的輸出就會迫使自己去發現數據中內在的本質內容。訓練Generative models的方法有幾種,在這裡我們主要闡述其中的Adversarial Training(對抗訓練)方法。
  • WGAN:Wasserstein 生成對抗網絡
    的損失函數無法指示訓練過程,缺乏一個有意義的指標和生成圖片的質量相關聯模式崩壞(mode collapse),生成的圖片雖然看起來像是真的,但是缺乏多樣性原理相對於傳統的GAN,WGAN只做了以下三點簡單的改動
  • Ian Goodfellow:GAN相比其他生成模型的優缺點及應用
    (GAN)的發明人 Ian Goodfellow 在 Quora上回答有關 GAN 的兩個問題,即:生成對抗網絡相比其他生成模型的優缺點是什麼?它能應用到其他事物的生成嗎?    圖1 生成對抗網絡的基本架構  近兩年來學術界相繼提出了條件生成對抗網絡(CGAN),信息生成對抗網絡(InfoGAN)以及深度卷積生成對抗網絡(DCGAN)等眾多GAN的變種,圖2來自去年一篇論文
  • GAN快速入門資料推薦:17種變體的Keras開原始碼,附相關論文
    夏乙 編譯整理量子位 出品 | 公眾號 QbitAI圖片來源:Kaggle blog從2014年誕生至今,生成對抗網絡(GAN)始終廣受關注,已經出現了200多種有名有姓的變體。在這類GAN變體中,生成器生成的每張圖像,都帶有一個類別標籤,鑑別器也會同時針對來源和類別標籤給出兩個概率分布。論文中描述的模型,可以生成符合1000個ImageNet類別的128×128圖像。
  • 使用Wasserstein GAN生成小狗圖像
    一.前期學習經過GAN(Generative Adversarial Nets)是生成對抗網絡的簡稱,由生成器和判別器組成,在訓練過程中通過生成器和判別器的相互對抗,來相互的促進、提高。最近一段時間對GAN進行了學習,並使用GAN做了一次實踐,在這裡做一篇筆記記錄一下。
  • 萬字長文解讀GAN:從基本概念、原理到實際應用
    GAN 的基本介紹生成對抗網絡(GAN,Generative Adversarial Networks)作為一種優秀的生成式模型,引爆了許多圖像生成的有趣應用。GAN 相比於其他生成式模型,有兩大特點:下面,我們圍繞上述兩點展開介紹。
  • 基於生成對抗網絡的三維點雲自動修復
    近年來,離散點雲 (PointCloud) 數據由於其數據獲取容易、能夠有效表示複雜三維形狀、無需維護拓撲連接關係等優點得到普遍重視和廣泛應用。為了在對點雲形狀修復補全中能保持形狀的精細結構信息,最近研究者提出了一種能夠自動修復補全三維點雲形狀的生成對抗網絡結構。