「未卜先知」、「自學成才」:GANs奇思妙想TOP10榜單

2020-12-06 大數據文摘

大數據文摘作品,轉載要求見文末

作者 | Sumeet Agrawal

編譯 | 糖竹子、阮雪妮、Saint、錢天培

還記得《射鵰英雄傳》中老頑童發明的「左右互搏術」嗎?

表面上看,左手與右手互為敵手,鬥得不可開交。實際上,老頑童卻憑藉此練就了一門絕世武功。

這樣的故事似乎只能發生在小說中。然而,近年來興起的一項機器學習算法卻將「左右互搏術」變為了現實。

這項神奇的算法正是生成對抗網絡(GANs)。

生成對抗網絡由蒙特婁大學的IanGoodfellow最先提出,目前是「教」電腦完成人類工作最有效的方法之一。它的核心想法正是令內部功能相互競爭,達到提升它們各自功能的效果。

生成對抗網絡由兩個相互競爭的神經網絡模型組成,就好比周伯通的左右手。一個神經網絡(生成器)不斷學習怎樣生成新的樣本以欺騙判別器,另一個網絡(判別器)則不斷學習怎樣區別生成樣本數據和真實數據。在百萬輪「較量」後,生成器就可以輸出與真實數據幾乎無差別的樣本。

生成對抗網絡別出心裁的思想讓它在學界揚名立萬。在業界,生成對抗網絡也帶來了無數強大、有趣的應用。

今天,大數據文摘就將帶你走近生成對抗網絡在產業界的十大神奇應用。

對抗生成網絡(概念模型)

NO. 10 照貓畫虎:自動生成遊戲用戶界面

排在榜單第十位的GANs應用是,遊戲用戶界面自動生成。

這一應用背後的腦洞如下:如果我們能夠生成逼真的遊戲配圖,那麼我們就可以把這些配圖中的部分截取拼接在一起,從而設計出一個全新的遊戲界面。

作為輸入的遊戲背景圖像

在生成式對抗網絡(GAN)訓練過程中生成的背景圖像

可以用於製作全新遊戲的獨特背景。

為實現這一目標,該程序會搜集大量現有遊戲的圖像,然後生成由這些圖像片段所構成的獨一無二的新圖像。這些圖像之後便可以被用作新遊戲的背景了。

來源&更多信息:

Blog:https://medium.com/@ageitgey/abusing-generative-adversarial-networks-to-make-8-bit-pixel-art-e45d9b96cee7

No. 9 千面神君:用GANs生成以假亂真的人臉

接下來,我們要為你介紹一款能夠偽造人臉圖像的AI——Neural Face。Neural Face使用了Facebook 人工智慧研究團隊開發的深度卷積神經網絡(DCGAN)。

研發團隊用由100個0到1的實數組成的1個向量Z來代表每一張圖像。

通過計算出人類圖像的分布,生成器就可以用高斯分布(Gaussian Distribution)根據向量Z來生成圖像。在此過程中,生成器學習生成新的人臉圖像來欺騙判別器,同時判別器也能更好地區分加工生成的人臉圖像和真實的人臉圖像。

來源&更多信息:

GitHub:https://github.com/carpedm20/DCGAN-tensorflow

Page:http://carpedm20.github.io/faces/

No. 8 破涕為笑:改變照片中的面部表情和特徵

在這一應用中,你只需要提供一些樣本圖像,研究人員就能生成表情各異的人臉圖像。比如,你可以讓一個面無表情的人露出笑容。

讓面無表情的人露出笑容,給不戴眼鏡的人加副眼鏡。

實現這一應用的基本思想方法是:將圖像的每一列用向量X來表示,計算每一個X的平均值,從而得到一個Y向量。

然後,對向量Y進行一些加法和減法運算,生成一個單一的圖像向量Z(如:戴眼鏡的男性-不帶眼鏡的男性+不帶眼鏡的女性)。最後,把這個圖像向量Z輸入生成器中。

將一張頭像靠左的人臉圖像變為靠右的圖像

實際上,我們還可以用該模型實現包括旋轉、放縮、位置變換在內的多種操作。以位置變換為例,我們可以將一張頭像靠左的人臉圖像轉變為靠右的圖像。

為此,我們可以先把向頭像靠左和靠右的人臉圖像作為樣本,對它們取平均值,得到一個「翻轉圖像」向量。然後,沿著坐標軸對圖像向量進行插值(https://zh.wikipedia.org/wiki/%E6%8F%92%E5%80%BC),我們就可以將這種「轉變」應用到新的人臉圖像上了。

來源&更多信息:

GitHub:https://github.com/Newmu/dcgan_code

Paper:https://arxiv.org/pdf/1511.06434.pdf

Blog:

https://hackernoon.com/how-do-gans-intuitively-work-2dda07f247a1

NO. 7 腦洞大開: 用GANs創造出迷幻圖像

接下來,我們將為你介紹Google Brain研發的Google Deep Dream。這一應用基於 GoogleNet對物體本質的「認知」可視化。

通過此方法,GANs能夠學會生成一些「迷幻」的圖片。這些如夢似幻的圖像是圖片分類器故意過度處理圖像的結果。

Deep Dream 用普通圖像生成迷幻圖片

Deep Dream在圖像中「找」到了塔、建築、鳥和昆蟲

當你向Google Deep Dream輸送一張圖像後,該應用就會開始在圖像中尋找各類曾被訓練識別的物體。神經網絡會將一些毫不相關的物體聯繫起來,這就好比人們把雲想像成小狗、小鳥。然後,Google Deep Dream 會對其聯想出的物體作增強處理。

舉個例子,當神經網絡第一次作出圖像識別時,它會認為這張圖有40%的可能是一隻小狗,而經過一輪處理後,神經網絡就會認為可能性增加到了60%。這個過程會不斷重複,直到輸入圖片已被修改得非常像一條狗了。

就這樣,它一步步地把原圖像調整成另外一張圖像。換句話說,創造出了「四不像」的圖片。

來源&更多信息:

GitHub:https://github.com/google/deepdream,

Blog:

https://research.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html

NO.6 狸貓換太子:改變圖像/視頻內容

通過圖片生成另一張圖片是生成網絡的另一項有趣應用。憑藉此技術,我們可以將一段視頻中的動物換成另一種動物,或者將圖片裡的季節換成另一季節。

該應用的核心在於,使用一組訓練圖像對來學習映射輸入和輸出圖像。然而,在許多情況下,配對訓練圖像並不容易獲得。為了克服這一問題,我們可以採用「雙邊鏡像繪圖」的方式,將一種變換的輸入作為另一中變換的輸出。這樣,我們就能通過無監督學習克服相本容量小的問題了。

下面就是一些例子:

動物變形—通過偵測視頻中的奔跑的馬給它添加斑馬條紋,將馬變斑馬圖像。

季節轉換—在圖像中改變季節,例如將冬季轉為夏季,或將冬季轉為春季。

來源&更多信息:

Page:https://junyanz.github.io/CycleGAN/

GitHub:

https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix

NO.5 化零為整:通過輪廓生成逼真圖像

修改逼真圖像是一項富有挑戰性的工作,它要求在寫實的基礎上以用戶控制的方式改變圖像的外觀。這一任務的技術含量相當高,一位藝術家可能要經過多年訓練才能到達穩定的水準。

給出一件物品的輪廓,這一模型就能夠識別出這個物品,並能夠生成栩栩如生的物品圖像。

在該論文中 (https://arxiv.org/pdf/1609.03552v2.pdf),作者提出一種使用生成對抗網絡,從數據中直接學習自然圖像流形的方法。模型能夠自動調整輸出結果,以保證內容儘可能真實,同時所有操作均以約束優化法進行表達,且基本能被實時應用。

這個方法也可以將一張圖片變得更像另一張圖片,或者根據用戶的塗鴉產生全新的圖像。

來源&更多信息:

Paper:https://arxiv.org/pdf/1609.03552v2.pdf

GitHub:https://github.com/junyanz/iGAN

Page:

https://people.eecs.berkeley.edu/~junyanz/projects/gvm/

NO.4 見字如面:GANs用文本生成圖片

下面這項應用既有趣又實用。通過訓練,GANs能夠依據文字描述自動合成擬真圖像。

最近,深層卷積生成對抗網絡(DCGANs)用一些特定類別的圖像,如人臉,唱片封面,室內空間合成了令人嘆服的圖像。

這個模型是用由文本和與之對應的圖像組成的樣本數據進行訓練的。給定一個物體的文本描述,這個模型會嘗試根據這一描述生成圖像。

左欄為文字描述,右欄為機器想像出的圖片

左欄的描述從上到下分別為:

「這隻充滿朝氣的紅色小鳥有著尖尖的黑色的喙」,

這隻黃橙色的鳥有著黑色的翅膀

這隻天藍色小鳥的腹部是白色的

在這項工作中,我們首先要獲取描述圖像的文本,學習文本,抓住重要的視覺細節,然後再利用這些特徵文本來合成能夠迷惑人們的逼真圖像。

來源&更多信息:

Paper:https://arxiv.org/pdf/1605.05396.pdf

GitHub:

https://github.com/paarthneekhara/text-to-image

No. 3 未卜先知:通過「場景動態」(Scene Dynamics)預見視頻下一秒將發生什麼

理解物體運動和場景動態是計算機視覺中的核心問題。不管是視頻識別任務(如行動分類)還是視頻生成任務(如未來預測)都需要轉換場景的模型。但由於物體和場景改變的方式多種多樣,構建這樣一個動態模型是很有挑戰性的。

為實現這一目標,我們需要一個能將前景和背景區分開來的模型。在保持背景的靜止的基礎上,神經網絡能夠了解哪些物體是運動的,哪些物體是靜止的。

上面的預測視頻便是生成模型想像出來的。儘管這些預測並沒有實際發生,基於它們的訓練場景類別,這些動作還是相當合理的。

來源&更多信息:

Paper:http://carlvondrick.com/tinyvideo/paper.pdf

GitHub:https://github.com/cvondrick/videogan

Page:

http://carlvondrick.com/tinyvideo/

NO. 2 依葫蘆畫瓢:用GANs完成模仿學習

GANs也可以幫助研發自學習人工智慧機器人。此前,該領域的研究多涉及獎勵機制的應用。

運用GANs的方法,科研人員向人工智慧主體輸入真實的演示數據,然後人工智慧主體就能通過數據學習嘗試模仿相同的動作

一個AI主體正嘗試模仿人類跑步

該模型展示了模仿學習的一種新方法。標準加強學習模型通常要求建立一個獎勵函數,用於向代理機器反饋符合預期的行為。然而,這種方式在實踐中為了糾正細節問題會在試錯過程上消耗大量精力。

取而代之的模仿學習,則是讓人工智慧主體從實例中學習(例如遠程遙控機器或者人類活動提供的案例),省去了設計獎勵函數的麻煩。

來源&更多信息:

Blog:https://blog.openai.com/generative-models/

GitHub:https://github.com/openai/imitation

No. 1 自學成才:讓「好奇」驅動計算機學習

在很多現實世界的情境中,對人工智慧主體的外部獎勵是非常少的,或者說根本沒有。如此一來,一段被動的程序就會因為它自身的固有屬性,無法進化和學習。

在這種情況下,「好奇心」可以作為內置的獎勵信號激勵人工智慧主體去探索它周邊的環境、學習在將來對它可能有幫助的技能。在這種情況下主動學習者比被動學習者的表現要好。

在這樣的模型中,「好奇心」被設定為 AI預測它自身行為後果能力中的誤差。當然了,在這樣的語境下,AI也可以通過程式設計師建立的獎勵機制開展學習。

讓我們用小孩學習的過程來作個類比。一個不受大人監護的小孩不知道摸熱爐子的後果。不過一旦他這樣做了,他就會明白他不應該這樣做——因為疼痛,也因為了解了摸熱爐子和感受到所謂疼痛之間的因果關係。

貪吃蛇遊戲:通過「好奇心驅動學習」(curiosity driven learning),貪吃蛇學著去收集那些能增加它的報酬的綠球,並避開那些會減少其報酬的紅球。

好奇心驅動的學習(curiositydriven learning)以下面三點作為基礎:

極少的外部獎勵——有了「好奇心」,達成目標所需與外界環境的互動更少了。

沒有外部獎勵的探索,是「好奇心」使AI主體的探索行為更高效。

對未知場景中(例如同一個遊戲中的新關卡)的泛化處理。此時AI主體利用過往經驗探索新大陸,這會比它從零開始探索要快很多。

來源&更多信息:

GitHub:https://github.com/pathak22/noreward-rl

Paper:https://pathak22.github.io/noreward-rl/resources/icml17.pdf

Website:

https://pathak22.github.io/noreward-rl/index.html#demoVideo

結語

看完了以上這些應用,你是不是對生成式對抗網絡刮目相看了呢。然而,這些只不過是生成式對抗網絡初試身手罷了。相對於生成式對抗網絡所能完成的工作而言,這些應用只是冰山一角。生成式對抗網絡為我們提供了一個強有力的訓練神經網絡的方法,讓機器能夠完成任何一個人類能夠完成的複雜任務。

生成式對抗網絡(GANs)向我們證明了:創造力不再是人類所獨有的特質了。

最後,如果你想更深入地學習生成模型(generative model)和深度卷積生成式對抗網絡(DCGAN),不妨繼續閱讀下面的這些資源:

1.Dev Nag的50行代碼看生成式對抗網絡

https://medium.com/@devnag/generative-adversarial-networks-gans-in-50-lines-of-code-pytorch-e81b79659e3f

2. Ian Goodfellow’s的生成式對抗網絡的keynote(一個技術性較強的視頻)

https://channel9.msdn.com/Events/Neural-Information-Processing-Systems-Conference/Neural-Information-Processing-Systems-Conference-NIPS-2016/Generative-Adversarial-Networks

3. Siraj Raval’s的生成式對抗網絡視頻教程(一個簡短而有趣的視頻)

https://www.youtube.com/watch?v=deyOX6Mt_As

原文連結:

https://medium.com/archieai/a-dozen-times-artificial-intelligence-startled-the-world-eae5005153db

相關焦點

  • 自由創作中誕生的的奇思妙想
    奇思妙想在自由的發展中誕生......來看看孩子們自由運用材料創作的作品吧!只是,千萬別以成人的固有的眼光來進行評判哦!否則,你會無法了解到孩子真正的想法,無法理解從孩子們腦海中與手中,誕生的是怎樣的作品。
  • 奇思妙想:長安引力有何與眾不同
    其中,長安引力作為長安汽車寄予厚望的重磅車型,更是採用了許多奇思妙想的設計,在國產緊湊級SUV產品線中顯得十分搶眼。 可以看出,長安引力在設計方面確實充滿了奇思妙想,在同質化嚴重的SUV市場中顯得與眾不同。對於崇尚個性的車友來說,長安引力是個不錯的選擇。
  • 奇思妙想學生發明了「雨衣頭盔」
    奇思妙想學生發明了「雨衣頭盔」 深圳這段時間的天氣 真的是又雨又風又太陽 上一秒豔陽高照 下一秒傾盆大雨
  • 「奇思妙想」短視頻大賽即將開啟,讓我們打開科學的奇幻之旅
    你也曾在生活中產生了許許多多的奇思妙想嗎?生活是科學萌發與生長的土壤,科學是生活量變與質變的催化劑,那些看似高深莫測的理論、遙不可及的技術,也許就來源於我們身邊的一草一木。那些看似平平無奇的事物、容易忽略的現象,其中說不定大有文章、奧妙無窮!
  • 奇思妙想大比拼!這場創業大賽總決賽「金點子」頻出
    在「半潛船」上360度全景欣賞水下世界、用異型膠囊替代塑料包裝、操控機器人進行心內科手術……這裡,是「金點子」激情碰撞的舞臺;這裡,是奇思妙想的盛會。12月12日,「奇思妙想浙江行」2019創業大賽總決賽在杭州舉行。
  • 發揮奇思妙想濟南七中舉行DNA大賽
    為讓學生將抽象知識形象化,濟南七中生物組發揮奇思妙想,組織學生利用日常用品動手製作DNA結構模型,並將這變成了一場製作大賽。
  • 四年級下學期第二單元習作,我的奇思妙想——時空記憶球
    所以本單元的習作,也是要我們來完成這樣一篇類例的習作,我的奇思妙想。這篇作文,雖然是奇思妙想,但並不等於幻想,是要立足於一定的現實基礎上的。從既有的現實中,去觀察和發現存在的不足,不便之處,通過我們的發明創造,讓這個不足和限制,得到補足和改進,這也是本篇作文的題旨。
  • 奇思妙想|假如地球自轉速度提高兩倍(第2期)
    這一期的奇思妙想就到這啦,咱們下期再見~歡迎關注小學渣,小學渣會持續推出更多優質內容。如果你有什麼奇思妙想或者稀奇古怪的問題也歡迎私信小學渣~
  • 我愛科學,快看恆口示範區小學生的奇思妙想作品
    一張張方格紙上爬滿了孩子們天馬行空的想像和一些奇思妙想的設計,展現了孩子們對科技的熱愛和嚮往;一隻只神奇的畫筆、繽紛的色彩,在卡紙上描繪著各式各樣的現代科學技術、航天技術、未來世界的奇思妙想……,讓參觀的同學和老師讚不絕口。在閉幕式上,學校對本次科技節湧現出來的優秀而富有才氣的30名同學和優秀集體予以表彰。
  • 華科的奇思妙想——來自華中科技大學學術前沿青年團隊的調查報告
    因為隔三差五開科研會,鼓勵奇思妙想、天馬行空,圈裡圈外都私下把學術前沿青年團隊稱為「奇思妙想團隊」。蘭鵬飛經常和團隊兩位80後教授周月明、黎敏一起在超快光學實驗室工作到深夜,但每周在科技樓5樓學術討論室舉行的「神仙會」依然雷打不動。「現在我們不僅僅是滿足能給電子拍照,還要多嘗試用雷射操控電子的速度。」
  • 演繹inSite | 實驗室裡的奇思妙想
    實驗室裡的奇思妙想?科學技術研究項目開始成為高額獎金池裡的彩票?還是,成群出沒的科技創業獨角獸們?....(圖片來源:JAXA)【演繹inSite】就是想跟你分享這些科學背後的有趣理解。
  • 孩子們奇思妙想的小發明
    孩子們奇思妙想的小發明科幻cosplay表演同學們異彩紛呈的科技小製作  校園科技活動月來啦!別看這每學期各學校都會舉辦的慣例活動,但卻是同學們參與度最高,玩得最嗨的時候。智能防近視提示器、水果發電機、太陽能無人駕駛車、智能無人愛心送餐車、智能分揀流水線、隱蔽存錢盒……今年校園中最受熱捧的都是實用性強的科技創作,現在就讓我們一起走進這些學校的科技節,看看同學們有哪些奇思妙想。
  • 小發明裡藏著大創意 奇思妙想「玩轉」創新科技
    橋梁道路智能管理、智能分揀機器人、漂浮式晾曬海帶平臺、車載式城市霧霾清理裝置,學生們把日常生活中遇到的問題變為一個個奇思妙想,通過展板和模型展示著自己的創意。
  • 從100幅垃圾分類宣傳畫裡,看到武漢小學生的奇思妙想
    長江網12月29日訊(記者王慧純 通訊員金輝)「環保號」機械恐龍吸入垃圾,在肚子裡分類;灰暗天空在垃圾分類後變成蔚藍晴空;一張四色分明的飛行棋盤,玩著玩著就能學會垃圾分類……29日上午,「垃圾分類·江城童行」頒獎典禮在武漢市常青樹實驗學校開幕,展出的100幅優秀作品展現出武漢小學生令人驚嘆的奇思妙想
  • 奇思妙想 河南開封攝影師用樹葉製作動物剪影
    奇思妙想 河南開封攝影師用樹葉製作動物剪影來源:東方IC圖片       選稿:顧爽   2020.03.25 09:37
  • ...分享你的奇思妙想!|新冠病毒的複製和神藥Remdesivir的作用機理
    分享你的奇思妙想!分享你的奇思妙想!」徵集活動自2月3日開始已經陸續收到各位大朋友和小朋友的稿件了,即日起我們會遴選一些精彩的內容分享給大家。同學們在想,這時候要負鏈的RNA幹什麼用呢?做模板!對的,這條負鏈的RNA將作為後續轉錄形成小mRNA並且翻譯成蛋白質的模板,只不過這個時候形成的蛋白質就不再是RNA聚合酶了,而是RNA外面包著的N蛋白。新合成的N蛋白會和新合成的病毒全長RNA組裝在一起形成新的病毒。而這與我們之前學過的HIV的侵染過程是不同的。
  • 這些奇思妙想的作品令人讚嘆→
    作品名稱:《妙黎》,榮獲鳳凰獎·銅獎作者:上海騏設計工作室設計理念:「妙黎」諧音同「妙禮」、「苗黎」,品牌名意為精選黎苗好禮。「大力神」這一形象,既蘊含著黎族人民通過勞動創造世界的思想觀念,又是黎族民眾勤勞勇敢和聰敏機智的化身。
  • 分享你的奇思妙想!|新冠病毒的複製和神藥Remde...
    分享你的奇思妙想!分享你的奇思妙想!」徵集活動自2月3日開始已經陸續收到各位大朋友和小朋友的稿件了,即日起我們會遴選一些精彩的內容分享給大家。同學們在想,這時候要負鏈的RNA幹什麼用呢?做模板!對的,這條負鏈的RNA將作為後續轉錄形成小mRNA並且翻譯成蛋白質的模板,只不過這個時候形成的蛋白質就不再是RNA聚合酶了,而是RNA外面包著的N蛋白。新合成的N蛋白會和新合成的病毒全長RNA組裝在一起形成新的病毒。而這與我們之前學過的HIV的侵染過程是不同的。
  • Protein & Cell丨漢語「細胞」一詞的來源:一位數學家的奇思妙想
    可是誰能想到,漢語「細胞」一詞並非出自生物學家之手,而是來源於一位數學家的奇思妙想!這位數學家就是晚清著名學者李善蘭。14歲時,他靠自學讀懂了歐幾裡得《幾何原本》中文版前六卷。30歲後,李善蘭在數學方面的漸漸有了深入的研究,開始著書立作。40歲之前,他已經出版了多部數學著作,成為聞名遠近的數學家。李善蘭的數學研究成果代表著當時中國數學的先進水平,他是中國微積分學的先驅。
  • 沙市中山公園松鴉會說話 師從八哥自學成才
    沙市中山公園松鴉會說話 師從八哥自學成才 您當前的位置 :新聞中心 > 荊州社會 正文 來源:荊州電視臺 時間:2017-04-17 16:57   荊州新聞網消息(記者 範振宇)鳥類中鸚鵡、鷯哥最會說話了,大家可知道,荊州市中山公園動物園的一隻松鴉,最近也開口說話了。  這隻名叫松鴉的小鳥,棕色的羽毛,藍、黑相間的翅膀,喜鵲般大小。