想不到,那些讓我半夜偷偷收藏的沙雕表情包,竟是出自AI之手

2020-12-13 機器之心Pro

機器之心報導

參與:蛋醬

要是收藏夾裡沒幾個獨家沙雕表情包,當代網民都無法在朋友圈立足。但有一些「妙不可言」的圖片,也許是 AI 生成的結果。

一般人很難讀出「meme」這個詞,它通常譯為「模因」,起源於 1976 年,本意為「模仿傳遞行為」。

但讀音和來源或許沒那麼重要,重要的是每個網上衝浪的人都見過它,甚至沉迷於它。在中文裡,它大概被稱為「網絡梗圖」、「沙雕圖片」、「表情包」等等……

比如這個:

還有這個:

這個金髮藍衣的快樂男孩,你難道不眼熟嗎?

作為機器學習研究者,你可能還偷偷在收藏夾裡保存了這些:

這是一張在深度學習社區流傳很廣的圖,表達的是新的預訓練方法如何比之前的 SOTA 方法更優越。當然,新 SOTA 方法是層出不窮的,這樣的圖片收集起來甚至能形成一個完整的系列。

圖的創建通常只有兩步:選一張時興的 meme 模版(即圖像),然後配上「精妙絕倫」的說明文字,製造出一種別有韻味的幽默感。

.

這種圖像、文字和幽默感的奇妙組合,在信息傳遞方面極具穿透力和感染力,比如當你看到這張圖時:

雖然這只是一張靜態圖片,句子也不成句子,但你的眼前已經浮現出了七人共舞的場景。

當代網友人人都用表情包,甚至還會自製。比如:

然而,表情包除了自製,還可以由 AI 生成。你可能想不到,某個平平無奇的表情包背後竟然隱藏著「神秘力量」。

今天,我們就來了解一下 meme 自動生成。

meme 自動生成一直是深度學習領域的課題之一。以往的生成方法要麼是從一堆 meme 字幕中選擇最適合的一個,要麼是基於給定圖片和模版來生成 meme 字幕,似乎有點不夠「便捷」。

近日,來自美國亞利桑那州立大學的研究者對 meme 圖生成方法進行了改進提升。在這篇論文中,研究者提出了一種根據給定的輸入語句來生成匹配圖片的方法。這是一項很有挑戰性但有趣的 NLP 任務。

論文地址:https://arxiv.org/abs/2004.14571v1

通過對 meme 圖生成機制的深入了解,研究者決定將 meme 圖生成與自然語言翻譯結合起來。

在自然語言翻譯工作中,為了將輸入的語句轉換為目標語言,必須對語句的完整含義進行解碼,分析其含義,然後將源語句的含義編碼為目標語句。

類似地,此處也可以將源語句的含義編碼為圖像和字幕對,使之傳達與源語句相同的含義或情感,從而將語句翻譯成「梗」。

受該方法的啟發,研究者提出了一種端到端的編碼-解碼模型「memeBot」,可面向任意給定的語句生成 meme 圖。同時在訓練的過程中,研究者創建了首個大型 meme 圖字幕數據集。

給出句子「I am curiously waiting for my father to cook supper tonight」,memeBot 使用 meme 模板選擇合適的圖,然後用字幕生成器生成恰當的字幕,從而生成 meme 表情包。

如何用 memeBot 製作表情包?

「memeBot」是一種端到端的神經與概率架構。該模型共有兩個組成部分,如下圖所示,首先是使用 meme 模版選擇模塊,根據輸入語句確定用哪張圖;然後是 meme 字幕生成器,生成合適的字幕。

meme 模版選擇模塊

基於 BERT、XLNet、Roberta 等 trans-former 架構的預訓練語言表徵被廣泛用於自然語言理解任務。這些模型在針對相應任務微調之後,均達到了新的 SOTA 水平。

該研究在 meme 模版選擇任務上,使用線性神經網絡對預訓練語言表徵模型進行了微調。在訓練過程中,通過使用公

將依據給定語句選擇正確模版的概率最大化。其中θ_1 表示 meme 模版選擇參數,T 表示模版,S 是輸入句。

meme 字幕生成

研究者借鑑了降噪編碼器的方法,通過破壞輸入字幕來訓練 meme 字幕生成器,並使用詞性標註器(POS Tagger)來提取輸入字幕的詞性。研究者使用 POS 向量來對輸入字幕進行遮罩,僅把名詞短語和動詞短語作為輸入傳遞給 meme 字幕生成器。

破壞數據的目的是讓模型從現有的字幕中學習 meme 生成,並在推斷過程中將基於給定輸入語句生成 meme 的過程進行泛化。

meme 字幕生成器模型使用了 transformer 架構,通過對選定的 meme 模版和輸入語句執行多頭縮放點積注意力,來創建給定輸入語句的 meme 嵌入。

transformer 解碼器首先對預期的字幕執行 masked multi-head attention,然後在編碼的 meme 嵌入和 masked multi-head attention 的輸出之間執行多頭縮放點積注意力(如圖 3 所示)。這使得 meme 字幕生成器能夠學習輸入語句、所選 meme 模版和預期 meme 字幕之間的依賴關係。

此外,該研究還使用公式

來優化 transformer。

其中θ_2 表示 meme 字幕生成器的參數,C 表示 meme 字幕,M 是基於 transformer 編碼器獲得的 meme 嵌入。

數據集

模型訓練所用數據有兩個來源,一個是全球最大的 meme 圖片生成網站「imgflip」,另一個就是眾所周知的 meme 圖片集合地「推特」。為了爬取更多的數據,研究者開發了一款網絡爬蟲工具,儘可能多地收集 meme 圖。

該研究最終創建的數據集包含源自 24 個「經典沙雕梗」的 177942 個 meme 字幕。表 1 展示了數據樣本的組成部分,附錄 A 展示了訓練所用的「經典源圖」,圖 4 為 meme 字幕主題的分布情況。

表 1:meme 字幕數據集中的樣本示例,包括模版名稱(Template name)、字幕(Caption)、meme 圖(Meme Image)三部分。

附錄 A:實驗所用 meme 字幕數據集中的的模版和圖像。

圖 4。

此外,研究者收集了推特平臺的推文,用以評估 memeBot 在線上社交互動中通過語句生成 meme 的效力。

研究者在關鍵詞「Coronavirus」查詢結果中隨機抽取 6000 條推文,從中選擇了 1000 條非負面情緒的推文。目的是通過輸入推文讓模型生成 meme 圖,並評估生成結果是否與推文內容相關。

memeBot 效果如何

該研究在訓練、驗證和測試階段的數據集分別包括 142341、17802 和 17799 個樣本,評估內容包括模版選擇模塊在選擇兼容模版時的性能、字幕生成器的生成效力等。

首先,研究者對 BERT、XLNet 和 Roberta 幾種預訓練語言表徵模型進行了微調,並在 meme 字幕測試數據集上測試了模型的 meme 模版選擇性能,結果如表 2 所示。

表 2:加粗部分為最佳分數,精確度和 F1 兩項指標是越高越好,損失則越低越好。研究者使用了性能表現最佳的 Roberta_base 模型作為 meme 生成 pipeline 中的模版選擇模塊。

然後,在字幕生成任務中,研究者使用了兩個變體「MT2MC」和「SMT2MC」(SMT2MC 也有兩個變體),分別代表「基於模版生成字幕」和「基於輸入語句及模版生成字幕」。下圖是字幕生成器的變體所生成的 meme 示例。

可以看出,MT2MC 根據給定的 meme 模版隨機生成字幕,與輸入語句無關聯,SMT2MC 變體生成的 meme 字幕則與輸入語句有語境關聯。在 SMT2MC 的變體中,以名詞短語和動詞短語作為輸入生成的字幕能夠更好地還原輸入語句的本意。

在評估時,研究者使用了 BLEU 分數來評估生成字幕的質量。鑑於 meme 生成沒有固定的指標,研究者還引入了一組評估人員進行「主觀評價」,評估的維度包括圖片與字幕的連貫性和相關性等等,分數在 1-4 分不等。

BLEU 值以及人類評估得分情況。

相關性與連貫性分數的定性比較。

研究者還設計了一個實驗,來評估 meme 生成結果在線上社交環境中的效力:

表 5:推特數據中的人類評估分數。相關性和一致性指標滿分為 4 分,「User Likes」一項代表喜歡該生成結果的人數佔總體的百分比。

圖 9:SMT2MC-NP+V 變體生成的 meme 結果。

最後,研究者也提到,meme 的生成效果評價因人而異,很難通過預定義的指標進行評估。接下來他們會將繼續拓展這一方面的研究,比如將 meme 引入社交媒體流,並根據 meme 在人群中的傳播對其進行評估。meme 傳播率和傳播人群可用於強化訓練,生成更高質量和更具創意的 meme。

相關焦點

  • 表情包:你們那些用沙雕表情包的小仙女們,難道就不是沙雕網友了?
    表情包:你們那些用沙雕表情包的小仙女們,難道就不是沙雕網友了? 歡迎大家觀看新一期的表情包,這裡每天都會更新新的表情包,沙雕網友們聚集地,你想成為沙雕網友嗎?那就快到這裡集合吧,幾萬個沙雕網友等著你的加入,並立即同化你,讓你變得沙雕。
  • 「沙雕熊貓」表情包為何會風靡網絡?
    現在這個時代,聊天沒有表情包就會變得索然無味。從「真香」、「我全都要」到「WTMSB」,伴隨著梗文化的廣泛傳播,一大批幽默風趣的表情包也是豐富了大家的庫藏。比起那些微信自帶的表情,顯然民間自製的表情包更受年輕人的追捧。而簡潔幹練的熊貓頭毫無疑問是民間表情包界的翹楚,也是經久不衰的存在。誇張又不失內涵,含蓄中又帶點痞氣,深受中老年阿姨們的喜愛。
  • 抖音沙雕咆哮表情包 gif高清啊動圖分享趕緊收藏吧
    抖音沙雕咆哮表情包 gif高清啊動圖分享趕緊收藏吧時間:2018-11-19 15:15   來源:趣味百曉僧   責任編輯:沫朵 川北在線核心提示:原標題:抖音沙雕咆哮表情包 gif高清啊動圖分享趕緊收藏吧 抖音沙雕咆哮表情包資源哪裡有?
  • 收了個圖丨沙雕表情包大全(小丑竟是我自己)
    本文轉載自【微信公眾號:表情包弟弟,ID:bqbddd】經微信公眾號授權轉載,如需轉載與原文作者聯繫我叫小雞爸爸一個很閒 喜歡畫小雞的肥宅>容易詞窮 總之 很高興認識你如果你夠及時,能趕上這個冬天,和我一起吃火鍋喝奶茶看電影放煙花合照秀恩愛,那麼這個冬天一定很美好, 如果你這個冬天不來,那我就買長一點的衣服, 把手塞到袖子裡,等到來年你一定要牽起我冷了一個冬天的手。
  • 沙雕表情包:大家好,我是佩奇,這是我的弟弟喬治
    沙雕表情包:大家好,我是佩奇,這是我的弟弟喬治 歡迎大家觀看新一期的表情包,這裡每天都會更新新的表情包,沙雕網友們聚集地,你想成為沙雕網友嗎?那就快到這裡集合吧,幾萬個沙雕網友等著你的加入,並立即同化你,讓你變得沙雕。
  • 當《鬼滅之刃》變成了沙雕表情包之後
    今天呢梟醬就給大家分享一組《鬼滅之刃》的沙雕表情包~把一份快樂分享給大家,就會變成很多份快樂!穩賺!咱們複習久了可以看看沙雕,舒緩一下緊張的心情,笑過之後又可以繼續清清爽爽的刷題啦~nice~隨著《鬼滅之刃》劇情漸入高潮,推特上的討論熱度也是居高不下,網友們在追番催更誇ufo截沙雕表情包之餘,還發起了一個叫做重畫鬼滅之刃的活動。嗯?
  • 小丑竟是我自己是什麼梗?小丑竟是我自己表情包走一波
    小丑竟是我自己是什麼梗?小丑竟是我自己表情包走一波時間:2021-01-05 20:41   來源:手遊之家   責任編輯:沫朵 川北在線核心提示:原標題:小丑竟是我自己是什麼梗?小丑竟是我自己表情包走一波 小丑竟是我自己是最近流行起來的一個梗,主要講的就是那些舔狗求而不得,像一個小丑一樣,來源是之前的一個長途,不斷的卸掉小丑的妝容,然後對方打一個招呼,立馬就變成了小丑,下面就是具體的小丑竟是我   原標題:小丑竟是我自己是什麼梗?
  • 小丑竟是我自己是什麼梗?小丑竟是我自己表情包
    小丑竟是我自己是什麼梗?小丑竟是我自己表情包時間:2020-12-22 23:01   來源:今日頭條   責任編輯:毛青青 川北在線核心提示:原標題:小丑竟是我自己是什麼梗?小丑竟是我自己表情包 小丑竟是我自己是最近流行起來的一個梗,主要講的就是那些舔狗求而不得,像一個小丑一樣,來源是之前的一個長途,不斷的卸掉小丑的妝容,然後對方打一個招呼,立馬就變成了小丑,下面就是具體的小丑竟是我自己是     原標題:小丑竟是我自己是什麼梗?
  • 小丑竟是我自己是什麼梗 小丑竟是我自己表情包
    小丑竟是我自己是什麼梗 小丑竟是我自己表情包時間:2020-12-26 00:16   來源:今日頭條   責任編輯:毛青青 川北在線核心提示:原標題:小丑竟是我自己是什麼梗 小丑竟是我自己表情包 小丑竟是我自己是最近流行起來的一個梗,主要講的就是那些舔狗求而不得,像一個小丑一樣,來源是之前的一個長途,不斷的卸掉小丑的妝容,
  • 友利奈緒的「顏藝」表情笑翻漫迷,那些動漫表情包的「萬惡之源」
    不過雖然每天我們經常都會用到一些動漫表情包,但你真的知道他們的出處到底是哪裡嗎?今天部長我就帶大家一起來看看動漫中那些動漫表情包的「萬惡之源」吧!薩塔妮亞 《珈百璃的墮落》相信這個魔性的「笑容逐漸放肆」大家都見過,而這個有趣的表情出自《珈百璃的墮落》中笨蛋惡魔薩塔妮亞!
  • 沙雕表情包 l 來一波敲搞笑表情包
    點擊上方【沙雕頭像表情包】- 右上角找到【…】立刻設置我為星標/置頂>每天都有不一樣的精彩,喜歡就多多分享沙雕頭像表情包「 一 個 笑 點 滿 滿 的 公 眾 號 」頭像/表情/動圖/故事每天11:00
  • 抖音沙雕表情包gif
    生活就是要跟有趣的人在一起呀,這樣我們的日常才會更加得有趣、更加的開心呀,想讓自己成為更加有趣的人,可以在聊天中多使用一些表情包,給聊天增添樂趣,小編為大家整理了可愛的沙雕表情包,趕緊收藏吧!
  • 沙雕表情包丨我不是笨蛋
    沙雕表情包丨我不是笨蛋 那些能相愛到老的人, 不是兩個完美的人在一起了, 而是兩個不完美的人, 努力讓這段感情變得完美。
  • 超搞笑的沙雕表情包
    #沙雕表情包#平安夜的氣氛還意猶未盡而我又要抹黑起床抹黑起床怎麼都沒有打遊戲時摸塔那樣快樂可那又怎樣呢讀書人讀書魂讀書都是人下人讀書還要每天來發文每天打開手機就能收到滿屏的消息激動的心顫抖的手這使我毫不猶豫的就點開又是我的好「好夥伴」們發的各種表情包
  • 100張無敵沙雕又可愛的表情包!好看死了快來收圖!
    100張無敵沙雕又可愛的表情包!好看死了快來收圖! 昨天晚上兔兔的母親大人發微信 不知道從哪搞來一堆又萌又沙雕的表情包 大半夜的不睡覺跟我鬥圖
  • 沙雕熊貓頭表情包‖不是我說,表情包還是熊貓頭好使
    沙雕熊貓頭表情包‖不是我說,表情包還是熊貓頭好使
  • 沙雕表情包 | 一波日常聊天鬥圖必備表情包
    點擊【沙雕頭像表情包】- 右上角找到【…】立刻設置我為星標/置頂每天都有不一樣的精彩,喜歡就多多分享沙雕頭像表情包「 一 個 笑 點 滿 滿 的 公 眾 號 」點擊播放 GIF 0.0M頭像/表情/動圖/故事
  • 小丑竟是我自己bgm 小丑竟是我自己表情包後續
    小丑竟是我自己bgm 小丑竟是我自己表情包後續時間:2020-12-22 23:03   來源:今日頭條   責任編輯:毛青青 川北在線核心提示:原標題:小丑竟是我自己bgm 小丑竟是我自己表情包後續 小丑竟是我自己bgm是什麼?表情包後續故事是什麼?
  • 表情包誰會嫌多啊?尤其是這麼沙雕的!
    今天是鬥圖的一天也是快樂的一天作為一個擁有無數沙雕表情的我準備拿出一些私藏和你分享現如今在夾縫中生存的我們難免有時候會有點喪、有點難受唯有沙雕表情包才是養生良藥有人說,每一個喜劇人的背後都有一個悲傷的靈魂
  • 那些出自於香奈兒老佛爺之手的經典夢幻包款TOP4!擁有一款就滿足
    現在就讓我們一起來回顧那些出自於香奈兒老佛爺之手的經典夢幻包款TOP4!1、COCO CHANEL首先第一款包,就是大家所熟知的COCO包了!此包為老佛爺加入香奈兒執掌設計大任後,所推出的第一個包款,此包以Coco Chanel女士所設計的經典2.55包為藍本,在細節上加以進化,皮穿鏈帶、雙C Logo金屬轉扣等細節,一推出就立刻大受歡迎,從此後也成為品牌熱賣包款之一!