跨物種造物,AI 將長頸鹿圖片轉換為鳥,還騙過了人類與機器

2020-12-04 雷鋒網

當人們研究人工智慧生成和檢測圖像的方式時,都需要明確一個研究主題。近期康奈爾大學的三位研究人員 Daniel V. Ruiz,Gabriel Salomon,Eduardo Todt 決定訓練人工智慧將長頸鹿的圖片轉化成鳥的圖片,用生成對抗網絡(GANs) 產生新數據來研究這種圖像到圖像轉換(image-to-image translation)。這篇論文還投中了 Computer on the Beach (COTB'20) 2020 會議。

論文地址:https://arxiv.org/abs/2001.03637

目前圖像到圖像轉換的應用已經比較廣泛,包括從衛星圖像生成地圖到僅從輪廓生成完整的服裝圖像。這篇論文研究將長頸鹿轉變為鳥其實頗具挑戰,因為兩種動物有不同的大小、紋理和形態。他們訓練了一個名為 InstaGAN 的無監督跨域轉換模型,讓它接受了大量長頸鹿和鳥的圖片訓練。

InstaGAN 由韓國科學技術院和浦項科技大學的研究人員在 2019 年提出,相關論文《InstaGAN: Instance-Aware Image-to-Image Translation》還被 ICLR2019 接收。

最後鳥類成品保留原始圖片的布局和背景,只是將長頸鹿直接轉換成鳥類。需要強調的是,生成的鳥並不存在,這僅僅是 InstaGAN 生造的結果。

這次論文的創新點,用作者自己的話說就是,「我們這次沒有把蘋果變成橘子,而是把大象變成了香蕉」。因為之前無監督的圖像到圖像轉換,例子大多是將站著的獅子轉換為趴著,將貓轉化為狗,馬變成斑馬等,但這些訓練在比例、形狀都很相似,所以難度有所差異。

他們具體是怎麼做的呢?

用於訓練 GAN 和生成相關的圖像有兩個數據集:COCO(Common objects in Context) 和 Caltech-UCSD Birds 200。COCO 數據集有超過 91 種類型的 328000 張圖片,作者們從中選了 2546 張和 101 張的長頸鹿圖片分別用於訓練和驗證,又從另一個主要涵蓋 200 多個種類的鳥數據集 Caltech-UCSD Birds 200-2011 中,八二分,選擇 80% 也就是 9414 張的鳥類圖片用於訓練,20% 也就是 374 張用於驗證。

每張圖片都能看到長頸鹿和鳥的輪廓。AI 主要工作是兩塊,一是把長頸鹿變成鳥,另一部分是判斷它看到的圖片是真的鳥還是假的長頸鹿—鳥。

接下來開始訓練。大多數參數與 InstaGAN 初始論文中一樣。通過雙線性插值(bilinear interpolation)將長頸鹿和小鳥數據集的圖像大小調整為 256x256 ,GPU 訓練花費了將近 3 周時間(如果用 2 個英偉達 RTX 2080 GPU,時間能減少到一周半)。

InstaGAN 在訓練中使用的 loss functions 包括:Least-squares GAN loss,cycle loss,context loss 和 identity loss,根據它們在最終結果中的重要性進行加權。cycle loss 權重最高。LSGAN 也是如此,因為它改善了收斂性,減少了可能消失的梯度問題(vanishing gradient issues),這需要超過 100 個 epoch 來實現良好的視覺效果和損失最小化。

在三周的訓練結束後,他們得到一個人造鳥圖集 FakeSet 。下圖顯示了圖像到圖像轉換的一些例子。

可以看到原始圖像和蒙版,以及轉換之後的圖像和蒙版。請注意,姿勢、空間排列和背景是沒有改變的的。也就是說,InstaGAN 已經相當好地學會了轉換圖像,這些圖像中,長頸鹿幾乎沒有遮擋,都是側身站立,而在相同的位置上如今也產生鳥類。有意思的是,InstaGAN 學到了一個有趣的「欺騙」方法——生成深色的鳥,與淺色背景形成對比,如此能更好地騙過人類、機器鑑別者。

接下來讓我們來看看 InstaGAN 生成的成品圖。

有些轉換的效果令人印象深刻。InstaGAN 學會了如何模糊頂部的風景,使它們看起來像微距鏡頭即使過渡的地方並不是十分絲滑,一隻長頸鹿的肩膀還在,但是 AI 巧妙地把它處理成了一塊石頭,希望你不會注意到。

背景模糊效果還不錯,在處理前景時,InstaGAN 造了一根木頭作為鳥的棲息處,並突出了樹枝、巖石裂縫等細節,也模糊了附近的鳥腳,整個效果比較自然。但有幾張圖片還能隱隱看到長頸鹿的肚子和腿,於是 InstaGAN 把它們變成了綠色,可能是希望能錯認是一片葉子之類的植物。

當然很多時候轉換效果並不好。由於可能受到不尋常背景的影響,人工智慧沒有成功地改變圖像外觀。這裡也很明顯,人工智慧移除長頸鹿的一般策略是,將鳥的身體複製粘貼到長頸鹿的頭、脖子和肩膀部分,然後盡力隱藏長頸鹿的腿。如果帶著這樣的想法看上圖幾張照片,你會立刻發現長頸鹿的大長腿還在那裡,模型的多次失敗都與難以掩蓋的長頸鹿的腿有關。

為了評估生成的圖像的真實性和質量,作者進行了定性和定量分析。定性分析是,隨機挑選 FakeSet 335 張圖片去評估圖片,標準是轉換質量、輪廓和紋理幾項,選項只有兩個——"Good 或者 "Bad 。每個屬性的最終分數是 335 張圖片的平均分,用 0 到 1 之間的分數表示( 0 表示質量差,1 表示質量好)。如果一個屬性的值等於 0.75 ,則意味著 3/4 的圖片在該屬性中表現良好,1/4 的圖片表現不佳。具體可見下表。

為了進行定量分析,他們使用了一個預先訓練好的 Mask R-CNN(Mask Region-based Convolutional Neural Network)新生成的數據集 FakeSet ,對 2546 張圖片進行分析,評估結果是,289 幅圖片是垃圾(甚至沒有檢測到鳥類存在),717 幅不令人滿意(常用指標 F-score 低於 0.8 ),1540 幅令人滿意。F-score 遵循一個偏斜的正態分布,傾向於最佳分數。

綜上,該論文結論是,FakeSet 實現了接近真實數據集的檢測和分割結果,雖然大多數圖像並不完全真實,但是正確轉化的比例也很高,檢測和分割結果也是高可信的(高於80%)。這說明生成的圖像足夠逼真,不管是肉眼難以察覺,也經得起最先進的深層神經網絡的檢驗。

雷鋒網雷鋒網雷鋒網

相關焦點

  • 想騙過人臉識別?一塊錢就夠了(附送幾組騙AI的方法+論文)
    這篇論文發表在2015年的計算機視覺頂級學術會議CVPR上,還獲得了Community Top Paper獎。Clune在論文中提到,很多在人類看來毫無意義的圖片,輸入到神經網絡中,會被分類為某種物體。
  • 機器無法直接將影視或故事轉化為音樂 但人類可以做到
    圖片來自G**gle Images機器可能在步步取代人類的行為,許多人類可以做到的事都因科技的發展而變得更簡單、更工具化。可如果要將黑暗影視或黑暗故事轉化為音樂,恐怕機器是無法做到的,因為這必然需要人類的思想,以及將他們理解的東西用聲音的方式重新表達,是有靈魂的。
  • 長頸鹿脖子那麼長 真是為搶樹葉進化出來的嗎?
    長頸鹿(學名Giraffa camelopardalis)擁有令人驚嘆的修長脖頸。同樣只有七塊頸椎構成,長頸鹿的脖子和人類的脖子形成鮮明對比,凸顯造物的神奇。不過這一生物奇觀究竟是如何進化而來的?似乎任何有關生物進化的問題都會被追溯到達爾文的工作,長頸鹿的「長頸之謎」也不例外。
  • 長頸鹿的脖子為什麼那麼長?
    肯亞長勁鹿公園飼養的羅斯柴爾德長頸鹿,是一個瀕危物種,1979年,非洲瀕危野生動物基金會剛剛起步之時,野生的羅斯柴爾德長頸鹿已經不到130頭。今天,這一物種的數量超過了300頭。只是,困擾我的問題是,長頸鹿的脖子為什麼要長那麼長呢?明明喝水很吃力啊。
  • 其實,ai不止是一項科技,更是一種文化,一種觀念
    其實,ai不止是一項科技,更是一種文化,一種觀念。自2016年alphago在圍棋系列賽中戰勝職業棋手以來,ai已經開始在某些領域中取得進展,並且在某些問題上實現了突破。在最近的新聞中,谷歌發布的兩張miranda照片不僅僅是事實,還再次為我們揭開了ai正在開始各領域進行科學研究的新面貌。
  • 現代人類參與跨物種交配被科學家證實
    (左邊為尼安德特人模擬復原圖,右邊為現代智人)在DNA測序技術未進入遺傳學之前,我們普遍認為跨物種之戀會無果而終。大多數知識會告訴我們,人類的進化過程是一個直線,從最開始的爬行猿類,到最終的現代直立智人,我們與尼安德特人是不同的物種,不可能產生後代。
  • 原始人類以鳥為食 巨型鳥體重高達1500磅
    原始人類以鳥為食 巨型鳥體重高達1500磅時間:2019-07-02 13:34   來源:四海網綜合   責任編輯:凌君 川北在線核心提示:原標題:原始人類以鳥為食 巨型鳥體重高達1500磅 原始人類以鳥為食巨型鳥體重高達1500磅 四海網:據美國《新聞周刊》網站6月26日報導,直到不久前,人們一直認為大型鳥類僅存在於馬達加斯加
  • 科學家跨物種雜交,將人類幹細胞注入小鼠胚胎,培養成熟人體細胞
    不同動物的染色體數量都會有所差別,所以它們存在生殖隔離,因此不同物種之間一般不會有交集。但如果在人為的幹預下,這可不一定了。人類曾經創造出一些跨物質的雜交動物,例如騾子、獅虎獸、鯨豚等。那人類能跨物種雜交嗎?小編接下來要說的可不是科幻電影裡的場景了。據外媒報導,科學家將人體幹細胞注入小鼠胚胎內,想要嘗試跨物質雜交,還將研究結果在5月13日發布在了《Science Advance》雜誌上。
  • 全球最矮長頸鹿 戰鬥力那麼強為什麼也成了易危物種?
    原標題:全球最矮長頸鹿 戰鬥力那麼強為什麼也成了易危物種?     獸醫莎拉·弗格森(Sara Ferguson)成功飛撲了長頸鹿的脖子.長頸鹿看起來纖細,其實龐大而強健,頭和脖子加起來約有 270 公斤,比黑熊還重.爭奪配偶時,雄性將脖子甩出長長的弧線,用頭部相互撞擊.它們被從天而降的獸醫砸到,不算什麼大事.
  • 機器智能將是人類意識進化的巔峰?
    從進化的角度看,一大批未來主義者預測未來會逐漸走向一個極端:計算機很快會強大到能模擬人類意識,或全部吸收化為己有;而另一方面,有人認為日後人類在宇宙中所遇到的高智商物種更可能是以計算機為基礎的,而不是如人類這樣的血肉之軀。
  • AI看圖說話首超人類!微軟認知AI團隊提出視覺詞表預訓練超越...
    能看圖會說話的AI,表現還超過了人類?最近,Azure悄然上線了一個新的人工智慧服務,能精準的說出圖片中的內容。而背後的視覺詞表技術,更是超越了基於Transformer的前輩們,拿到nocaps挑戰賽冠軍。有沒有發現,搜索出來的圖片有時相關性很差?
  • 鄒炎炎:語義分析介紹及跨語言信息在語義分析中的應用 | AI 研習社...
    實驗分析雷鋒網 AI 研習社將其分享內容整理如下:今天跟大家分享的內容包括兩個部分:一是語義分析介紹,考慮參與分享的大多數朋友並不是從事 semantic parsing 的相關工作,所以我會從通俗易懂的角度為大家做一個普及;二是講一下我們在 ACL 2018 會議中的一篇短文——《跨語言信息在語義分析中的應用
  • 全球最稀有的白色長頸鹿,可能僅剩1隻了
    動物的美麗為它們招來了殺身之禍。全球物種滅絕速度加速與長頸鹿有著相同命運的動物不計其數。目前,世界上已有593種鳥、400多種獸、209種兩棲爬行動物和20000多種高等植物瀕於滅絕。人類不合理的社會活動,正在加速動物的滅絕速度。
  • 人類未來將移植豬器官,是否會引起跨物種病毒感染?
    此後,人類一直在探尋能否將動物器官移植到人體,因為全球每年器官移植缺口巨大,全世界有200多萬人需要器官移植不光,移植豬器官,那就要解決免疫排斥、生理功能不相容和動物源病原體的跨種系感染問題。比如免疫排斥,即使是人與人之間的移植,都會產生終生排斥,需要終生服用免疫抑制劑。一方面可以抑制移植術後的排斥反應,另一方面則是抑制過度引起的各種併發症和副作用。何況是和人類親緣關係相差很大的豬呢?
  • 深度造假「AI寫手」火了!大學生用GPT-3寫「雞湯文」,騙過一堆人登...
    不過,這卻成功「騙倒」了一大批內容閱讀者。一大部分人愣是沒看出來文章不是人類寫的,Medium、YC的新聞平臺等多家平臺都轉載刊發了他的第一篇博客、他的博客居然還瘋狂漲粉人氣居高不下……這讓小哥波爾開始感到不淡定了,不過他自己也感到非常驚訝。波爾說,他想證明GPT-3可以冒充人類作家。
  • 長頸鹿剛出生就會走,人類咋就不行?
    雖然這種掙扎看上去非常可愛滑稽,就像看到人類嬰兒第一次蹣跚學步一樣,但對於它們而言這是面臨生與死的挑戰。為奔跑而生所有動物出生時都處於無助或者自給自足的狀態中,前者晚熟型動物,是像人類嬰兒一樣無法自主移動的動物,它們強烈需要母親的照顧;後者早熟型動物,然而長頸鹿幾乎是落地就學會奔跑的動物。
  • 中國也有長頸鹿,只是我們都沒有見過
    中國也有長頸鹿,只是我們都沒有見過 圖註:像長頸鹿一樣的山西獸,圖片來自網絡 長頸鹿身高腿長,是非洲的代表性物種,沒有長頸鹿出沒的非洲大草原不是真正的非洲大草原。長頸鹿站立時,腦袋距離地面的高度足有5米高,它也因此成為今天陸生上最高的動物。我們中國大地上有沒有長頸鹿生存過呢?還真有,今天就介紹一種生存在500萬年前山西的「長頸鹿」。 今天要介紹的這種「中國長頸鹿」名字叫做山西獸(Shansitherium),一聽名字就知道它是在山西省發現的。
  • 人類未來將大量移植豬器官,是否會引起跨物種病毒感染?
    此後,人類一直在探尋能否將動物器官移植到人體,因為全球每年器官移植缺口巨大,全世界有200多萬人需要器官移植不光,移植豬器官,那就要解決免疫排斥、生理功能不相容和動物源病原體的跨種系感染問題。比如免疫排斥,即使是人與人之間的移植,都會產生終生排斥,需要終生服用免疫抑制劑。一方面可以抑制移植術後的排斥反應,另一方面則是抑制過度引起的各種併發症和副作用。何況是和人類親緣關係相差很大的豬呢?
  • 同是生物,長頸鹿每天僅需睡兩小時,為何人類卻不行?
    當你在動物園玩耍,你可能看到過獅子睡覺、老虎假寐,但卻不曾見到長頸鹿睡覺。事實上長頸鹿每天的睡眠時間可能只有2個小時不到,大多數時間都是站立著的。這不免就讓人想到一個問題:長頸鹿擁有龐大的身軀,每天卻只需要睡兩個小時,同為生物的人類為何不行?人為什麼要睡覺?睡眠是一種適應性行為,目的是在24小時中的某個時段內限制生物機體的活動,進而節約能量。
  • 可愛逼真長頸鹿彩鉛畫手繪教程圖片
    小夥伴們有畫過長頸鹿的簡筆畫了嗎?很簡單的哦,之前小編就要跟大家分享過了長頸鹿的簡筆畫教程。