新的快速圖像轉手繪方法,人類水準、戶外場景

2020-12-12 雷鋒網

雷鋒網 AI 科技評論按:下面的 AI 生成的手繪圖看起來怎麼樣?有耳目一新的感覺嗎?像你不好好聽課的時候在草稿紙上隨便畫的風格嗎?

作者們尤其希望讀者關注下面那張臥室的生成手繪圖像。其中的物體邊界線並不像初學繪畫的人那樣畫成了完全的直線。

從照片生成簡筆畫或者素描樣式的手繪圖像是許多普通人都感興趣的計算機視覺任務。但是這項任務並沒有那麼容易做好。一直以來計算機視覺研究人員們花了很多精力關注的任務都是圖像分類和語義分割,即便是像素級、實例區分的語義分割也只能抓取到不同物體的外部輪廓,對同樣刻畫了物體形狀、但是位於外輪廓線內部的線條就無能為力了;而另一方面,各類邊緣檢測算法雖然能捕捉到邊緣,但是無法區分出人類重點關注的、帶有較多語意信息的輪廓內部的主要線條並予以加強。高度簡化的簡筆畫又會與實物相距甚遠。

不同寫實程度的簡筆畫風格

不同邊緣檢測方法之間的對比

近期的一篇新論文《Photo-Sketching: Inferring Contour Drawings from Images》(照片速寫:從圖像生成輪廓繪畫,arxiv.org/abs/1901.00542)就在這個問題上邁出了自己的一步。一作是 CMU 的中國留學生 Mengtian Li,他本科在南京大學匡亞明學院;別的作者來自 Adobe 研究院、Uber 以及 Argo AI。

作者們的方法並不意外,收集一個新的手繪數據集(真人進行的照片手繪),然後訓練神經網絡。不過與類似研究有所不同的是,作者們收集的是一個一對多的數據集,每張照片可以對應多個真人手繪 ground truth 圖像。所以作者們認為這不應當是在傳統的「優化調節邊緣檢測器」路線上繼續發展,同時直接使用各類現成的 cGAN 也無法帶來理想的表現。作者們提出了一種新的、可以處理多種不同的稀疏輸入的 cGAN 來進行處理。作者們與其它方法進行了定性以及定量的對比。

為了便於視覺理解及簡筆畫生成的後續研究,作者們也一併發布了這個數據集,它由一組組圖像和對應的輪廓簡筆畫組成。數據中含有 1000 張戶外場景的照片,每張照片都有 5 張對應的人類繪製的輪廓簡筆畫(一共 5000 張)。簡筆畫中的筆畫已經與照片中的邊界做過粗略的對齊,便於把人類的筆畫和照片中的邊界對應起來。

數據集是通過亞馬遜眾包平臺 Mechanical Turk 收集的。收集過程中先給參與者展示墊在半透明背景下的照片,然後要求他們在上面用簡筆畫描繪出圖中的邊界。為了獲得高質量的簡筆畫(標註),研究人員們專門設計了一個標註界面,其中含有一個詳細的指導頁面,展示了許多正面和負面例子。標註還會經過人工的質量檢查;內部邊線有缺失的、缺少重要的畫面內容的、手繪的邊界線與原圖有較大出入的、無法識別簡筆畫內容的、簡筆畫中的人物非常糟糕的、在空的部分畫了線,這六類質量不高的圖像都有可能被拒絕。所以實際上,在收集到這 5000 張可用的手繪簡筆畫的同時,研究人員們也獲得了 1947 張質量不高而被拒絕的簡筆畫;這些畫未來可以用作自動質量控制的樣本。

數據集中部分手繪圖像(帶有筆畫方向及順序)

論文摘要:邊界、邊線、輪廓,這三者在計算機圖形學和計算機視覺兩個領域都是重要的研究課題。一方面,它們是表達了三維形狀的二維平面元素;另一方面,它們是互相遮蓋的物體的指示器,我們正是藉助它們才能分辨不同的物體或者語義概念。在這篇論文中,作者們的目標是生成物體輪廓繪畫,也就是類似邊線的筆畫,通過它們勾畫出視覺場景的主要線條。早期的研究中通常把這類任務稱作「邊緣檢測」。然而,邊緣檢測任務的理想輸出中包含的視覺元素與輪廓繪畫之間其實有著不小區別,而且也缺失了輪廓繪畫中的藝術風格。作者們解決這個問題的方式是收集了一個新的輪廓簡筆畫數據集,並提出了一種基於學習的方法來解析不同的標註之間的多樣性;而且與邊緣檢測器不同的是,他們的方法可以在真實照片和手繪素材不完全對齊的情況下工作。相比以往的方法,作者們的方法定型、定量地都取得了更好的表現。令人驚訝的是,當作者們在 BSDS500 數據集上精細調節模型時,他們在突出邊界檢測任務中取得了目前最好的成績,這表明他們的輪廓繪畫可能可以成為邊緣標註的一種可拓展的替代方案,但同時對於標註人員來說更容易做、也更有趣。

項目主頁:http://www.cs.cmu.edu/~mengtial/proj/sketch/

論文地址:https://arxiv.org/abs/1901.00542

P.S. 單獨的手繪圖像技術和數據集可以參見雷鋒網 AI 科技評論往期文章 《谷歌大腦教機器畫簡筆畫,神經網絡的大作都長啥樣?》以及《同濟大學「智能大數據可視化實驗室」開源FaceX,包含500餘萬張卡通人臉表情簡筆畫》

雷鋒網(公眾號:雷鋒網) AI 科技評論報導。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • PS教程:照片快速轉手繪,學會了真實用,自己製作設計效果圖
    本篇教程,小編就來和大家分享 :如何將照片轉為手稿效果圖,有網店的電商朋友,學會了可以自己動手製作商品手繪推廣圖,感興趣的朋友,跟著小編一步步學著製作吧。工具/材料:電腦、Photoshopcc2019、素材圖片一張方法/步驟:1、打開一張背包素材圖片,按Ctrl+J複製背景圖層,得到圖層1,Ctrl+Shift+U
  • Photoshop將超酷的帥哥照片轉手繪效果
    【IT168 軟體技巧】轉手繪又名轉鼠繪、仿手繪,仿鼠繪等。就是利用PS將人物或風景等照片轉變成類似於手繪效果的一種圖片處理方法。與手繪不同的是轉手繪不需要太濃厚的手繪功底,因為是轉而不是純手繪,只要在原圖基礎上加以修飾有點類似手繪效果即可。
  • 捕夢藝術:約翰·阿爾文的手繪電影海報
    《捕夢藝術:約翰·阿爾文的手繪電影海報》精選40年來350幅手稿,初次曝光步驟草稿、獨門繪畫技巧等海報創作不為人知的細節。他為最初的標識探索了幾個方案,並畫了一系列場景。開始畫的是光穿越雲層、男孩看到光亮並朝它奔去的畫,接著是飛船穿過雲層的畫。它們作為多層摺疊的插頁,夾在行業期刊《綜藝》(Variety)和《好萊塢報導》(Hollywood Reporter)中。有人告訴約翰,史匹柏受到約翰畫作中飛船穿過雲層時光線和色彩的啟發,把它用在了電影中(我不知真假,希望是真的)。
  • 海豚眼中的人類?科學家將聲音轉成圖像……人類對它們來說是萌物!
    某程度上來說,海豚的智商簡直是動物界的外星種,它們跟人類一樣喜歡說話、會組小團體,甚至有科學家發現每隻海豚都有自己的名字,它們還懂得釋放訊號找尋失散的同伴。然而,海豚眼中的「人類」是怎麼樣的呢?其實早在幾年前,Speak Dolphin海豚研究機構就曾利用聲納設備,將海豚的聲音定位後翻譯成影像,意外發現海豚看(聽)人類的角度。最近這個實驗又被網友拿出來討論,大家驚呼,原來海豚眼中的人類這麼萌啊!海豚掃描物體時會發出高頻聲波,宛若一個天然的3D掃描器。
  • Next Idea | 用圖像連接歷史,在小程序裡挖掘文物
    在 Next Idea 騰訊創新大賽中,不少小程序作品基於圖像識別,利用新技術還原文物發現的過程,把現實圖像與歷史連接起來。為此,微信極客對山西博物院和首都博物館小程序的青年創客團隊進行了採訪。團隊名稱:學古探微成員:周同 劉昱 儲港 殷楚彥學古探微團隊在採訪中分享他們的開發經歷。
  • X光安檢機圖像識別如何做到快速判斷
    細心的你也許注意到了,在我們的行李、包包通過X光安檢機時,相應的圖像都會在顯示器上顯示。但因為是X光成像,實際細看時和實物差別是很大的,沒有經過培訓和一段時間的工作經驗,恐怕無法正確分辨出所通過物體裡面的狀況的。那麼安檢工作人員是如何根據顯示的圖像來判斷行其中是否有違禁品的呢?其實X光安檢機圖像的識別方法有很多,下面我們來看看究竟是如何快速判斷圖像中的物品的。
  • PS時代如何把實景建築圖變成手繪呢
    PS來製作以下為詳細教程 原圖 成品效果 一簡易調圖首先,打開你的照片,做一些簡單的調整,圖像 > 自動顏色,圖像 > 自動對比度,圖像 > 自動色調。4、現在我們要用相同的方法創建更多的粗糙效果圖層,重複本環節的步驟1和2,但是將步驟1裡的參數重新設置如下 5、將這一層命名為「粗糙_2「,更該混合模式為」顏色加深「,透明度為25%,將其放在「粗糙_1「下方保持適當的秩序。 6、重複步驟1和2,但將步驟1中參數設置如下。
  • 建築設計手繪中的透視關係
    透視是人眼睛感知物體後的成像過程,可以理解為人的眼睛透過一個透明的平面觀察物體,把觀察到的視覺影像描繪在該平面上,反映這個空間形體的圖像就是我們常稱為透視圖。設計師將平面圖轉為透視圖,就是將二維的空間關係通過透視方法轉換為三維的空間效果在圖紙上呈現。學習透視圖,我們需要了解常見的透視基本術語。
  • 《千與千尋》場景湯油屋手繪過程
    雖說是新年,可是laterboy還要加班,並沒有休息(貌似laterboy自從出社會後就有休過正常的節假日,悲催……),而且過年雜七雜八的事情反而更多,沒有足夠時間畫完一幅新的圖,無奈只好把去年畫的一些圖發布出來,去年畫動漫場景,每部動畫發布5期,但實際上涉及到的那幾部動畫都畫了不止5幅,有些是在laterboy開通自媒體之前畫的,比如這幅《千與千尋》的湯油屋就是。
  • 2019戶外廣告上半場已結束,哪些新場景被忽視了?
    2019戶外廣告上半場已結束,哪些新場景被忽視了?◎ 戶外廣告內參  編輯21世紀,儘管是網際網路的天下,但線上多媒體廣告顯然已遭遇瓶頸,線上流量雖大,但水分卻深。企業品牌最佳的傳播方式:還是戶外廣告。尤其是有創意的、打造場景化的戶外廣告更能吸引大眾的目光,而且還能反過來到網際網路上進行二次傳播。這說明,戶外廣告營銷正不斷向場景化的方向邁進,而戶外廣告的新場景也在不斷被開發。廣告,在我們身邊無處不在。你從家裡出發,小區電梯到公交站的廣告牌,再坐公交車到乘坐寫字樓電梯,一路都可以看到不同的戶外廣告。
  • 瀋陽怎麼快速轉店,又怎麼快速找到轉店信息?
    在瀋陽開個實體店鋪是大多數創業者的選擇,但是有的時候因為這樣或那樣的問題導致不能經營下去,就涉及到轉店的環節了,那怎麼能夠快速轉店呢?又如何能夠快速找到適合自己的店鋪經營,進行自己的創業之旅,在創業中尋找自己的快樂和成就感呢?
  • 實時翻譯水準高 科大訊飛翻譯機在線翻譯水平達到英語專業八級
    實時翻譯水準高 科大訊飛翻譯機在線翻譯水平達到英語專業八級時間:2020-07-17 19:01   來源:搜狐   責任編輯:青青 川北在線核心提示:原標題:實時翻譯水準高,科大訊飛翻譯機在線翻譯水平達到英語專業八級 很多人從小就有一個環遊世界的夢想,可等到自己長大成人時才發現,原來環遊世界還真不是一件簡單的事
  • ACM MM最佳論文全文:通過多對抗訓練,從圖像生成詩歌
    最佳論文《Beyond Narrative Description: Generating Poetry from Images by Multi-Adversarial Training》(超越敘事描述:通過多對抗訓練,從圖像生成詩歌 )由京都大學和微軟亞洲研究院合作完成。
  • 通過深度通道將2D圖像轉3D立體影片stereoFake
    StereoFake使用深度傳遞來創建立體圖像,並能輸出左右眼的立體圖,並排或隨機播放通道。全球範圍內有多家2D轉3D工作室開發了大量類似的工具,經過NewVFX測試,精選了兩款最佳好評度,並已經在一些知名Pipeline上運行的2D轉3D工具,提供給工作室下載使用。
  • 上博推出手繪大英百物,首次採用「場景+文物」組合
    《手繪文物世界史》的繪本裡,這本書是上海博物館為了配合同期舉辦的特展——「大英博物館百物展:濃縮的世界史」而特別編寫的。這本書以風格獨特的手繪設計將文物與場景相結合,每一個場景中都有一個妙趣橫生的小故事和對應的文物解讀。書中的27個場景中融入了整整100件文物,一位古怪又可愛的老頭M教授,將帶領小朋友和大朋友們穿越回這些歷史場景,共同挖掘埋藏在這些場景下的文物寶藏。
  • 龍巖一中宿舍樓等拆除 場景手繪明信片校園熱賣
    好在,被拆除的只是建築,回憶可以用其他方式留下——近來,一套龍巖一中手繪明信片走紅校園。手繪明信片大熱,一天賣出80套  寫著「福建龍巖第一中學」的正大門,少了嚴肅,多了溫暖;校道上的「三重門」:奮鬥之門、智慧之門、成功之門,綠蔭環繞,學生們捧著書,從這裡走過……這些「最一中」的場景,被畫上明信片,擺在一中旁的精品店裡,近來頗受歡迎。其中8張,都是根據一中現實場景手繪的,畫中的龍巖一中,別有風情。
  • 醫學人工智慧的突破,中山大學/電子科技大學開發新型圖像技術
    然而,目前國內醫學人工智慧發展仍面臨優質數據提取困難、現有數據標註方法效率低等一系列問題,同時許多疾病患病率低,不同學科數據特徵迥異,導致現有人工智慧算法通常難以應對跨學科場景。如何利用一流醫療人才團隊與海量循證醫療數據的優勢,突破僵局,建立中國特色的醫學人工智慧發展模式,仍然是目前中國廣大人工智慧工作者們面臨的重大科學問題。
  • Word轉PDF怎麼轉?三種方法快速學會
    在日常的工作中,我們都習慣使用Word文檔進行編輯,但是有的時候編輯完成了之後,為了保證文檔的安全性,選擇將Word文檔轉換成PDF文檔的形式,因為PDF文檔安全性高,不容易更改,Word轉PDF怎麼轉?怎麼使用Word轉PDF轉換器?
  • 景觀設計手繪——從細節開始,草圖走起!
    室內空間配景技法訓練徒手快速草圖創作才是最重要的,細緻的後期效果圖絕不是我們用手繪去細磨慢畫的。植物的簡潔勾勒畫法人物快速手繪人物的畫法簡要總結:1.比例 頭∶上身∶下身=1 ∶ 4∶ 4,注意頭部儘量畫小一些。
  • 攝影大師教你創建更好的靜物圖像的一些很必要的簡單方法
    例如,如果您正在拍攝藍色的東西,並且您使用了藍色和綠色背景,那麼您將擁有一個非常和諧且可能平靜的圖像。另一方面,如果你在場景中添加了黃色或橙色,它會產生張力並使整體感覺更加動感。您可以通過不同方式為靜物圖像帶來色彩。背景,織物,盤子,碗,花瓶 - 所有這些物品都是道具,你可以開始收集建立道具的顏色庫。