新的快速圖像轉手繪方法,人類水準、戶外場景

2020-12-14 雷鋒網

雷鋒網(公眾號:雷鋒網) AI 科技評論按:下面的 AI 生成的手繪圖看起來怎麼樣?有耳目一新的感覺嗎?像你不好好聽課的時候在草稿紙上隨便畫的風格嗎?

作者們尤其希望讀者關注下面那張臥室的生成手繪圖像。其中的物體邊界線並不像初學繪畫的人那樣畫成了完全的直線。

從照片生成簡筆畫或者素描樣式的手繪圖像是許多普通人都感興趣的計算機視覺任務。但是這項任務並沒有那麼容易做好。一直以來計算機視覺研究人員們花了很多精力關注的任務都是圖像分類和語義分割,即便是像素級、實例區分的語義分割也只能抓取到不同物體的外部輪廓,對同樣刻畫了物體形狀、但是位於外輪廓線內部的線條就無能為力了;而另一方面,各類邊緣檢測算法雖然能捕捉到邊緣,但是無法區分出人類重點關注的、帶有較多語意信息的輪廓內部的主要線條並予以加強。高度簡化的簡筆畫又會與實物相距甚遠。

不同寫實程度的簡筆畫風格

不同邊緣檢測方法之間的對比

近期的一篇新論文《Photo-Sketching: Inferring Contour Drawings from Images》(照片速寫:從圖像生成輪廓繪畫,arxiv.org/abs/1901.00542)就在這個問題上邁出了自己的一步。一作是 CMU 的中國留學生 Mengtian Li,他本科在南京大學匡亞明學院;別的作者來自 Adobe 研究院、Uber 以及 Argo AI。

作者們的方法並不意外,收集一個新的手繪數據集(真人進行的照片手繪),然後訓練神經網絡。不過與類似研究有所不同的是,作者們收集的是一個一對多的數據集,每張照片可以對應多個真人手繪 ground truth 圖像。所以作者們認為這不應當是在傳統的「優化調節邊緣檢測器」路線上繼續發展,同時直接使用各類現成的 cGAN 也無法帶來理想的表現。作者們提出了一種新的、可以處理多種不同的稀疏輸入的 cGAN 來進行處理。作者們與其它方法進行了定性以及定量的對比。

為了便於視覺理解及簡筆畫生成的後續研究,作者們也一併發布了這個數據集,它由一組組圖像和對應的輪廓簡筆畫組成。數據中含有 1000 張戶外場景的照片,每張照片都有 5 張對應的人類繪製的輪廓簡筆畫(一共 5000 張)。簡筆畫中的筆畫已經與照片中的邊界做過粗略的對齊,便於把人類的筆畫和照片中的邊界對應起來。

數據集是通過亞馬遜眾包平臺 Mechanical Turk 收集的。收集過程中先給參與者展示墊在半透明背景下的照片,然後要求他們在上面用簡筆畫描繪出圖中的邊界。為了獲得高質量的簡筆畫(標註),研究人員們專門設計了一個標註界面,其中含有一個詳細的指導頁面,展示了許多正面和負面例子。標註還會經過人工的質量檢查;內部邊線有缺失的、缺少重要的畫面內容的、手繪的邊界線與原圖有較大出入的、無法識別簡筆畫內容的、簡筆畫中的人物非常糟糕的、在空的部分畫了線,這六類質量不高的圖像都有可能被拒絕。所以實際上,在收集到這 5000 張可用的手繪簡筆畫的同時,研究人員們也獲得了 1947 張質量不高而被拒絕的簡筆畫;這些畫未來可以用作自動質量控制的樣本。

數據集中部分手繪圖像(帶有筆畫方向及順序)

論文摘要:邊界、邊線、輪廓,這三者在計算機圖形學和計算機視覺兩個領域都是重要的研究課題。一方面,它們是表達了三維形狀的二維平面元素;另一方面,它們是互相遮蓋的物體的指示器,我們正是藉助它們才能分辨不同的物體或者語義概念。在這篇論文中,作者們的目標是生成物體輪廓繪畫,也就是類似邊線的筆畫,通過它們勾畫出視覺場景的主要線條。早期的研究中通常把這類任務稱作「邊緣檢測」。然而,邊緣檢測任務的理想輸出中包含的視覺元素與輪廓繪畫之間其實有著不小區別,而且也缺失了輪廓繪畫中的藝術風格。作者們解決這個問題的方式是收集了一個新的輪廓簡筆畫數據集,並提出了一種基於學習的方法來解析不同的標註之間的多樣性;而且與邊緣檢測器不同的是,他們的方法可以在真實照片和手繪素材不完全對齊的情況下工作。相比以往的方法,作者們的方法定型、定量地都取得了更好的表現。令人驚訝的是,當作者們在 BSDS500 數據集上精細調節模型時,他們在突出邊界檢測任務中取得了目前最好的成績,這表明他們的輪廓繪畫可能可以成為邊緣標註的一種可拓展的替代方案,但同時對於標註人員來說更容易做、也更有趣。

項目主頁:http://www.cs.cmu.edu/~mengtial/proj/sketch/

論文地址:https://arxiv.org/abs/1901.00542

P.S. 單獨的手繪圖像技術和數據集可以參見雷鋒網 AI 科技評論往期文章 《谷歌大腦教機器畫簡筆畫,神經網絡的大作都長啥樣?》以及《同濟大學「智能大數據可視化實驗室」開源FaceX,包含500餘萬張卡通人臉表情簡筆畫》

雷鋒網 AI 科技評論報導。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 教師資格證《手繪線條圖像——會說話的圖畫》教案
    課題:手繪線條圖像——會說話的 圖畫領域:造型·表現教學目標:1、知識與技能:認識手繪線條圖像,了解手繪線條圖像的功能、用途和特性,嘗試利用手繪線條進行交流,傳達信息,有個性的表達事物。2、過程與方法:通過搜集手繪線條圖例,學會分析其功能意義與表達的特點,在動手實踐的過程中,學習觀察與表達的方法,提升造型表現能力。3、情感、態度和價值觀:認識學習本課的意義,敢於表達,激發學生熱愛生活和用美術知識為生活服務的願望。教學重點與難點:1、重點:對手繪線條圖像表達的意義、功能的理解。
  • 中影基地電影核心科技新突破——「中影•神思」人工智慧圖像...
    國家一級科技查新工作站在科技查新中得出結論:「在國內外已公開發表的文獻和專利中,未見具有基於利用人工智慧大數據深度學習算法,採用對抗式生成網絡GAN、DenseNet、CycleGAN網絡等技術,開發由解析度提升畫質增強處理單元、標清圖像去場處理單元、圖像數字修復處理單元三大模塊構成,針對圖像處理的不同問題進行海量素材訓練,建立相應數學模型,利用神經網絡最大限度的追求圖像質量,對大批量畫面素材進行自動處理
  • 圖像識別技術落地 探索應用場景
    根據平安證券的《通信行業人工智慧圖像識別專題報告》,圖像識別分為生物識別、物體與場景識別和視頻識別。據估算,到2020年,生物識別技術市場規模將達到250億美元,5年內年均增速約14%。其中,人臉識別增速最快,將從2015年的9億美元增長到2020年的24億美元。       在各式的場景應用中,當下以人臉識別最為普遍,並且機器已經高於人類的識別能力。
  • 為什麼說圖像記憶是高效,快速的記憶方法?
    明明知道圖像記憶是高效的,卻因為害怕暫時痛苦而明知故犯返回機械記憶方法。一個不願意接受新方法帶來剌激的人會永遠掌握不了新方法並且將成為掉隊的人。是的,可能初學者學習將抽像轉換成圖像是有點點困難,但只要我們掌握了圖像記憶的轉換技巧,我們很容易克服並養成新習慣。
  • PDF轉圖片怎麼轉?試試這些快速轉換方法!
    PDF轉圖片怎麼轉?試試這些快速轉換方法!今天小編想和大家一起了解一下PDF文件轉圖片文件是怎麼轉的,也一起試試一些快速轉換方法,希望會給大家帶來一定的收穫。 轉換方法一:使用專業的PDF工具——爍光PDF轉換器 1、打開爍光PDF轉換器,選擇主頁面中的【PDF轉圖片】進入功能頁面。
  • ​淺談設計手繪訓練方法——Mark
    Mark,在這裡給大家淺談一下關於學習手繪的幾個方法,如果有認識我的同學 請刷個評論。接下來由我為大家簡單淺談一下關於學習手繪的幾個方法。甚至有些鳥瞰大場景的推導,因為鳥瞰圖能看到物體的更多個面,就能更全面的理解空間意圖。所以大家在這個過程中也會感受到設計推敲的樂趣,這就是意義所在,打破以往的訓練方法。讓你變得更靈活,當然會有一部分同學在空間推敲中,所推導出來的空間算不上很成熟,但是起碼要注意空間不矛盾,比例不失調。
  • 美圖秀秀推出人工智慧手繪特效 上線第一天超1500萬人使用
    配圖:美圖秀秀「手繪自拍」6種不同風格的特效人工智慧 讓用戶擁有私人專屬手繪大師和Anne一樣鍾愛手繪畫像的用戶不佔少數。近年來,消費者對定製手繪畫像需求量巨大,消費者需要通過向專業畫師付費來定製個人手繪,耗錢又耗時。如今,人工智慧讓繁瑣變得簡單。
  • 如何把PDF轉成圖片?快速掌握PDF轉圖片的方法
    如何把PDF轉成圖片?快速掌握PDF轉圖片的方法 2020年12月16日 09:50作者:黃頁編輯:黃頁
  • 風格遷移新方法:微軟與上海交大提出深度圖像類比技術
    最近這一領域的研究集中於深度卷積神經網絡,除康奈爾大學和Adobe 的真實照片風格轉換以外,UC Berkeley 推出的手繪紋理生成模型也引起了很多人的關注。它們隨著社交媒體的發展而變得廣為人們所知——因為圖片分享是互動的重要組成部分。Prisma 和 Facetune 等應用就成功利用了這種吸引力。來自微軟和上海交大的廖菁等人最近推出了又一種圖像風格轉換方法。
  • 圖像分類:一個更魯棒的場景分類模型
    如何根據圖像的視覺內容為圖像賦予一個語義類別(例如,教室、街道等)是圖像場景分類的目標,也是圖像檢索、圖像內容分析和目標識別等問題的基礎。但由於圖片的尺度、角度、光照等因素的多樣性以及場景定義的複雜性,場景分類一直是計算機視覺中的一個挑戰性問題。本次任務從400萬張網際網路圖片中精選出8萬張圖片,分屬於80個日常場景類別,例如航站樓、足球場等。每個場景類別包含600-1100張圖片。
  • 英語單詞圖像記憶法,帶你快速記住單詞
    那什麼是英語單詞圖像趣味記憶法呢?就是通過一些轉化,把單詞變成圖像的單詞記憶法,具體的方法有:第一種:把單詞的意思變成圖像進行速記這種方法最常用的就是實物名詞和不抽象的動詞,直接給單詞配上意思相關的圖片,來速記單詞。
  • PS轉手繪:分分鐘教會你梁潔的皮膚怎麼轉?
    hi,歡迎來到奇點學堂,很多人希望我錄製一套轉手繪的教程,我就以雙世寵妃2的女主角曲小檀的扮演者梁潔為例,給大家錄製一套轉手繪的教程。細節的話請看視頻,我這裡給大家提煉出要點。人物的轉手繪我們把它分為八個部分,皮膚,嘴巴,鼻子,眼睛,眉毛,頭髮,耳朵,衣服這八個部分,分別講解。今天給大家講解皮膚的轉法,是利用繪圖軟體、圖片處理工具(sai、photoshop等,),將人物或風景照片轉變成類似手繪效果的一種圖片處理方法。
  • 快速圖像分割的SuperBPD方法
    Boundary-to-Pixel Direction for Fast Image Segmentationarxiv.org代碼下載地址:JianqiangWan/Super-BPDgithub.comAbstract本文提出了一種基於超邊界到像素方向的圖像快速分割方法和自定義分割算法
  • PS教程:照片快速轉手繪,學會了真實用,自己製作設計效果圖
    本篇教程,小編就來和大家分享 :如何將照片轉為手稿效果圖,有網店的電商朋友,學會了可以自己動手製作商品手繪推廣圖,感興趣的朋友,跟著小編一步步學著製作吧。工具/材料:電腦、Photoshopcc2019、素材圖片一張方法/步驟:1、打開一張背包素材圖片,按Ctrl+J複製背景圖層,得到圖層1,Ctrl+Shift+U
  • 右腦圖像記憶方法及實踐
    =========================右腦圖像記憶方法及實踐,希望本篇文章對您學習有所幫助。右腦圖像記憶是目前最和乎人類的大腦運作模式的記憶法,它可以讓人瞬間記憶上千個電話號碼,而且可是持久達一個星期之久而不會忘。適當複習可以終身記憶。以兩個圖像來連結, 並用電影畫面來連結如何記憶呢?
  • 手繪動畫製作工具 —— VideoScribe在微課視頻製作中的應用
    為此,需要我們在微課視頻製作中不斷創新,打破固化的微課視頻開發模式,創造性地使用一些新手段、新方法和新工具。基於VideoScribe手繪動畫的形式比較新穎,能夠成為一節微課中吸引觀眾的亮點,故筆者嘗試將其應用於微課視頻製作實踐。
  • 今日Paper|動態圖像檢索;實時場景文本定位;感知場景表示;雙重網絡等
    目錄Sketch Less for More:基於細粒度草圖的動態圖像檢索ABCNet:基於自適應Bezier-Curve網絡的實時場景文本定位通過逐步增加蒙版區域來修復圖像BlockGAN:從未標記的圖像中學習
  • 圖像驗證碼和大規模圖像識別技術
    驗證碼的學名叫做CAPTCHA,是Completely Automated Public Turing test to tell Computers and Humans Apart縮寫,意為「全自動區分計算機和人類的公開圖靈測試」,也就是一種用來區分人類和計算機的方法。通常是由計算機生成一個對人類而言很容易而對電腦而言非常困難的問題,能回答者被判定為人[1]。
  • 復旦大學:利用場景圖針對圖像序列進行故事生成 | AAAI 2020
    該文章認為將圖像轉為圖結構的表示方法(如場景圖),然後通過圖網絡在圖像內和跨圖像兩個層面上進行關係推理,有助於表示圖像,並最終有利於描述圖像。實驗結果證明該方法可以顯著的提高故事生成的質量。人會先分辨出圖像上面有什麼物體,推理他們的關係,接下來把一個圖像抽象成一個場景,然後依次看觀察圖像,推理圖像間的關係。對於視覺敘事這個任務,本文認為也可以採用類似方法。本文認為把圖像轉為一種圖結構的表示(如場景圖),隨後在圖像內(within-image)和跨圖像(cross-image)這兩個層面上建模視覺關係,將會有助於表示圖像,並最終對描述圖片有所幫助。
  • 【英語單詞速記法】圖像記憶法
    第一種:把單詞的意思變成圖像進行速記  這種方法最常用的就是實物名詞和不抽象的動詞,直接給單詞配上意思相關的圖片,來速記單詞。  例子1:train 火車  第二種:把單詞的某幾個字母形象化為圖像來進行速記  這種方法就是通過我們的想像,把單詞的字母想像成具體的形象,並且這個形象和單詞的意思相關。