讓簡筆畫生成逼真人臉!中科院發新AI論文,能用於警察破案

2020-12-09 智東西

智東西(公眾號:zhidxcom)編 | 董溫淑

智東西6月18日消息,近日,中國科學院北京分院的研究團隊研發出一個AI人像生成模型。該模型可以依據簡筆畫生成逼真的人臉肖像。

利用這一模型,沒有繪畫經驗的人也可以很容易地得到逼真圖像。除了用於娛樂,在未來,這個模型或能幫助執法人員進行嫌疑人畫像。

這項研究發表在學術網站arXiv上,論文標題為《深度人臉畫像:從草圖深度生成人臉圖像(DeepFaceDrawing: Deep Generation of Face Images from Sketches)》。今年七月份,這項技術將在計算機圖形學頂會SIGGRAPH會議上展出。

論文連結:https://arxiv.org/pdf/2006.01047.pdf

研究項目官網:http://geometrylearning.com/DeepFaceDrawing/

一、給人臉「分區」,逐塊推理出逼真圖像

現有的「從圖像生成圖像」的技術已經可以實現快速輸出結果。但是,現有解決方案對輸入圖像的要求較高,只有以專業素描畫像等逼真度較高的圖像作為輸入時,才能生成逼真的人臉肖像。

在這種模型中,輸出結果的質量直接受到輸入圖像的影響,即輸出結果受到輸入圖像的「硬約束」。

為了解決這一問題,中國科學院北京分院的研究團隊設計出一種「從局部到全局(local-to-global)」的「軟約束(softconstraint)」方法。總的來說,這一方法基於一個深度學習框架,分為兩步進行。

首先,研究人員把簡筆畫輸入模型。模型依據簡筆畫,推理出人臉上各個器官的「布局」情況。這一步中,模型採用隱式建模(implicitly model)方法建立人臉圖像的形狀空間模型,並學習人臉關鍵部位的特徵嵌入。

模型將人臉分成左眼、右眼、鼻子、嘴唇、臉型這5個關鍵「組件」。

然後,模型依據臉部的「布局」情況,從簡筆畫「倒推」出逼真的人臉圖像。這一步中,模型依據人臉組件樣本的特徵向量,從輸入簡筆畫的相應部分,推理出潛在的人臉組件流形(Manifold)。

對於每一個關鍵部位,模型隱式定義了一個潛在流形。研究人員假設底層組件的流形是局部線性的。模型運行經典的局部性嵌入算法,將簡筆畫人臉特徵的組件投影到其組件流形上。

為了改善信息流,研究人員應用另一個深層神經網絡,使其在上述兩步之間輸出中間結果。這個深層神經網絡通過多通道特徵映射,學習從嵌入組件特徵到逼真圖像的映射結果。

二、60位參與者打分1302次,證實模型輸出結果更逼真

模型搭建好後,研究人員使模型在一臺搭載了一個英特爾i7-7700 CPU和一個NVIDIA GTX 1080Ti GPU、擁有16GB內存的電腦上運行,用17000張簡筆畫和照片進行訓練。訓練結束後,研究人員對模型進行了評估。

研究人員首先用線條不同的簡筆畫作為輸入。結果顯示,不同的線條會導致輸出圖像擁有不同的細節,但輸出圖像其他部分大體上沒有變化。

比如,在下圖中,簡筆畫鼻子部位的線條變化導致輸出圖像整個臉部的光線出現了變化。

然後,研究人員選用現有的全局檢索(global retrieval)模型和組件級檢索(component-level retrieval)模型與本項研究中的「從局部到全局」模型進行了對比。結果顯示,「從局部到全局」模型返回的樣本最接近輸入組件草圖。

▲a-全局檢索模型輸出結果,b–局部檢索模型輸出結果,c-「從局部到全局」模型輸出結果

為了使評估結果更加精確,研究人員進行了一項用戶調查。研究人員選用22張抽象層次不同、粗糙度不同的簡筆畫作為輸入,分別用全局檢索模型、組件級檢索模型、「從局部到全局」模型輸出結果。

共有60名參與者(39男21女,年齡介乎18至32歲)參加了用戶調查。研究人員向每個參與者展示4張照片,其中1張為簡筆草圖、3張為模型輸出的合成圖像。

▲向每個參與者展示4張圖像(左–全局檢索模型輸出結果,中–局部檢索模型輸出結果,右-「從局部到全局」模型輸出結果)

研究人員共得到1320個主觀評價。對這些評價結果的統計結果顯示,參與者普遍認為「從局部到全局」模型的輸出結果更加準確、圖像質量也更高。

輸出結果準確性方面,「從局部到全局」模型平均得分為4.85,局部檢索模型平均得分為4.23,全局檢索模型平均得分為5.37。

輸出結果圖像質量方面,「從局部到全局」模型平均得分為5.50,局部檢索模型平均得分為4.68,全局檢索模型平均得分為3.65。

▲左-輸出結果圖像質量分數,右-輸出結果準確性分數

三、局限性:易出現不兼容問題,缺乏少數族裔樣本

評估結果顯示,「從局部到全局」模型能根據一張人臉簡筆畫,輸出仿真度較高的人臉圖像。但是,論文指出,這一模型還有一些局限性。

將人臉簡筆畫「分區」的方法優勢在於靈活度較高,但也可能帶來各個組件不兼容的問題。這個問題對於眼睛來說尤其明顯。模型「分區」考慮左右眼的策略可能導致輸出圖像的眼睛不對稱。

▲模型輸出結果出現了眼睛不同色的問題

根據論文,引入對稱損失(symmetryloss)或明確規定輸出結果中的眼睛必須來自同一樣本可解決這一問題。

▲明確規定輸出結果中的眼睛必須來自同一樣本

另外,在用於訓練的17000張簡筆畫和照片中,大部分是白種人、南美人的臉,缺乏少數族裔樣本。因此,模型對少數族裔樣本的畫像結果可能會出現失真等問題。

結語:人臉合成技術的價值超出預期

本項研究中,中國科學院北京分院的研究團隊採用「從局部到全局」的方法,設計出一個AI人像生成模型。該模型可以依據一張人臉簡筆畫,輸出逼真的人臉畫像。

根據論文,在未來,研究人員計劃引入側臉簡筆畫、在簡筆畫中增加隨機噪聲等,通過增加訓練數據的規模,使模型輸出圖像結果更準確。

另外,「從局部到全局」模型的官網信息指出,研究人員將很快推出該模型的代碼。這意味著在不久的將來,我們將能看到這個模型的實際應用。

近些年來,基於生成對抗網絡(GAN)的Deepfake技術多次被曝出濫用醜聞,引起了很大爭議。學界和業界一度談Deepfake而「色變」,致力於找出能規避其風險的解決方案。比如,如臉書、亞馬遜網絡服務及其他機構聯合發起了「Deepfake鑑別挑戰」項目。

同樣用到生成對抗網絡,這次中科院團隊研發的模型可以利用簡筆畫生成逼真人像,這既顯示出了現在人臉合成技術的厲害之處,也啟示我們人臉合成技術的價值比想像的更加豐富和超出預期。

參考信源:Engadget、arXiv

相關焦點

  • 讓簡筆畫生成逼真人臉,中科院發新AI論文,能用於警察破案
    智東西6月18日消息,近日,中國科學院北京分院的研究團隊研發出一個AI人像生成模型。該模型可以依據簡筆畫生成逼真的人臉肖像。利用這一模型,沒有繪畫經驗的人也可以很容易地得到逼真圖像。除了用於娛樂,在未來,這個模型或能幫助執法人員進行嫌疑人畫像。
  • 讓簡筆畫生成逼真人臉!中科院放大招,能用於警察破案
    智東西6月18日消息,近日,中國科學院北京分院的研究團隊研發出一個AI人像生成模型。該模型可以依據簡筆畫生成逼真的人臉肖像。利用這一模型,沒有繪畫經驗的人也可以很容易地得到逼真圖像。除了用於娛樂,在未來,這個模型或能幫助執法人員進行嫌疑人畫像。這項研究發表在學術網站arXiv上,論文標題為《深度人臉畫像:從草圖深度生成人臉圖像(DeepFaceDrawing: Deep Generation of Face Images from Sketches)》。今年七月份,這項技術將在計算機圖形學頂會SIGGRAPH會議上展出。
  • 中國科學院研發AI人像生成模型 人臉合成技術超出預期
    原標題:讓簡筆畫生成逼真人臉!中科院放大招,能用於警察破案近日,中國科學院北京分院的研究團隊研發出一個AI人像生成模型。該模型可以依據簡筆畫生成逼真的人臉肖像。利用這一模型,沒有繪畫經驗的人也可以很容易地得到逼真圖像。除了用於娛樂,在未來,這個模型或能幫助執法人員進行嫌疑人畫像。
  • 簡筆畫就能分析出疑犯像?中科院AI生成模型,人臉識別的正確用法
    近日,中國科學院北京分院的研究團隊研發出一個AI人像生成模型。該模型可以依據簡筆畫生成逼真的人臉肖像。這在日常當中,可以被人當作娛樂遊戲來進行消遣,但是其實它有更重要的作用,那就是幫助警察叔叔了解嫌疑犯的面容形象。
  • 新AI技術現身頂會:只需一張大頭照,就能生成逼真3D人臉
    如果只有一張圖片,怎麼創建出一個人逼真的數位化身?在 2020 年計算機視覺與模式識別會議(CVPR)期間,倫敦帝國學院和 AI 面部分析初創公司 FaceSoft.io 的研究人員介紹了一種 「AvatarMe」 技術,該技術能夠僅僅通過一張普通的圖像或照片,就重建逼真的 3D 半身像。
  • ...Social-STGCNN;說話人臉視頻生成;食材圖像合成;光場角度超...
    from=leiphonecolumn_paperreview0305推薦原因現實世界中說話的人臉通常伴隨著自然的頭部運動,但大多數現有的說話人臉視頻生成方法僅考慮具有固定頭部姿勢的人臉動畫。該項工作最大的挑戰是自然的頭部姿態包含平面內外的頭部旋轉,為了解決這個問題,作者重建出3D人臉動畫並將其重新渲染為視頻序列,為了平滑過渡這些視頻的背景圖使得結果更加逼真,作者提出了一個新穎的內存增強的GAN模塊。
  • AI假臉王生成!新一代GAN攻破幾乎所有人臉識別系統,勝率95%
    新智元報導 來源:Arxiv 編輯:文強,三石,大明【新智元導讀】根據一篇針對計算機生成的假臉假視頻DeepFake較為全面測評的論文,現有的先進人臉識別算法在面對計算機生成的假臉時基本束手無策,假臉生成算法和人臉識別軍備競賽已經開始。不過,目前還有些小技巧,可以幫你用肉眼來分辨計算機生成的假臉。
  • SIGGRAPH 2020 | 開原始碼實現從草圖生成人臉
    近日一篇被計算機圖形學頂會 SIGGRAPH 2020 接收的論文提出了一種新的基於草圖深度生成人臉圖像的方法。基於該方法的智能人臉畫板,不需要用戶擁有專業的繪畫技巧,就能夠從粗糙甚至不完整的草圖生成高質量的人臉圖像,並且同時支持對面部細節的編輯與控制。該算法降低了人臉肖像繪製的門檻,同時也減輕專業畫家的工作難度,簡單實用。
  • 中科院開發的一款算法程序可以做到了|硬科技
    近日,中科院北京研究小組就開發了一款算法程序Deep Face Drawing,它可以利用人工智慧來幫助用戶將人像的簡單塗鴉立即轉換為照片肖像。公開研究顯示,這一技術主要是通過構建圖像深度學習模型來實現的。具體來說,研究人員採取了一個從局部再到整體的方法,首先構建了相應的算法模型,並將人臉分成了左眼、右眼、鼻子、嘴、其餘部位這5個關鍵「組件」。
  • 不用GAN,照片生成簡筆畫,效果驚豔
    機器之心報導 機器之心編輯部 如何基本不用GAN把照片生成簡筆畫?這個項目就做到了。 先前,機器之心報導過簡筆畫生成人臉。而 AI 從人臉生成簡筆畫的效果如何呢?
  • 迄今最精準人臉數字模型,任意 2D 照片轉換逼真3維人臉
    編者按:本文由微信公眾號「新智元」(ID:AI_era)編譯,來源:Science、Springer、arXiv,Science 報導作者:Matthew Hutson,譯者:聞菲、弗格森;36氪經授權發布。 倫敦帝國理工學院的研究人員開發了一種新的系統,能自動對各種族、年齡的人臉進行準確的 3D 建模。
  • 太逼真了!英偉達造出新一代GAN,生成壁紙級高清人臉毫無破綻
    慄子 曉查 發自 凹非寺 量子位 報導 | 公眾號 QbitAI不敢相信,上面這些人臉,全都是假的。是英偉達的AI生成的。借用風格遷移的思路,團隊為GAN創造了一種新的生成器。連GAN之父Goodfellow老師也忍不住發推稱讚優秀!這個結構不需要人類監督,可以自動分離圖像中的各種屬性。
  • 研究人員能將簡單的素描轉換成逼真的人像照
    研究人員找到能將簡單線條畫轉換成逼真大頭照的方法。北京中國科學院(Chinese Academy of Sciences,簡稱中科院)研究團隊開發的DeepFaceDrawing,利用AI人工智慧「幫助未經訓練的用戶將粗糙甚至不完整的手繪素描轉換成高品質人像照」。
  • DeepFocus,基於AI實現更逼真的VR圖像
    DeepFocus是一種基於AI的渲染系統,用於在VR中渲染自然逼真的人眼聚焦效果。
  • 基於GAN的「真人捏臉」已上線,照片逼真無死角
    沒錯,雖然GAN能生成逼真的人臉,但距離自己理想的人臉,總有那麼一點不完美——面部表情、臉上皺紋、發質……由於GAN沒辦法進行參數調控,即使人臉再逼真,也沒辦法控制五官等細節。現在,一個新模型GIF (Generative Interpretable Faces)的出現打破了這一定律:不僅能用GAN生成逼真的人臉,而且還能通過具體的參數控制它。
  • WACV 2021 論文大盤點-人臉技術篇
    ,涉及到人臉重建、人臉識別、人臉表情識別、人臉熱成像、人臉屬性編輯以及人臉活體檢測。其中還有 4 個大規模的人臉數據集值得關注。Li單位 | M.U.S.T;中科院自動化所;CVC;百度;西湖大學論文 | https://openaccess.thecvf.com/content/WACV2021/papers/Liu_CASIA-SURF_CeFA_A_Benchmark_for_Multi-Modal_Cross-Ethnicity_Face_Anti-Spoofing_WACV_2021
  • 「計圖」開原始碼:這篇ACM SIGGRAPH論文幫你輕鬆畫出心中的「林妹妹」
    計算機圖形學頂會 SIGGRAPH 2020的一篇論文提出了一種新的基於草圖深度生成人臉圖像的方法。基於該方法的智能人臉畫板,不需要用戶擁有專業的繪畫技巧,就能夠從粗糙甚至不完整的草圖生成高質量的人臉圖像,並且同時支持對面部細節的編輯與控制。該算法降低了人臉肖像繪製的門檻,同時也減輕專業畫家的工作難度,簡單實用。
  • 高逼真度2D照片生成3D人像模型研究AvatarMe
    6月19日青亭網報導,此前我們報導過很多類似的基於2D圖片生成3D模型或3D人像的技術,不過大部分都是支持將人臉部分貼圖到3D模型中。而在近期的CVPR 2020會議上,倫敦帝國學院的一篇論文正在結合AI和機器學習技術,與面部數據分析公司FaceSoft.io研究人員共同發布這個名為「AvatarMe」的機器學習模型。
  • 這種技術能將馬賽克人臉變為高清肖像,但應考慮避免種族歧視丨硬科技
    近日,美國杜克大學科研團隊推出了一款AI工具,能將馬賽克級別的模糊人臉,轉換為以假亂真的高清圖像。這個名叫PULSE的算法,能夠在幾秒內將16x16像素的圖片提升至1024x1024,解析度提升高達64倍。目前該算法僅針對人臉照片,經算法生成的新照片能夠呈現臉上的毛孔、皺紋甚至一縷頭髮。
  • AI驚豔世界的10個瞬間: 10個生成式對抗系統的最佳應用
    這兩個網絡在進行一個持續的遊戲,生成器會一直學習如何能夠成功欺騙分辨器,而分辨器則能逐步增強自己分辨兩種數據的能力。這兩個系統同時接受長期的訓練,終於在百萬次的「對抗」之後,生成器生成的樣本已經和真實的數據幾乎沒有差異。簡單來說,生成器就是一個造假者不斷想要製造虛假的資料,而分辨器則是警察,其職責就是將虛假的資料分辨出來。