基於GANs無監督回歸三維參數化人臉模型

2020-12-16 電子技術應用

三維人臉重建是指通過一張或多張同一個人的照片來構建該人的三維人臉網格。該課題一直是計算機視覺和圖形學的熱門關注焦點,擁有廣泛的應用場景,如人臉身份識別、醫學方案展示、三維人臉動畫等。

在三維人臉重建領域,VETTER T和BLANTZ V在1999年提出的三維人臉參數化模型(3DMM)[1]具有重要意義。3DMM採集了200位實驗對象的臉部雷射掃描數據集,並對該數據集進行主成分分析(PCA)。通過對PCA所提取的基向量進行線性組合從而構成一張新的人臉。

傳統的三維人臉重建基於迭代方法[2],即針對輸入人臉,利用人臉關鍵點,反覆調整基向量的參數使得三維人臉渲染後提取的人臉關鍵點與二維人臉關鍵點接近,以此達到具有輸入人臉特徵的三維人臉網格。然而,該方法較為依賴人臉關鍵點的檢測結果,在人臉姿勢較大或有遮擋物時,效果較差,迭代過程耗時也較長。

近年來,隨著深度學習的不斷發展,越來越多的研究開始運用基於回歸的方法重建三維人臉。然而,在神經網絡的訓練過程中,一個亟需解決的問題便是三維人臉訓練數據稀少。針對這一問題,部分研究提出利用合成數據[3-4],即先隨機初始化3DMM的參數作為參照的三維人臉,而後將該三維人臉投影成的二維人臉作為輸入數據,進而擴大訓練數據集。因為合成數據投影形成的二維圖片不能反映真實世界的複雜度,故GENOVA K[5]提議採用真實圖片及合成圖片的混合數據集進行兩步訓練。TEWARI A[6]利用編碼解碼器結構直接從單張圖片重建三維人臉,解碼器是基於專業知識精心設計的,但可擴展性較低。TRAN A T[7]等人提議利用迭代方法形成的三維人臉作為神經網絡所需的配對三維人臉數據進行訓練。

本文基於前人的思想,提出採用GANs神經網絡回歸3DMM模型參數進行三維人臉重建任務。在解決三維人臉數據稀少問題上,本文提出兩種並列的監督信號:(1)二維監督信號:利用三維人臉投影后的二維人臉與輸入的二維人臉身份差異及皮膚顏色差異,來提供二維層面的監督信號,使得二者相近;(2)三維監督信號:利用重構的三維人臉頂點分布與普遍三維人臉頂點分布差異,來提供三維層面的監督信號,以使得重構後的三維人臉具備真實感人臉形狀。由於僅依賴二維監督信號可能會導致一些重構後三維人臉頂點離正常人臉頂點偏差較大,雖然投影結果依舊初具人臉形狀,仍能被系統識別,但視覺感受卻與普遍人臉形狀相差較大。其原因在於缺少三維監督信號,使得重構後的三維人臉頂點分布近似於普遍三維人臉頂點分布。本文擬採用生成對抗網絡(GANs)[8]來提供三維監督信號,利用生成器及判別器的對抗生成,指引人臉頂點分布接近於真實感人臉頂點分布。

作者信息:

張星星1,李金龍2

(1.中國科學技術大學 軟體學院,安徽 合肥230026;

2.中國科學技術大學 計算機科學與技術學院,安徽 合肥230026)

相關焦點

  • 「技術綜述」基於3DMM的三維人臉重建技術總結
    基於結構光和雷射儀器的三維成像儀是其中的典型代表,我們熟知的iphoneX中的人臉識別就是基於結構光進行三維人臉重建,正因如此才有iphonex中的三維人臉表情包。這些基於儀器採集的三維模型,精度可達毫米級,是物體的真實三維數據,也正好用來為基於圖像的建模方法提供評價資料庫。不過由於儀器的成本太高,一般的用戶是用不上了。
  • 哈工大提出基於光流估計與光照不一致監督的人臉正向化模型
    -正臉之間的特徵對應關係,作為一個強有力的正向化監督信號,進而生成了更加逼真的正面人臉,同時也保留了更多的細節信息,實驗結果表明,本文方法達到了SOTA效果。之前的方法直接最小化生成人臉與ground-truth正面人臉的像素級損失,會迫使網絡同時學習對姿態和光照的轉換,對光照的轉換在一定程度上會干擾前者,本文針對該問題,在正向化過程中保留了輸入側臉的光照信息,使模型更加專注於姿態轉換的學習
  • 解密:人臉檢測關鍵技術
    近來,級聯形狀回歸模型在特徵點定位任務上取得了重大突破,該方法使用回歸模型,直接學習從人臉表觀到人臉形狀(或者人臉形狀模型的參數)的映射函數,進而建立從表觀到形狀的對應關係。此類方法不需要複雜的人臉形狀和表觀建模,簡單高效,在可控場景(實驗室條件下採集的人臉)和非可控場景(網絡人臉圖像等)均取得不錯的定位效果。
  • 入門| 從線性回歸到無監督學習,數據科學家需要掌握的十大統計技術
    這是一種統計推斷的非參數方法。即,重採樣不使用通用分布來逼近地計算概率 p 的值。重採樣基於實際數據生成一個獨特的採樣分布。它使用經驗性方法,而不是分析方法,來生成該採樣分布。重採樣基於數據所有可能結果的無偏樣本獲取無偏估計。
  • 十個生成模型(GANs)的最佳案例和原理 | 代碼+論文
    GANs最先是由蒙特婁大學的Ian Goodfellow提出,已在圖像生成和風格遷移等領域獲得了巨大的成功,充分展示了「無監督學習」技術的潛力。GANs是如何工作的?為了克服這個問題,引入了兩個逆映射,使得每個映射的輸出與另一個映射的輸入相同,從而可利用少量數據來建立一個圖像間儘可能完整的映射關係(即無監督學習)。關於這方面工作的詳細解讀可移步量子位編譯過的「帶你理解CycleGAN,並用TensorFlow輕鬆實現」。以下是這項研究工作的一些實例。
  • 人臉識別技術介紹和表情識別最新研究
    但是由於2D圖像反映二維平面信息,不包含深度數據,不能夠完整的表達出真實人臉模型。相比於二維人臉圖像,三維圖像不受光照等影響,具有更強的描述能力,能夠更為真實的反映人臉信息,在人臉合成、人臉遷移、三維人臉識別等場景中應用。3D人臉識別一般採用深度相機獲取人臉深度信息,主要包括雙目相機,基於結構光原理的RGB-D相機和基於光飛行時間原理的TOF相機。
  • DeepMind爆出無監督表示學習模型BigBiGAN,GAN之父點讚!
    研究人員廣泛評估了BigBiGAN模型的表示學習和生成性能,證明這些基於生成的模型在ImageNet上的無監督表示學習和無條件圖像生成方面都達到了state of the art的水平。這篇論文在Twitter上引發很大反響。GAN發明人Ian Goodfellow說:「很有趣,又回到了表示學習。
  • 今日Paper|3D門控遞歸融合;雙注意力GAN;通用目標檢測器;無監督域...
    目錄用於語義場景完成的3D門控遞歸融合用於大姿態人臉正面化的雙注意力GANUniversal-RCNN:基於可轉移圖R-CNN的通用目標檢測器用於圖像深度估計的無監督域自適應嵌套命名實體識別的神經分層模型用於語義場景完成的3D門控遞歸融合論文名稱:3D Gated Recurrent
  • 參數化設計在工程領域的應用
    參數化設計技術以其強有力的草圖設計、尺寸驅動修改圖形功能,成為初始設計、產品建模及修改系列設計、多方案比較和動態設計的有效手段。    目前,市場上已經有很多成熟的三維設計軟體。這些軟體最大的特點是易學易用、功能強大、連結兼容性好,最顯著的優點在於基於特徵的完全參數化設計方式保證了產品設計的合理性和高效性,直觀反映出產品的真實幾何形狀、代碼,以實現無圖紙加工。
  • 深度學習之視頻人臉識別系列三:人臉表徵
    在該人臉識別模型中分為四個階段:人臉檢測 => 人臉對齊 => 人臉表徵 => 人臉分類,在LFW數據集中可以達到97.00%的準確率。(1)人臉檢測與對齊:該模型使用3D模型來將人臉對齊,該方法過於繁瑣,在實際應用中很少使用,經過3D對齊以後,形成的圖像都是152×152的圖像,具體步驟如下圖。
  • 教程| 無監督學習中的兩個非概率模型:稀疏編碼與自編碼器
    作者:Ruslan Salakhutdinov參與:Smith「無監督學習」(UnsupervisedLearning)現在已經成為深度學習領域的熱點。和「有監督學習」相比,這種方法的最大優勢就在於其無須給系統進行明確的標註(label)也能夠進行學習。
  • GAN用於無監督表徵學習,效果依然驚人……
    該論文提出的方法建立在 SOTA 模型 BigGAN 之上,通過對其表徵學習和生成能力進行廣泛評估,證明這些基於生成的模型在 ImageNet 數據集的無監督表徵學習和無條件圖像生成方面均實現了 SOTA 效果。
  • 換臉新潮流:風靡全球的人臉風格遷移技術引
    文章中使用了一種較為原始的3D模型方案來粗估姿態與光線,並將目標人臉替換至源人臉上。這項技術由於需要人工參與標定關鍵點,主要被應用於圖像編輯等工作。在漫長的學術發展過程中,換臉技術發生了天翻地覆的變化,逐漸衍生出來了基於3D臉部建模,以及對抗生成網絡(GAN) [2]的兩個派系。
  • 「未卜先知」、「自學成才」:GANs奇思妙想TOP10榜單
    生成對抗網絡由兩個相互競爭的神經網絡模型組成,就好比周伯通的左右手。一個神經網絡(生成器)不斷學習怎樣生成新的樣本以欺騙判別器,另一個網絡(判別器)則不斷學習怎樣區別生成樣本數據和真實數據。在百萬輪「較量」後,生成器就可以輸出與真實數據幾乎無差別的樣本。
  • 美圖影像實驗室(MTlab)10000 點人臉關鍵點技術全解讀
    三維形變模型 (3DMM)1999 年,瑞士巴塞爾大學的科學家 Blanz 和 Vetter 提出了一種十分具有創新性的方法——三維形變模型 (3DMM)。三維形變模型建立在三維人臉資料庫的基礎上,以人臉形狀和人臉紋理統計為約束,同時考慮了人臉的姿態和光照因素的影響,生成的人臉三維模型精度較高。
  • 人工智慧之回歸模型(RM)
    回歸不是單一的有監督學習技術,而是許多技術所屬的整個類別。回歸分析:回歸模型重要的基礎或者方法就是回歸分析。回歸分析是研究一個變量(被解釋變量)關於另一個(些)變量(解釋變量)的具體依賴關係的計算方法和理論,是建模和分析數據的重要工具。回歸分析是用已知樣本對未知公式參數的估計,給出一個點集D,用一個函數去擬合這個點集,並且使得點集與擬合函數間的誤差最小。
  • 基於新的膚色模型的人臉檢測方法
    0 引言 人臉檢測一直是一個研究熱點,它涉及到模式識別、圖像處理、計算機視覺以及神經網絡等許多交叉學科,在數字視頻處理、視覺監測等方面有著重要的應用價值
  • CVPR 2018:阿里提出應用 LocalizedGAN 進行半監督訓練
    有了基於Graph的流型,我們就可以建立一個分類模型:它輸出的分類標籤在相似樣本上具有最小的變化。這個就是一種平滑性的假設,是基於圖的半監督方法的核心假設。上圖:基於圖的流型表示和半監督分類。儘管這種基於圖的半監督方法取得了很大的成功,但是它的缺點也是很明顯的。當數據點數量非常巨大的時候,構建這樣一個Graph的代價會非常大。
  • 基於貝葉斯推斷的回歸模型(理論篇)| 機器學習你會遇到的「坑」
    傳統樸素貝葉斯的局限在上一篇《基於貝葉斯推斷的分類模型》中,我們詳細討論了樸素貝葉斯的細節,但拓展時會出現兩個問題: 屬性值由離散變為連續,屬性的類條件概率將變得無法計算(因為每個屬性值可能只出現一次)。