從歐巴馬假視頻到ZAO,換臉和人臉檢測技術發生了什麼?

2021-01-15 機器之心Pro

選自Medium

作者:Ajinkya Khalwadekar

機器之心編譯

參與:Panda、蛋醬

這是一篇不錯的人臉操縱和檢測技術綜述文章,結構和邏輯清晰。機器之心進行了摘要編譯,希望能夠幫助大家一覽該領域的發展過程。

論文地址:https://arxiv.org/pdf/2001.00179v1.pdf

大規模公共數據集的免費獲取和深度學習技術(尤其是 GAN)的快速發展,導致以假亂真的內容大量出現。在假新聞時代,這些偽造內容對社會產生了一定的影響。

本文對人臉圖像操縱技術進行了全面的綜述,包括 DeepFake 方法以及檢測此類操縱技術的方法。具體而言,本文綜述了四種人臉操縱類型:整張人臉的合成、換臉(DeepFake)、人臉屬性操縱和人臉表情操縱。

對於每種人臉操縱類型,本文詳細介紹了其相關的人臉操縱技術、現有的公共資料庫,以及用於評估人臉操縱檢測方法的重要基準,包括對這些評估結果的總結。

在本文提及的多個可用資料庫中,FaceForensics++ 是最常用於檢測人臉身份轉換(即「換臉」)和人臉表情操縱的資料庫之一,基於該數據集的操縱檢測準確率在 90-100% 範圍內。

此外,本文還討論了該領域的發展趨勢,並對正在進行的工作進行了展望,如近期宣布的 DeepFake 檢測挑戰賽(DFDC)。

引言

近期,通過數字操縱(尤其是 DeepFake 方法)生成包含人臉信息的假圖像和假視頻,已成為公眾關注焦點。

「DeepFake」是一項基於深度學習的技術,通過把圖像或視頻中的人臉換成另一個人的臉,來創建假圖像/視頻。

該詞最早出現於 2017 年底,一位名為「deepfakes」的 Reddit 用戶開發了一種機器學習算法,該算法可將名人的人臉換到色情視頻中。除了偽造的色情作品以外,還有一些殺傷力更強的假內容應用方式,比如假新聞、金融詐騙等。

因此,原本專注於通用假圖像和假視頻檢測的研究領域重新煥發了生機,轉而將更多的精力放在如何檢測圖像和視頻中的人臉操縱上。研究者對人臉操縱檢測領域的諸多努力是基於有關生物特徵識別反欺騙的先前研究和數據驅動的現代深度學習技術展開的。學術頂會上相關研討會的數量越來越多,NIST 和 Facebook 又分別主辦了 MFC2018 和 DFDC 等競賽,這些都表明社區對假人臉檢測的興趣不斷增長。

之前,因缺乏複雜編輯工具和領域專業知識、操作過程複雜且耗時,人臉操縱的數量和逼真度受到了局限。例如,該領域的早期研究《Video Rewrite: Driving Visual Speech with Audio》利用不同的音軌修改說話人的嘴唇運動(具體是通過將音軌的聲音和說話人的人臉形狀連接起來實現的)。

而現在,自動合成並不存在的人臉或者操縱圖像或視頻中的真實人臉變得更加容易,這取決於以下幾個因素:1)大型公共數據的可獲取;2)深度學習技術的進化(這免除了人工編輯步驟)。

《Synthesizing Obama: Learning Lip Sync From Audio》展示了之前技術的進化版,該研究生成了高質量的歐巴馬演講視頻,目標視頻中歐巴馬原本的發言已被改變。

現在,最逼真的人臉操縱技術已經取代了上述研究所使用的方法,它們將 CNN 與 GAN 結合起來。因此,ZAO 和 FaceApp 等開源移動應用的發布,使得任何人都可以創建假圖像和假視頻。研究社區對這些日益複雜和逼真的操縱內容作出了回應,目前他們正付出巨大努力來改進人臉操縱檢測方法。

本文對人臉操縱及檢測技術進行了綜述,首先我們來看人臉操縱的類型。

人臉操縱的類型

根據操縱的級別,人臉操縱技術可分為四類:人臉合成、換臉、人臉屬性操縱和人臉表情操縱,參見下圖 1:

圖 1:每個人臉操縱類別的真假圖像示例。

接下來我們按照從高級到低級的順序,介紹這四種人臉操縱類型:

人臉合成:通常利用強大的 GAN(如近期的 StyleGAN 方法)創建完全不存在的人臉。這些技術獲得了驚人的結果,其生成的高質量人臉圖像栩栩如生。圖 1 展示的人臉合成樣本即通過 StyleGAN 生成;換臉:即將一個人的臉換成另一個人的臉。該領域通常採用兩種不同的方法:1)經典的計算機圖形學技術,如 FaceSwap;2)新型深度學習技術 DeepFake,如近期的移動應用 ZAO;人臉屬性操縱:即修改人臉的某些屬性,如發色、膚色、性別、年齡、是否戴眼鏡等。該操縱過程通常使用 GAN 完成,如 StarGAN。該類型的典型示例是流行的移動應用 FaceApp;人臉表情操縱:即修改人臉表情,如將一個人的面部表情遷移到另一個臉上。最流行的技術之一是 Face2Face,該技術可實時進行。近期方法展現出巨大潛力,可以生成高質量的視頻,上述視頻中人物(如歐巴馬)的發言已被改變。

人臉合成

相關的操縱技術和公共資料庫

下表 1 總結了人臉合成研究中主要使用的公共資料庫。必須強調的是這些資料庫中不包含真實人臉圖像樣本。該領域研究者通常使用常見公共資料庫中的真實人臉圖像來訓練系統,如 CelebA [23]、FFHQ [19]、CASIA-WebFace [24] 和 VGGFace2 [25]。

表 1:人臉合成領域的公共可用資料庫。

這部分介紹的相關操縱技術是 StyleGAN 和 ProGAN,此處不再贅述,讀者可參考以下文章:

英偉達再出 GAN 神作!多層次特徵的風格遷移人臉生成器

NVIDIA 新作解讀:用 GAN 生成前所未有的高清圖像(附 PyTorch 復現)| PaperDaily #15

操縱檢測

近期多項研究評估了檢測人臉合成操縱的難度。下表 2 對比了該領域中最相關的方法。每項研究包含特徵、分類器、最優性能和資料庫這些信息。

表 2:人臉合成領域中,不同當前最優檢測方法的對比情況。粗體字表示每個公共資料庫上的最優結果。斜體字表示原始研究中未提供此結果。AUC 表示曲線下面積,Acc. 表示準確率,EER 表示等誤差率。

換臉

相關的操縱技術和公共資料庫

「換臉」是目前最流行的人臉操縱技術之一。與僅考慮圖像的人臉合成操縱不同,換臉通常涉及視頻的真偽。下表 3 總結了這類人臉操縱技術目前可用的公共資料庫。我們可以看到,資料庫中通常包含真假視頻。其中最常用的資料庫是 FaceForensics++。

表 3:換臉領域中的公共可用資料庫。

如上表所示,這部分介紹的操縱技術包括 faceswap-GAN、FaceSwap、DeepFake 等。以下是部分方法的 GitHub 地址:

faceswap-GAN:https://github.com/shaoanlu/faceswap-GANFaceSwap:https://github.com/MarekKowalski/FaceSwapDeepFake:https://github.com/deepfakes/faceswap

操縱檢測

檢測換臉操縱的新方法在不斷進化,成為研究最廣泛的人臉操縱類型之一。下表 4 對比了該領域中最相關的檢測方法。每項研究包含特徵、分類器、最優性能和資料庫這些信息。

表 4:換臉領域中,不同當前最優檢測方法的對比。粗體字表示每個公共資料庫上的最優結果,斜體字表示原始研究中未提供此結果。FF++ 表示 FaceForensics++ 數據集,AUC 表示曲線下面積,Acc. 表示準確率,EER 表示等誤差率。

人臉屬性操縱

相關操縱技術和公共資料庫

儘管基於 GAN 的框架在通用圖像轉換和操縱方面取得了巨大成功,但具體到人臉屬性操縱領域,卻幾乎沒有公開可用的資料庫。其主要原因在於大部分 GAN 方法的代碼已開源,研究者可以基於開原始碼輕鬆生成想要的假圖像資料庫。本文作者表示,目前人臉屬性操縱領域的公共資料庫只有 DFFD [7],該資料庫包含由 FaceApp 和 StarGAN 方法分別生成的 18,416 和 79,960 張假圖像。

這部分按照從遠到近的順序介紹該領域的 GAN 方法,並提供了 GitHub 地址,如下所示:

Invertible Conditional GANs (IcGANs):https://github.com/Guim3/IcGANFader Networks:https://github.com/facebookresearch/FaderNetworksStarGAN:https://github.com/yunjey/stargan/blob/master/README.mdattGAN:https://github.com/LynnHo/AttGAN-TensorflowSTGAN:https://github.com/csmliu/STGAN

操縱檢測

人臉屬性操縱最初是人臉識別領域的研究課題,旨在查看生物識別系統對物理因素(如整形、化妝或遮擋)的穩健性。但是,近期 FaceApp 等移動應用的成功改變了這種情況。它促使研究社區轉而研究對人臉屬性操縱的檢測技術。

下表 5 對比了該領域中最相關的方法。每項研究包含特徵、分類器、最優性能和資料庫這些信息。

表 5:人臉屬性操縱領域中,不同當前最優檢測方法的對比。粗體字表示每個公共資料庫上的最優結果。AUC 表示曲線下面積,Acc. 表示準確率,EER 表示等誤差率。

人臉表情操縱

相關操縱技術和公共資料庫

目前人臉表情操縱領域唯一可用的公共資料庫是 FaceForensics++,它基於 FaceForensics 擴展而成。

這部分介紹了 Face2Face、NeuralTextures、InterFaceGAN、UGAN、STGAN、AttGAN 等人臉表情操縱技術,詳情參見原論文。

操縱檢測

《Synthesizing Obama: Learning Lip Sync From Audio》促進研究者開發針對人臉表情操縱的新型檢測技術。該研究展示了技術如何合成高質量的人物視頻(該案例中人物是歐巴馬),並改變視頻中人物的發言內容。該研究令人震驚的結果促使研究社區開發穩健的檢測技術。

下表 6 對比了該領域中最相關的方法。每項研究包含特徵、分類器、最優性能和資料庫這些信息。

表 6:人臉表情操縱領域中,不同當前最優檢測方法的對比。粗體字表示每個公共資料庫上的最優結果。FF++ 表示 FaceForensics++ 數據集,AUC 表示曲線下面積,Acc. 表示準確率,EER 表示等誤差率。

GAN 在圖像和視頻合成領域的結果頻頻令人震驚,讓我們不由感嘆了解 GAN 方法的速度趕不上它們出現的速度。想要追蹤更多 GAN 方法,可以參觀 GAN Zoo:https://github.com/hindupuravinash/the-gan-zoo。

相關焦點

  • 換臉新潮流:風靡全球的人臉風格遷移技術引
    背景人臉屬性編輯是計算機視覺領域的一項重要技術,廣泛用於內容生產,電影製作,娛樂視頻中。早期的人臉屬性編輯主要集中在人臉的表情上,比如通過修改張嘴或者閉眼來體現人的喜怒哀樂。文章中使用了一種較為原始的3D模型方案來粗估姿態與光線,並將目標人臉替換至源人臉上。這項技術由於需要人工參與標定關鍵點,主要被應用於圖像編輯等工作。在漫長的學術發展過程中,換臉技術發生了天翻地覆的變化,逐漸衍生出來了基於3D臉部建模,以及對抗生成網絡(GAN) [2]的兩個派系。
  • 血氧檢測新玩法,識別AI視頻換臉,準確率高達97%
    像常見的脈搏血氧儀和 Apple Watch 上的血氧檢測都是採用這個原理。同樣的顏色變化也會發生在臉部。只是這種變化極為微弱,肉眼是無法直接看到的,更別說通過視頻看出這種變化。但是如果對視頻進行特定的處理後,增強顏色的變化效果後,臉部顏色的變化就可以通過肉眼非常明顯地觀察出來了。
  • 換臉App背後的恐慌:我的臉什麼時候會被偽造,又該如何辨別?
    誰能想到,全民換臉的時刻這麼快就來臨了。在一夜之間,朋友圈幾乎被ZAO刷屏,親朋好友們紛紛用自己的臉換上了電影明星的臉,「上演天下好戲」。這種以假亂真的換臉視頻技術,其實已經不是什麼新鮮事了。值得注意的是,像Deepfake和FakeApp這樣的技術和程序已經有很多了。由德國研究人員開發的Face2Face,能實時捕捉人的面部圖像,並將其移植到另一個視頻中。
  • 趣味換臉APP 《臉優》可錄製20秒小視頻
    《臉優》可錄製最長20秒鐘的小視頻或者拍攝換臉之後的照片,界面中有個小小的調色按鍵,開啟後可讓顏色飽和度更高,看上去更鮮豔一些。錄製視頻的過程當中支持隨時更換其它人臉,但目前不支持其它美化效果。
  • Deepfake陰影下的「人臉識別時代」全面到來!我們可能遭遇什麼危險?
    (生成對抗網絡技術生成深度偽造視頻原理)自2017年以來,深度偽造技術開始活躍在網絡中,隨著這一技術算法的日趨成熟,到如今,無論是人像還是聲音、視頻都可以被偽造或合成,並可達到幾乎不能辨別真偽的程度,並開始引發諸多社會問題,人臉識別也面臨被欺騙的考驗。
  • 0.5元可買到匹配身份的人臉數據 AI「換臉」究竟有多危險?
    AI「換臉」你玩過嗎?隨著圖像處理和人工智慧技術的發展,不少「換臉」應用走紅網絡。只要動動手指,就可以將自己的臉替換成明星或是朋友的臉。然而,AI「換臉」給人們帶來歡樂的同時也造成了隱患。有不法分子藉此製作虛假視頻詐騙錢財、利用換臉方式侵害他人肖像權……新技術帶來的新挑戰,給人們敲響了警鐘。
  • 微信封殺 AI 換臉 ZAO,網頁顯示存在安全風險
    9月2日消息,近日一款名為 ZAO 的換臉軟體一夜爆紅,刷屏了各大社交媒體,最初刷屏的內容是該軟體生成的換臉視頻,而後來刷屏變成了各種安全威脅,比如支付寶人臉支付、ZAO軟體強勢的用戶協議。對於強勢的用戶隱私協議,ZAO 方面緊急修改協議並回應質疑,表示用戶內容不會用作他用,ZAO 在用戶隱私協議中增加了特別提示「用戶使用ZAO生成的內容,ZAO將僅用於修改並生成新短視頻,除非獲得用戶再次同意
  • 財經問道丨AI時代 如何破解「眼見為假」
    編者按「Deepfake」(深度偽造)技術的開源,讓AI「換臉」一時大興其道。隨著這一技術算法的日趨成熟,無論是人像還是聲音、視頻都可以被偽造或合成,甚至可以達到不能辨別真偽的程度。由此,諸多社會問題開始引發。AI造假能做到什麼程度,虛假音視頻又該如何控制,AI造假檢測技術能否成為「深度偽造」這場技術困境突圍的最佳解決方案之一?
  • 人臉識別主要依靠了基於圖像的空間邊緣檢測技術
    ai換臉技術引起很多人的擔憂,怕外貌損害。這次任性哥帶你回歸本源,用人臉識別,再現青澀年華,你也可以擁有金融界鼻祖級的辨識力。最近我們也在研究人臉識別這個方向,今天就針對這個做個簡單的介紹。什麼是人臉識別?
  • 百度大腦領先活體檢測+合成圖鑑別 讓人臉「照片活化」無從遁形
    有人通過「換臉」技術進行色情視頻生成、虛擬政治人物講話等,造成嚴重不良影響;更有黑產使用人臉「黑科技」非法牟利。近日,各大媒體紛紛報導的人臉「照片活化」,便是黑產對個人身份信息造成洩露危害的新技術手段。據調查了解,黑產賣家出售的「照片活化」工具,可將人臉照片修改為執行「眨眨眼、張張嘴、點點頭」等操作的人臉驗證視頻。
  • 【今日學術】通用的換臉模型FSGAN以及驚豔的人臉修復模型SC-FEGAN
    FSGAN: Subject Agnostic Face Swapping and ReenactmentInternational Conference on Computer Vision (ICCV), Seoul, Korea, 2019Github: https://github.com/YuvalNirkin/fsganFSGAN,主要用於換臉和重新制定
  • AI換臉視頻讓人真假難辨,新技術用AI來識破它
    border-style: initial; border-; vertical-align: middle; max-width: 50%; display: block; margin: 0px auto; ; ;Microsoft YaHei", 微軟雅黑, sans-serif; text-align: start;" />網易科技訊 7月14日消息,據國外媒體報導,利用Deepfake換臉技術製作的假視頻足以亂真
  • 因數據安全問題被約談,換臉App「ZAO」還能燥起來嗎?
    抖音能夠吸引海量用戶的其中一個原因,就是做到了技術降維,降低使用門檻。曾經有一位模特博主在分享視頻時稱,選擇抖音的原因就是「操作簡單」。相比b站等視頻網站,在抖音不需要用戶掌握太多的剪輯技術,平臺還自帶了很多配樂,特別方便。 引發現象級刷屏的另一個原因是用戶的「獵奇心」。從各種美顏到捏臉,人們始終對「在臉上做文章」這件事樂此不疲。
  • AI換臉調查:淫穢視頻可定製女星 700部百元打包賣
    來源: 新京報新京報記者近日調查發現,隨著AI技術走紅以及門檻降低,售賣明星換臉的淫穢視頻已經成為一門地下生意。百度貼吧中部分標榜「換臉+女明星姓名」的發帖者,售賣通過AI換臉技術合成的視頻,價格可4元一部,也可158元打包購買700部視頻。而多位知名女明星頻被提及。此外,新京報記者注意到,閒魚上還有賣家提供「定製換臉」服務。
  • 0.5元可買到匹配身份的人臉數據,「換臉」有危險
    隨著人工智慧技術的發展,加之圖像處理技術,一些「換臉」應用迅速走紅網絡。然而,AI「換臉」卻存在著不少隱患。某些電商平臺以0.5元每份的價格出售匹配了身份信息的人臉數據。據業內相關人士表示,利用人工智慧技術將照片進行活化就可以做出模擬真人的點頭、搖頭、眨眼、說話等行為,極易被一些不法分子用作辦理網貸或實施精準詐騙。
  • 人臉識別技術和產業風險凸顯 需構建相應的監管機制
    作者:劉秋娜「你是什麼垃圾?」這樣的靈魂拷問,或許將被人工智慧技術終結。今年8月,一款名為「火星男孩」的智能廚餘垃圾分類機出現在長沙市嶽麓區望城坡街道長華社區。居民掃描人臉後,可將垃圾放到拍照處識別,若垃圾識別成功,垃圾桶開啟,完成垃圾分類。
  • 10秒跟明星換臉?這款AI換臉軟體一夜走紅!但用戶協議你看了嗎
    清朗天空感受法治新生態近日,一款名為「ZAO」的換臉軟體在朋友圈刷屏。據了解,ZAO使用AI技術,用戶只需要一張正臉照,就可以替換為影視作品或者小視頻中的人物,生成以自己為主角的視頻片段。換臉軟體「ZAO」一夜爆紅「ZAO」是一款使用AI技術換臉的軟體,據它的應用介紹,只需一張正面照,就可以玩轉所有表情包和經典影視片段,讓你過足戲癮。用戶註冊完成後,系統會提示你選擇一張圖片——在你的相冊中,很多照片不清晰或者非正臉的照片都被系統否決的,不允許上傳。在選擇完照片後,APP還會要求你進行一項特殊的操作——肖像驗證。
  • 人臉識別雙目模組自助機應用活體檢測
    我們來講一下關於人臉識別雙目模組自助機應用活體檢測的問題。人臉識別是基於人的臉部特徵信息系統進行身份識別的一種生物識別技術,傳統的面部識別技術具有基於可見光圖像的人臉識別,現在使用的是基於主動近紅外圖像的多光源人臉識別技術。
  • 人臉識別時代,我們該如何保護自己的隱私?
    人們刷臉支付、刷臉安檢、刷臉入住酒店……幾乎時時處處都要把臉推到前臺,但是頻繁刷臉背後是否存在安全隱患,我們的「臉」有沒有被盜用或濫用,到底應該如何在享受便利的同時保護自己的「臉」。凡此種種,都成為生活在人臉識別時代的我們需要關注的問題。「新技術總會有安全問題,人臉識別本身為生活提供了便利,而它最大的風險在於信息洩露。」
  • 黑科技DeepFake,上線五天就遭全球唾棄,這技術到底有多邪惡?
    但2017年橫空出世的一項技術遭遇卻徹底打破了這個規律,這就是全球追捧卻被瞬間打入冷宮的DeepFake技術!DeepFake到底是什麼技術,為何會遭全球唾棄?DeepFake到底是什麼技術?這愛因斯坦如假包換,如果他說的不是新冠病毒的話,連種花家都要信了!對了,這就是DeepFake所展現的超級換臉技術,配合製作者高超的視頻特效手法,復活名人、以假亂真不過是雕蟲小技而已!