古有照妖鏡,今有換臉識別機,微軟 CVPR 2020力作,讓偽造人臉無處...

2020-12-22 雷鋒網

前些日子,Deepfake技術現身印度選舉,被候選人用在了競選拉票的宣傳材料上。雖然此候選人以慘敗而收場,但這意味著Deepfake點燃的AI換臉之火有逐漸升溫的跡象。

雖然愈演愈烈,但是反Deepfake的相關技術一直相對缺乏。近日,微軟亞洲研究院提出了一種檢測換臉圖像的方法 Face X-Ray。

(雷鋒網(公眾號:雷鋒網)

此項技術發表在論文《Face X-Ray for More General Face Forgery Detection》中,據研究人員在相應的論文中指出,此類工具有助於防止換臉圖像被濫用。

這項技術與現有方法不同,它能夠準確檢測「未知」圖像,即不論什麼算法合成的,在不進行針對性的訓練的情況下也可以進行檢測。

生成訓練樣本概述

更為具體的是它會生成灰度圖像,顯示給定的輸入圖像是否可以分解為來自不同來源的兩個圖像的混合。畢竟,大多數操作換臉的方法,都是將生成的圖片和已有的圖片結合。

這也就是說Face X-Ray不光能判斷是否是合成圖片,還能指出哪個地方是合成的,即兼備識別+解釋兩種功能。

(雷鋒網)如上,下面一張圖顯然是合成的。

算法的核心思想是識別每一幅圖像的獨特標記。這些標記產生的原因很多,可能來自算法等軟體因素,也有可能來自傳感器等硬體因素。

此算法與市面上一些二分類換臉檢測相比,Face X-Ray更能有效地識別出未被發現的換臉圖像,並能可靠地預測混合區域。

(雷鋒網)與二分類檢測器實驗對比結果



但是論文中也指出,這個方法依賴於一個混合步驟,因此可能不適用於完全合成圖像,可能被對抗性樣本騙過。


一、相關工作

假臉技術日新月異,很多算法能夠合成圖片,而且合成的圖片越來越逼真,這意味著偽造的圖片可能被亂用,所以研究換臉檢測技術非常重要。

此類的檢測技術,學界已有研究,不過大多都是「二分類」檢測方法,雖然也能達到98%的準確率,然而這些檢測方法往往會受到過渡匹配的影響,也就是說在處理不同類型的圖片時,檢測方法的性能會顯著下降。

更為具體一點,能區分真人和照片的技術叫做liveness detection,中文叫做「活體取證」。當前的技術主要是根據解析度、三維信息、眼動等來區分,因為翻拍的照片解析度比直接從真人上採集的照片在質量、解析度上有差別。

而對於視頻欺騙,根據三維信息、光線等來區分。

對於具體的應用,谷歌曾經推出一款照片打假神器名為 Assembler,具有 7 個檢測器(detectors),其中 5 個由美國和義大利的大學研究團隊開發,分別負責檢測經不同類型的技術處理過的照片,例如合成、擦除等。

而另外兩個檢測器由 Jigsaw 自己的團隊開發,其中一個旨在識別deepfake,也就是這兩年引起熱議的AI 換臉,該檢測器使用機器學習區分真人圖像和 StyleGAN 技術生成的 deepfake。

對於假圖片,標出可能拼接的區域。而Face X-Ray方法可以針對合成圖片的共性:圖片拼接,即一張圖片和另一張圖片混合。檢測圖片可能存在的混合區域,分析差異,找到圖片標記,從而判斷是否是合成圖片。

二、Face X-Ray算法詳情

典型的換臉合成方法包括三個階段:

1、檢測面部區域;

2、合成期望的目標面部; 

3、將目標面部融合到原始圖像中。

現有的對面部合成圖像檢測通常面向第二階段,並基於數據集訓練有監督的每幀二進位分類器。這種方法可以測試數據集上實現近乎完美的檢測精度,如果遇見訓練時沒見過的換臉圖像,性能會出現明顯下降。而Face X-Ray的關鍵步驟是從圖像中獲取標記數據,然後用「自監督」的方式訓練框架。

值得一提的是這裡的自監督是打引號的,不同於傳統的自監督定義,這裡的無監督是指不從換臉資料庫裡訓練算法。前面也提到,圖片的標記主要來自兩個方面,硬體和軟體。在正常的圖像中,硬軟體產生的標記一般是具有「周期性」或者是均勻的。一旦圖像改變,就會打破這種均勻,因此可以利用標記判斷是否是合成圖片。具體到算法層面,對合成圖像定義如下:

公式1

⊙表示逐個元素相乘,IF表示一種提供面部屬性的圖像,IB代表提供背景的圖,M是分隔被操縱區域的掩碼(the mask delimiting the manipulated region),其每個像素的灰度值在0.0和1.0之間。

公式2

如上將Face X-Ray定義為圖像B,然後如果輸入的是合成圖像,那麼B會顯示混合區域,如果輸入的是真實圖像,那麼會B對於所有像素來說是0。

本質上來講,Face X-Ray的目的是將圖像分解為兩個不同來源的圖,畢竟不同來源的圖像有些細微的差異人眼無法發現,而計算機可以。

換句話說Face X-Ray是一種發現圖像差異的計算表示,它只關心混合邊界。

然後到了「自監督」學習模塊。這一部分的難點在於解決如何僅用真實的圖片獲取相應的訓練數據。主要分為3個部分。

1.給定一個真實圖像,然後尋找另一個圖像作為真實圖像的變體。使用face landmarks作為匹配標準,並根據歐式距離進行搜索。

2.生成掩碼劃定「偽造」區域。

3.通過上述第一個公式得到混合後的圖像,然後根據第二個公式得到混合邊界在實踐中,會隨著訓練過程進行動態生成標籤數據,並以自我監督的方式訓練框架。所以,僅僅在真實圖像層面上進行操作就可以產生大量的訓練數據。

在訓練過程中,由於深度學習具有極強的表徵學習能力,所以研究人員採用了基於卷積神經網絡的框架。其中輸入為圖像,輸出為Face X-Ray,然後基於預測的Face X-Ray,輸出一個圖像是否真實的混合概率。另外,對預測採用的是廣泛使用的損失函數。對於Face X-Ray,採用交叉熵損失來衡量預測的準確性。總的來說,Face X-Ray不需要依賴於與特定人臉操作技術相關的偽影知識,並且支持它的算法可以在不使用任何方法生成假圖像的情況下進行訓練。

三、實驗

在實驗部分,研究人員在Face Forensics++和另一個包含由真實圖像構建的混合圖像的訓練數據集上訓練了Face X-Ray,訓練只採用資料庫裡的「真圖」,不使用假圖。其中,Face Forensics++是一個包含1000多個用四種最先進的面部操作方法操作的原始剪輯的大型視頻語料庫,包括DeepFake、Face2Face、Face Swap、NeuralTextures。

在測試部分評估了Face X-Ray使用四個數據集的泛化能力。這四個數據集包括:Face Forensics++、Deepfakedetection、Deepfake Detection Challenge、celeb-DF。

泛化能力評估

首先使用與Xception相同的訓練集和訓練策略來評估Face X-Ray檢測模型。為了得到準確的Face X-Ray圖像,將真實圖像作為背景,將換臉的圖像作為前景,給出一對真圖像和假圖像。為了公平比較,還給出了二元類的結果。結果如下圖所示:

泛化能力評價,在未知的換臉檢測中,僅使用分類器會導致性能下降。

另外,也對泛化能力進行了改進,其改進主要來自兩個部分:1.建議檢測Face X-Ray而不是操作特有的偽影。2.從真實的圖像中構建大量的訓練樣本。結果顯示僅使用自監督數據,也能夠達到很高的檢測精度。

未知數據集的基準結果

從最近發布的大規模數據集上測試,然後從AUC、AP和EER三個方面給出結果。如下圖所示框架比基準的性能更好。如果使用其他的換臉圖像,即使與測試集有不同的分布,性能也會有所提高。

下圖給出了各種類型的換臉圖的視覺示例,通過計算偽面與真實圖像之間的差異,然後轉化為灰度,進行歸一化之後從而獲得基本事實。如下圖所示,預測Face X-Ray能夠較好的反映事實。

算法預測出的融合邊界

與現在的工作進行對比

最近的一些相關工作也注意到了泛化問題,並在一定程度上試圖解決這一問題。FWA還採用了一種自我監督的方式,從真實圖像中創建負片樣本。然而,它的目標只是描述只存在於DeepFake生成的視頻中的面部扭曲偽影。

Table3~Table5為圖示,請自動忽略Table6

上表中的其他工作都試圖學習固有表示,以及同時進行MTDS學習檢測和定位。進過比較Face X-ray有超過了現有的SOTA。

對擬議框架的分析(Analysis of the proposed framework)

自監督數據生成中數據增強的總體目標是提供大量不同類型的混合圖像,以使模型具有檢測各種篡改圖像的能力。

在這部分,作者研究了兩個重要的增強策略:a)掩模變形,其目的是給Face X-Ray的形狀帶來更大的變化;b)顏色校正,以產生更逼真的混合圖像。這兩種策略對於產生多樣化和高正確度的數據樣本是至關重要的,這些數據樣本對網絡訓練也產生了幫助。

另外,在自監督數據生成過程中,採用了相位混合的方法,使用不同類型的混合來構建測試數據,並在使用alpha混合構建訓練數據時對模型進行評估。結果如下圖所示

One More Thing

Face X-Ray對於「半合成」圖像有奇效,但是也有兩個局限性,第一是對於純合成的圖片,由於標記無法有效識別,所以FaceX -Ray無法攻克。這也就是前面說的:「這個方法依賴於一個混合步驟,因此可能不適用於完全合成圖像」。

第二個局限是如果有人專門針對此算法訓練對抗樣本,那麼也有可能Face X-Ray也有可能失效。

另外,和其他換臉檢測技術一樣,此技術對圖像解析度敏感,如果圖片解析度較低,那麼Face X-Ray檢測率也會較低。

左:郭百寧。右:陳棟

針對此項研究,AI科技評論也專門採訪了微軟亞洲研究院常務副院長郭百寧和微軟亞洲研究院高級研究員陳棟。

問:對於完全合成圖片以及對抗樣本Face X-Ray無法準確識別,有何解決辦法?

答:我們尚在研究中,計劃在背景細節處的檢測下功夫,因為合成的圖片一般對於背景的處理比較粗糙。另一個想法是從將真實圖片與偽造圖片進行對比訓練算法,因為一般名人或者其他人臉圖片都有獨特的屬性ID,將這種獨特的屬性ID作為數據訓練也能改進算法。

問:Face X-Ray能夠識別用修圖工具修改的人臉照片?

答:Face X-Ray的工作重點不是判斷是否為原圖,而是在「真」與「假」之間衡量,畢竟假視頻、圖片對社會的負面影響較大。問:算法落地情況如何?何時能集成到應用程式中去?答:我們的算法突破是剛剛取得的進展,具體應用落地還需要一段時間。


雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 【盤點】人臉識別的2020年:諸事不宜
    支付寶、微信為了推廣自己的刷臉支付機具不約而同的加大了市場投入和補貼,支付寶甚至推出了「無上限投入」政策,引爆了市場的激情,有媒體戲稱,新一輪撒幣大戰開啟了。一個百億級別的市場就此開啟。 誠然,人臉識別技術自使用起就存在爭議,不過並不影響其推廣,但是在2020年,人臉識別技術遭遇到了寒冬。
  • 人臉識別,禁!
    奧克蘭、舊金山和波士頓也只是禁止政府部門使用人臉識別技術,而波特蘭禁止企業在公共場所使用該技術的禁令可謂開創先河。文 | 微胖 本文轉載自微信公眾號「機器之能」(ID: almosthuman2017),原文首發於2020年9月10日,原標題為《迄今最激進的人臉識別禁令來了! 企業在公共場所也不得使用》,不代表瞭望智庫觀點。
  • GeekPwn2020完美落幕,清華-RealAI聯合戰隊斬獲虛假人臉AI識別大賽冠軍
    10月24日,國際安全極客大賽GeekPwn 2020在上海完美落幕。本次大賽聚焦雲、AI、5G等前沿技術,結合社會熱點安全話題,發起首屆CAAD虛假人臉AI識別大賽,RealAI與清華大學計算機系聯合戰隊TSAIL以絕對比分優勢拿下該賽目的冠軍。AI遇上假臉傻傻分不清楚?
  • 人臉識別「抓」錯了人,他在監獄呆了 10 天
    但塔利有充分的不在場證據:他當時正在一家公司裡上班。警方沒有理會,還把塔利關押了兩個月,在這期間打傷了他。直到兩個月後,塔利的辯護人拿出了他在公司上班的監控錄像,塔利才得到釋放。人臉識別可以作為指控一個人的確切證據嗎?
  • 審視人臉識別:一種AI技術的全球性濫用
    NeurIPS 2020 通訊主席 Michael Littman 如此表示。這也是 AI 頂會首次採用這種評估作法。但 NeurIPS 不是唯一一個有此要求的場合。同樣在今年,Nature Machine Intelligence 雜誌也提出:機器學習論文作者在文中加入對研究更廣泛的社會影響和道德承諾的聲明。
  • 黑客用一副紙眼鏡,就能「弄瞎」人臉識別算法
    這兩種算法可能不是同一個模型,背後原理是抓住了人臉模型之間的相似性(雖然人臉識別模型各有千秋,但是都屬於深度學習模型,免不了會有相似性)。攻擊算法尋找、挖掘、抓住不同人臉識別模型之間的相似性,同時放大,這樣就有攻擊的機會。換句話說,只要攻擊者能夠從人臉識別模型裡面挖掘出漏洞(相似性),就能夠攻擊模型。研發攻擊算法的過程中,挖掘相似性是一件很耗神、很熬人的事。
  • 人臉識別無處可躲,我們越來越難保住自己的「臉」-虎嗅網
    跟之前的很多新技術還有些許不同,特殊的2020年,無接觸的需求為人臉識別的大規模運用按下了一次加速鍵——去醫院,門口是人臉識別測溫;去便利店,結帳的時候用人臉識別付款;回到家,小區已然用上了人臉識別門禁……
  • 「00 後」攻破廈門銀行人臉識別系統,偽造76個假帳戶,如何做到?
    這一「偷梁換柱」之計算不上高級,俗稱抓包技術,將銀行系統下發的人臉識別身份認證數據包進行攔截並保存,使用自己的人臉識別身份認證數據包換掉虛假身份的人臉識別身份認證數據包,然後使用本人的臉完成人臉識別比對。與利用 3D 人臉識別通過「活體」人臉識別相比,可謂是「雕蟲小技」。
  • AI人臉識別「抓」錯了人,他在監獄呆了10天!
    但塔利有充分的不在場證據:他當時正在一家公司裡上班。警方沒有理會,還把塔利關押了兩個月,在這期間打傷了他。直到兩個月後,塔利的辯護人拿出了他在公司上班的監控錄像,塔利才得到釋放。人臉識別可以作為指控一個人的確切證據嗎?
  • 上萬人臉識別廁紙機進駐上海?政協委員多年提案拒用人臉識別
    人臉識別的過度使用已經成為普遍現象,人臉識別廁紙機尚沒有將人臉與姓名、電話、住址等信息掛鈎。而在上海寶山區某一所高校的快遞代收點,來取快遞的學生、老師們被強制要求刷臉取快遞,為的是防止偷竊和誤拿。在這一拍照設備的功能介紹中寫明「底單照片和人臉照片合二為一,自動上傳快遞超市雲端並存儲」,這意味著人臉和姓名、電話、住址等敏感信息綁定後被留檔。
  • 中國人臉識別相關企業突破10000家 2020年人臉識別企業分布格局...
    原標題:中國人臉識別相關企業突破10000家 2020年人臉識別企業分布格局分析(附企業地圖)
  • 黑客繞過人臉識別,銀行Ⅱ、Ⅲ類戶開戶到底有多少風險?
    爾後,在輸入開卡密碼步驟,被告人田世紀將APP返回到第一步(上傳身份證照片之步驟),輸入偽造的身份信息,並再次進入到人臉識別之身份驗證步驟,此時,其上傳此前攔截下來的包含其本人的身份信息數據包,使系統誤以為要比對其本人的身份信息,其遂用本人人臉通過銀行系統人臉識別比對,使得成功利用虛假身份信息註冊到銀行帳戶。
  • 人臉識別下的隱私讓渡,代價有多大?
    2D人臉識別算法孕育了2D人臉識別技術系統,而繼承了2D人臉識別技術自然識別過程的3D人臉識別技術則同時具備了高效率與高識別正確率。當下,人臉識別技術已經嵌入到人們生產生活的各個方面,在財務行為、工作場所監督、安全防控等領域得到普遍應用。從2015年到2019年,人臉識別、視頻監控的專利申請數量從1000件飆升到3000件,其中四分之三在中國。
  • 人臉識別籤到,活動人的團寵
    人臉識別技術,聽起來像是一種很玄妙、不太易於操作的新興技術,實際上在近幾年的應用中,已經在不斷的擴展應用範圍,從刑偵、支付、預約報名,再到如今的考勤籤到,無處不在散發著他的魅力。更準確、便捷、富有科技感,這些都是31會議人臉識別籤到技術的標籤,它也配得起如此多的美譽認可。
  • 剛剛,CVPR 2021論文接收結果「開獎了」
    「接收」還是「被拒」,也終於有了最終結果……據官方消息,在大約 7500 份提交中,有 5900 篇進入了決策流程,其他未進入的論文或因提交格式不正確,或因評審意見被撤回。最終進入決策流程的論文有 27% 被接收,共 1663 篇(非最終統計,僅供參考)。目前投稿人也可以通過 ID 檢索的方式來查看自己的論文接收情況,極少數論文的接收結果因調查情況而延遲,後續將出現在最終列表中。
  • 人臉識別60年︱校園、課堂、售樓處,人臉識別應該有禁區嗎
    2019年,瑞典數據保護局對一所高中開出罰單,認為校方使用人臉識別技術進行考勤違背了「必要性」原則,人臉信息的敏感性更高,校方完全有其他低風險的選擇。這也是歐盟通用數據保護條例GDPR通過後的首張罰單。
  • 「人臉識別第一案」勝訴意義大於賠償
    「人臉識別第一案」勝訴,喚醒了民眾增強個人信息保護意識。人臉屬於敏感個人信息,採集需要符合相應條件,即合法性、正當性、必要性。此案勝訴意義大於賠償,不僅起到很好示範作用,也能倒逼有關單位和部門依法規範和使用人臉識別等個人信息。
  • 休斯頓機場增加面部識別以阻止病毒傳播 | 美國三大科技巨頭停止向警方提供人臉識別
    中國日報  美國三大科技公司IBM、亞馬遜、微軟本周先後發布聲明稱,未來不會再向警察部門出售人臉識別軟體與服務,除非美國出現能有效管控並約束這項技術的法律。綜合媒體6月13日報導,微軟成為本周第3個宣布不向警方銷售人臉識別軟體的美國科技巨頭。
  • 助力企業復工復產 河南漢宏智能測溫人臉識別機新品上市
    中沃門業負責人馬忠良激動的說,中沃門業從1月28日起,先後援建了河南「小湯山」醫院、武漢「雷神山」醫院……,復工復產和疫情防控工作能這樣精準高效,得益於中沃門業近年來在智能化、信息化設備的大量投入和應用,特別是疫情防控期間,廠裡採購安裝了河南漢宏智能科技股份有限公司開發的測溫人臉識別機,快速對所有廠區閘機口出入人員身份核實及在線管理,減少現場人員證照核查,有效防止規模性疾病傳染,真正做到了企業復工、
  • 觸控和生物識別迎來強勁增長,義隆未來主要朝人臉加指紋識別組合...
    此外,義隆表示,該客戶出貨產品包含觸控屏幕、觸摸板共同出貨,因此對營收有明顯貢獻,通常一個機型會有一年到一年半的出貨時間,後續也持續與該客戶開發新機型,可望為未來營運注入動能。 據悉,義隆今年獨家拿下微軟新款10.1英寸Surface Go觸摸板和觸控屏幕晶片,帶動今年第2季觸摸板、觸控屏幕晶片出貨季增超過2成,且Surface Go模塊平均單價高3倍。