「技術綜述」如何降低遮擋對人臉識別的影響

2021-01-15 有三AI

作者 | 劉東平、謝遠倫、言有三

編輯 | 言有三

人臉識別技術都是基於人臉關鍵特徵提取對比完成識別的,其中,特徵的完整性是算法成敗的一個極為關鍵的因素,但是當受到外界幹擾較多,外界的條件發生明顯變化的時候,由於傳統方法過於依賴明顯的、完整的圖像特徵,一旦由於人臉發生遮擋,造成部分特徵的消失,導致人臉圖像特徵不完整時,這種算法就會失效,導致無法和庫中人臉信息進行對比。遮擋造成的人臉識別的困難主要體現在由遮擋所引發的特徵損失、對準誤差和局部混疊等方面.

1 常見人臉遮擋方式【1】

引發面部遮擋的原因主要有三種:

1.1光線遮擋:由於不均勻的或極度強烈的外部光照所引起的遮擋。圖a

1.2實物遮擋:覆蓋在人臉上的物品,如帽子,眼鏡,圍巾等。圖b

1.3自遮擋:是由於人體姿勢導致的,如側臉。圖c

2 人臉遮擋對人臉識別的影響

下面我們看一組圖片:

通過眼睛我們很容易判斷上面一組圖片都是同一人。但是我們的人臉識別的應用能判斷出他們是同一人嗎?

接下來我們將把上面的圖片通過百度AI和騰訊AI進行對比

2.1百度AI對比結果

2.2騰訊AI對比結果

通過百度AI和騰訊AI我們可以看到遮擋對人臉驗證的結果影響非常大,特別是第四組圖,由於面紗的遮擋,騰訊AI判斷圖片中沒有人臉,但是同一組照片,百度AI卻給出了71.75%的相似度判定。這也說明了不同的算法,對遮擋處理的結果差別很大。

3 數據集

雖有很多的人臉數據集,但是專門用於人臉遮擋這個問題的卻很少。MAFA【3】是其中最大的,它包含30,811個無遮擋圖像和35,806個有遮擋圖像,包含各種方向和尺度的遮擋,數據集並未開源。

遮擋後的人臉,眼睛基本不會被遮擋的,需要眼睛看東西,所以還是相對穩定的特徵點,下面是其中一個遮擋的例子。

4 人臉識別遮擋傳統方法【1】

主流的方法有:子空間回歸、魯棒誤差編碼與魯棒特徵提取等三類。

4.1子空間回歸

子空間回歸方法將不同類別的人臉劃分為不同的子空間,遮擋是一個獨立的子空間,那麼有遮擋的人臉圖像是不含遮擋的人臉與遮擋的疊加,就可以把有遮擋人臉圖像識別問題視作將無遮擋的人臉圖像和遮擋各自回歸到它們所屬的子空間的問題。

子空間回歸方法中最具代表性的方法是稀疏表示分類方法和協同表示分類方法,具體的細節,可以參考文獻【1】。子空間回歸方法的主要困難在於遮擋子空間的構建。

4.2魯棒誤差編碼

魯棒誤差編碼方法主要包括「加法模型」和「乘法模型」。 「加法模型」認為有遮擋圖像是原始的不含遮擋的人臉圖像與由遮擋引發的誤差e的合成體,即y=y0+e,著重考慮如何將誤差e從有y中分離出來。

「乘法模型」將有遮擋的圖像看成是無遮擋的y0與遮擋的拼接,並且只有y0可以精確重構。著重考慮如何分離其有遮擋區域和無遮擋區域,具體細節參考文獻【1】。

4.3魯棒特徵提取

一幅人臉圖像所包含的特徵通常極為豐富,既包括顏色、亮度、紋理、方向等低階特徵,也包括姿態 、表情、年齡、人種等高階特徵,魯棒的特徵提取 方法就是需要對這些特徵進行分解。比如Gabor特徵是在多個尺度和多個方向上分解,屬性特徵是分解為多個可描述的屬性。分解後,可以降低特徵之間的相互幹擾,從而為機器學習提供足夠精細的特徵。

傳統的魯棒特徵有代表性的比如梯度臉,以及將子空間學習引入深度學習的PCANet框架和將卷積神經網絡的卷積層引入經典的「特徵圖-模式圖-柱狀圖」的特徵提取框架FPH 框架。儘管並沒有對光照變化和遮擋做任何先驗性假設和顯式處理,甚至沒有用到大規模的訓練數據,PCANet的神經元響應卻對光照變化和遮擋等表現出了很強的魯棒性,關於更具體的細節請參考文獻【2】。

5 深度學習【3-4】

我們下面給大家介紹兩個思路。第一個,來源於【3】的思路,是嘗試對遮擋區域的特徵進行修復。【4】的思路,是如何設計和使用Attention的機制去識別沒有被遮擋的人臉,這也是兩個基本的研究方向,下面分別做說明。

5.1 對遮擋區域進行恢復

上圖就是文【3】解決方案的框架。從上圖我們可以看出,包括3個模塊。

(1)Proposal Module人臉候選區域提取模塊,這就是三個卷積層加一個全連接層的基本結構,為了能夠召回更多的遮擋人臉,選擇了比較低的閾值生成了大量人臉候選區域。隨後使用VGGFace提取4096維的特徵進行歸一化。我們可以知道,這個特徵即含有有用信息也含有噪聲信息。

(2)Embedding Module 這個模塊主要實現對被遮擋的人臉特徵恢復,抑制特徵中的噪聲信息,它將Proposal Module提取出來的描述子,採用LLE方法,轉化為相似度描述子。隨後,在一個利用了大量無遮擋人臉和遮擋人臉得到的特徵池中利用knn尋找匹配。

(3)Verification Module 則可以利用被修復的人臉特徵進行人臉區域驗證,對人臉位置和尺度進行微調。

5.2 基於attention的方法定位遮擋

通過合理的Anchor設置或者是合理的大感受野,我們可以隱式地學到遮擋區域的人臉,為了減少誤召回,可以考慮用segmentation或者是attention的機制去處理。

上面就是它的基本結構,借鑑於RetinaNet。首先通過FPN結構提出特徵,然後會另開一支去學習attention,之後對attention做一個E指數的操作乘到原來的feature map上,加強可見區域信息。後面是一個類似於fast R-CNN兩支操作:一支做classification,一支做regression。 Anchor setting設置可以保證每個人臉都有足夠的感受野以及足夠的context信息。底下這個attention的subnet,它可以通過有監督的信息,學到visible的information,也就能提高對遮擋物體檢測的能力。一些該文的細節,包括以下:

Anchor setting

文章中先統計了一下Wider face數據集,發現大概80%以上的人臉其實都是集中在16 pixel到406 pixel這樣的量級上面,還有約10%的量級是在8pixel到16pixel,如下圖:

要考慮到如何讓anchor去覆蓋這麼大的一個區域,他們選擇了1和1:1.5,其實是潛在地考慮了正臉和側臉情況。與傳統的每一層只有一個anchor的鋪設方式不同,採用每層3個scale,以2 ^ -1/3 步進。

attention整體框架

採用將bounding box的區域填1,直接作segmentation去學的思路。由於大量的ground truth是沒有遮擋的,當發生遮擋時,最後學出來的segmentation會對於這些未遮擋的信息更加敏感。另外在attention網絡裡面,做完attention之後,不是簡單的點乘到原來的feature map上面,而是先做了一個E指數的操作,再去點乘到feature map上面。這樣做就不是只保留attention高量的部分,而是對高量的部分做一些增強,這樣能夠很好地保留它原有的context信息,同時也能夠突出它自身那個可見區域的信息。

這是一個有監督的attention結構,對不同的層賦予不同的anchor level的監督信息。

除了以上兩條思路外,還有一些其他的方案,不再一一展開。

6 解決人臉遮擋的現實意義

6.1 提升門禁系統識別準確率,方便人們的生活

受安全保護的地區可以通過人臉識別辨識試圖進入者的身份。人臉識別系統可用於企業、住宅安全和管理。如人臉識別門禁考勤系統,人臉識別防盜門等。門禁系統採用網絡信息加密傳輸,支持遠程進行控制和管理,可廣泛應用於銀行、軍隊、公檢法、智能樓宇等重點區域的門禁安全控制,但是參與這些活動的人,其面部特徵並不都是標準完整的。在面部特徵不完整的情況下,也能對其進行精準的識別,將會極大的提高工作效率和用戶體驗。

6.2 增強身份識別

可在機場、體育場、超級市場等公共場所對人群進行監視,例如在機場安裝監視系統以防止恐怖分子登機。在恐怖分子有偽裝的情況下,例如戴口罩、墨鏡、帽子等,如果人臉識別技術能對遮擋部分進行補全,就可以在機場或車站安裝系統以抓捕在逃案犯。

參考文獻:

[1] 李小薪、梁榮華有遮擋人臉識別綜述:從子空間回歸到深度學習

[2] Chan T H, Jia K, Gao S, et al. PCANet: A simple deep learning baseline for image classification?[J]. IEEE Transactions on Image Processing, 2015, 24(12): 5017-5032.

[3]Ge S, Li J, Ye Q, et al. Detecting masked faces in the wild with lle-cnns[C]//The IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2017: 2682-2690.

[4]Wang J, Yuan Y, Yu G. Face Attention Network: An effective Face Detector for the Occluded Faces[J]. arXiv preprint arXiv:1711.07246, 2017.

[5] https://github.com/polarisZhao/awesome-face

相關焦點

  • 人臉識別技術介紹和表情識別最新研究
    作者:夏初來源:公眾號|計算機視覺工坊(系投稿)一、人臉識別技術介紹人臉識別作為一種生物特徵識別技術,具有非侵擾性、非接觸性、友好性和便捷性等優點。早在二十世紀初期,人臉識別已經出現,於二十世紀中期,發展成為獨立的學科。人臉識別真正進入應用階段是在90年代後期。人臉識別屬於人臉匹配的領域,人臉匹配的方法主要包括特徵表示和相似性度量。人臉識別通用的流程主要包括人臉檢測、人臉裁剪、人臉校正、特徵提取和人臉識別。人臉檢測是從獲取的圖像中去除幹擾,提取人臉信息,獲取人臉圖像位置,檢測的成功率主要受圖像質量,光線強弱和遮擋等因素影響。
  • 「技術綜述」基於3DMM的三維人臉重建技術總結
    基於圖像的人臉三維重建在人臉分析與娛樂領域裡有巨大的應用場景,同時它也可以用於提升人臉關鍵點檢測,人臉識別,人臉編輯等很多任務。本文重點介紹其中基於3DMM模型的核心技術及其研究進展。作者&編輯 | 言有三1.
  • 一個照片「隱身衣」,讓微軟曠視人臉識別系統100%失靈|開源
    這就是來自芝加哥大學的最新研究:給照片加上一點肉眼看不出來的修改,就能讓你的臉成功「隱形」。如此一來,即使你在網絡上的照片被非法抓取,用這些數據訓練出來的人臉模型,也無法真正成功識別你的臉。給照片穿上「隱身衣」這項研究的目的,是幫助網友們在分享自己的照片的同時,還能有效保護自己的隱私。因此,「隱身衣」本身也得「隱形」,避免對照片的視覺效果產生影響。也就是說,這件「隱身衣」,其實是對照片進行像素級別的微小修改,以蒙蔽AI的審視。
  • 從歐巴馬假視頻到ZAO,換臉和人臉檢測技術發生了什麼?
    論文地址:https://arxiv.org/pdf/2001.00179v1.pdf大規模公共數據集的免費獲取和深度學習技術(尤其是 GAN)的快速發展,導致以假亂真的內容大量出現。在假新聞時代,這些偽造內容對社會產生了一定的影響。本文對人臉圖像操縱技術進行了全面的綜述,包括 DeepFake 方法以及檢測此類操縱技術的方法。
  • 應用層下的人臉識別(三):人臉比對
    這兩個特性使人臉1:n能迅速落地於公安追捕逃犯,但時其難度要遠高於人臉1:1 。(其通常會受到光照變化、人臉姿態的影響——比如側臉、低頭、逆光現象,會大大提升人臉漏報率。)人臉1:n中「n」的大小(人臉庫照片的數量)會影響人臉識別的準確率和比對速度,所以比對人臉庫規模會設置的相對較小。3.
  • 人臉識別技術廣泛應用,是推進社會治安管理還是加速信息洩露?
    現如今人臉識別技術大範圍應用,智能門鎖、手機開鎖、釘釘打卡等全都離不開面部識別,在技術的迭代升級中,指紋解鎖逐漸被無接觸式的人臉識別取代。在某種意義上,是現代化進程的加速邁進。在《中國新聞周刊》的報導(《人臉識別十字路口:臉的恐慌》),有專家稱,「 中國人每天要暴露在各種攝像頭下超過500次。
  • 人臉識別:AI產品經理需要了解的CV通識
    一、技術流程詳解技術流程:1、人臉採集人臉採集主要關注以下因素——1)圖像大小:人臉圖像過小會影響識別效果,人臉圖像過大會影響識別速度對這塊有興趣的朋友可以看看這篇文章:《基於深度學習的人臉識別技術綜述》5、人臉匹配與識別將提取的人臉特徵數據與資料庫中儲存的特徵模板進行搜索匹配,設定一個最佳的相似度閾值,當相似度超過該閾值,則輸出匹配後的結果。
  • 人臉識別特徵介紹以及難題概括
    今天給大家介紹一下人臉識別特徵有哪些?人臉識別技術的應用有哪些難題存在呢?人臉識別特徵介紹1、幾何特徵,這是從面部點之間的距離和比率作為特徵,識別速度快,需要內存比較小,對於光照敏感度降低。2、基於模型特徵,這是根據不同特徵狀態所具備的概率不同來提取人臉圖像特徵。
  • 可見光人臉識別與主動近紅外人臉識別有什麼區別
    導讀 人臉識別是生物特徵識別技術中應用最為廣泛的一種,在實際應用中會受到光照、表情、遮擋物等問題的影響,其中光照問題在實際應用中最為重要,人員在識別時可能會因為光照的原因識別不出來
  • 關於faceID——近紅外人臉識別技術的分析介紹
    各類人臉識別方法的關鍵都在於,提取人臉數據中與身份相關的本質特徵,同時消除其中受非身份因素影響的部分,非身份因素一般包括:環境光照、姿態、表情、飾物等。其中,光照問題在實際應用中最為重要,用戶普遍要求人臉識別系統能適應不同的光照環境。 一般的人臉識別系統都採用普通的可見光人臉圖像進行識別,這類系統容易受到環境光線變化的影響,在識別之前往往需要採用一些預處理算法對光照進行處理。
  • 人臉識別時代來臨有多危險?央視爆用2元就買到臉造假
    相信大家對Face ID不會陌生,內地更是將這個技術運用得淋漓盡致,購物用「刷臉」支付、用手機用「刷臉」解鎖,進住宅小區用「刷臉」開門,越來越多範疇都會運用到人臉識別技術,但隨之而來的是訊息安全風險。中央電視臺就揭發了市面上只需要用2元人民幣就可以買到過千張人臉照片,不法之徒可以利用這些照片,通過「照片活化」軟體生成動態影片,欺騙人臉核驗機,從而犯案!央視引述一份報告分析,目前中國人臉識別市場規模約佔全球市場的15%左右。
  • 雲從科技:人臉識別技術照進產業場景的距離有多遠|AI TALK
    按照發起人阿里巴巴技術委員會主席王堅的說法,2050 是一個年份,不太近,充滿想像,也不太遠,我們都能活著看到。在第一次聽到「讓世界離年青人更近,讓年青人離世界更近」這樣的辦會理念時,我們想起機器之心用前沿科技內容聚合的全球 AI 青年,從在象牙塔裡研究技術到畢業後面臨創業、擇業的選項,他們不僅應該關心技術走向,也需要了解因為這些技術的創新促成了產業正在發生的商業變革。
  • 人臉識別開發技巧揭秘
    虹軟視覺開放平臺推出的「從零學習人臉識別」技術公開課第七期——《人臉識別應用方案(PC和設備端)》對此做了詳細闡述(完整課程可搜索「從零學習人臉識別」),將主要從人臉追蹤、雙目活體對齊、圖像質量檢測和特徵值提取技巧等進行系統性介紹。
  • 基於深度學習的人臉識別技術全解
    與此同時,業界也基本達成共識:基於人工精心設計的局部描述子進行特徵提取和子空間方法進行特徵選擇能夠取得最好的識別效果。 Gabor 及 LBP 特徵描述子是迄今為止在人臉識別領域最為成功的兩種人工設計局部描述子。這期間,對各種人臉識別影響因子的針對性處理也是那一階段的研究熱點,比如人臉光照歸一化、人臉姿態校正、人臉超分辨以及遮擋處理等。
  • 隱私問題與安全爭議未休,人臉識別技術的應用邊界該如何圈點?
    在銀行、公司、公共場所都設有24小時的視頻監控,如何對視頻圖像進行篩選分析,就需要用到人臉檢測、跟蹤和識別技術。05.視頻會議。人臉識別技術還可以用於視頻會議、機器人的智能化研究等領域,人類可以輕鬆根據人臉辨別一個人。
  • 人臉識別存在法律風險該如何防範?
    狹義的人臉識別特指通過人臉進行身份確認或者身份查找的技術或系統,本文是基於對後者的應用研究。當前,人臉識別、指紋識別、虹膜識別、步態識別、聲紋識別、DNA識別是最主要的六大生物識別技術。人臉識別技術相對於其他生物識別技術,具有如下特點。   一是非接觸性。人臉識別技術不需要和設備直接接觸就能獲取人臉圖像,而其他多數生物識別技術都需要通過個體與設備接觸來提取。
  • 那些影響「安防新十年」的世界級科學家們
    高文院士2018年3月,深圳,雷鋒網AI掘金志舉辦中國首個以「動態人臉與車輛識別」為主題的AI安防峰會。即使到現在,數據視網膜的技術框架也仍然在不斷完善當中,但其影響卻將是顛覆性的。2、智慧城市中的視頻技術面臨三大問題,分別是存儲成本高(數據量太大)、檢索困難、對象再標識難。而這三個問題歸結到本質則是兩個問題,一個是編碼問題,而另一個是視頻分析識別問題。因此如何對監控視頻進行高效視頻編碼,以及如何對其進行分析和檢索,是必須思考的兩個本質問題。
  • 人臉識別是如何進行的?看這裡就夠了!
    它作為基於臉部特徵信息進行身份識別的一種生物識別技術,已經廣泛應用於各行各業,比如說汽車站、地鐵、機場等各出入口。 但很多人對於人臉識別技術不是很了解,不知道攝像頭是怎麼進行人臉識別的,今天小編帶大家一探究竟,看看人臉識別是怎麼進行的,又怎麼準確識別到人臉的!
  • 在人臉識別的「統治」陰影之下……
    要明白人臉識別如何運作、如何與數據安全和歧視相關聯,我們必須首先搞清楚它的歷史發展和基本原理。比起其他技術,3D人臉識別的一個優勢在於它能夠不受光線變化的影響,也能從輪廓視角等一系列視角來識別臉部。皮膚紋理分析皮膚紋理分析把皮膚上獨特的線條、紋路、斑點等轉化為數學公式。它的工作原理和面部識別十分相似,在皮膚紋理分析的幫助下,人臉識別的表現能提高20%-25%。
  • 「關注」人臉識別技術細節科普:從「流浪地球」的MOSS說起
    雖然MOSS看起來很強大,擁有自主意識,但其實,MOSS這個強人工智慧也是首先基於人臉識別技術來進行決策的。OSS在電影中的鏡頭(圖片來源於網絡)那人臉識別技術現在只出現在科幻當中嗎?當然不是。歌神張學友的演唱會上,警方利用人臉識別技術抓逃犯共計55人。歌神:「我為人臉識別技術代言,為自己鼓掌。」