本文作者根據多年人臉識別項目經驗,總結了人臉識別技術在安防、商業領域應用及產品設計細節,匯總成應用層下的人臉識別系列文章。本文為系列文章的第三篇——介紹人臉比對相關內容。全文圍繞人類比對類型、人臉比對要素展開介紹。
人臉比對類型可分為四種,分別是:人臉1:1、人臉1:n、人臉1:N、人臉M:N。
人臉識別應用無非就是圍繞著這四種比對方式展開,下面將依次介紹各種比對類型。
人臉1:1一般用於人證核驗,可以簡單理解為:證明你就是。
例如:在乘坐火車、飛機,出入境,銀行辦卡時,通常需要驗證本人與其持有身份證是否為同一個人。
如下圖,系統只需讀取二代身份證中的人臉照片,與現場抓拍的本人照片做比對即可。
人臉1:1又稱為靜態人臉比對,同時具有配合式的特點,完成比對需要用戶攜帶身份證並主動配合採集人臉。
人臉1:n:將一張人臉照片與人臉庫中的多張人臉逐一進行比對,人臉庫有多少人臉就需要比對多少次——平臺採集了「我」的一張照片之後,從海量的人像資料庫中找到與當前使用者人臉數據相符合的圖像,並進行匹配,找出來「我是誰」。
人臉1:n又稱動態人臉比對。
比對照片是從動態視頻中獲取的,同時具有非配合特點——整個比對過程是無感知的,不需要人為配合。這兩個特性使人臉1:n能迅速落地於公安追捕逃犯,但時其難度要遠高於人臉1:1 。(其通常會受到光照變化、人臉姿態的影響——比如側臉、低頭、逆光現象,會大大提升人臉漏報率。)
人臉1:n中「n」的大小(人臉庫照片的數量)會影響人臉識別的準確率和比對速度,所以比對人臉庫規模會設置的相對較小。
人臉1:N又稱靜態大庫檢索:即以人臉圖片、人臉相似度作為檢索條件,在人臉庫中搜索與其相似(相似度大於設定閾值)的圖片——類似於百度以圖搜圖。
檢索過程實際就是:進行N次人臉比對,並留下比分大於閾值的結果。
人臉1:N的人臉庫規模相較於人臉1:n會大很多,最高可支持億級人臉檢索,所以這裡的N為大寫。
人臉M:N實際就是兩個人臉庫進行比對。
例如:人臉庫A有M個人臉,人臉庫B有N個人臉。如果想查看人臉庫A和B包含多少個相同的人,就需要用人臉庫A中M個人臉逐一與人臉庫B中N個人臉進行比對,相當於是M個人臉1:N相加的結果。
人臉M:N常用於慣犯排查、身份查重。
例如:辦案人員在處理類似三搶一盜的案件中,一般來說80%的案件是慣犯所為。於是,將線索地點路人庫與慣犯庫進行人臉M:N比對碰撞,可快速排查嫌疑,找出偵查方向。
人工智慧算法的演進必須有數據作為支撐。
使用大量標註好的數據訓練模型,可將識別的準確率從70%提升到99%水平。客觀、精準的數據是人工智慧應用必須具備的條件。
獲取人臉數據的五種方式:
人臉比對庫為人臉識別提供比對模板——人臉1:n、人臉1:N、人臉M:N必須要有人臉比對庫才能進行比對。
系列第二篇文章《應用層下的人臉識別(二):人臉庫》詳細的介紹了人臉庫的建立方法。
比對閾值:人臉比對的相似度。
人臉比對結果以相似度值呈現,在人臉比對之前需要設定一個相似度的門檻值,大於這個門檻則判定兩張照片可能為同一個人。
比對閾值對人臉識別的準確率、漏報率影響頗大,比對閾值設置的越高準確率就越高,漏報率也會隨之升高。比對閾值沒有一個固定的標準,應根據應用場景來靈活調整。
例如:刷臉支付更關注比對準確率,需要調高閾值;而公安嫌犯人臉布控要求降低漏報,就需要適當調低閾值。
人工智慧的三要素是算法、算力和數據,而晶片決定了算力。
深度學習工程的兩大關鍵環節training(訓練)和inference(推測)需要大量的算力支撐,普通的CPU無法滿足計算要求。
相繼推出的高性能GPU、TPU、FPGA、ASIC等加速晶片,大大提升了計算速度,同時也促進了算法的發展。
GPU在人臉1:n、1:N、M:N比對中是不可或缺的,而部分人臉1:1計算量不大,可以不使用加速晶片。億級人臉檢索在GPU的加速下可以達到秒級返回結果。
人臉算法效果決定了人臉識別的上限,也是人臉比對最關鍵的要素。隨著深度學習技術的普及,各大公司的人臉算法效果差距也越來越小。
目前主流的人臉識別算法可以分為以下四類:
2018年11月20日公布的,有工業界黃金標準之稱的全球人臉識別算法測試(FRVT)結果(如下圖):
排名前五的算法都被中國包攬:
人臉算法雖然在各種數據集的測試中準確率頗高,但還遠沒達到在商業應用中的滿意程度。
目前仍然有很多缺陷需要解決,例如:
姿態問題:
人臉識別主要依據人的面部表象特徵來進行,「如何識別由姿態引起的面部變化?」就成了該技術的難點之一。
姿態問題涉及:頭部在三維垂直坐標系中,繞三個軸的旋轉造成的面部變化。其中,垂直於圖像平面的兩個方向的深度旋轉會造成面部信息的部分缺失。這使得姿態問題成為人臉識別的一個技術難題。
針對姿態的研究相對比較的少,目前多數的人臉識別算法主要針列正面、準正面人臉圖像。當發生俯仰或者左右側而比較厲害的情況下,人臉識別算法的識別率也將會急劇下降。
圖像質量問題:
人臉圖像的來源可能多種多樣,由於採集設備的不同,得到的人臉圖像質量也不一樣。
特別是對於那些低解析度、噪聲大、質量差的人臉圖像(如:手機攝像頭拍攝的人臉圖片、遠程監控拍攝的圖片等),「如何進行有效地人臉識別?」就是個需要關注的問題。
而對於高分辨圖像對人臉識別算法的影響,也需要進一步的研究。
現在,我們在人臉識別時,一般採用的都是相同尺寸、清晰度很接近的人臉圖片,所以圖像質量問題基本可以解決。但是,面對現實中更加複雜的問題,還是需要繼續優化處理。
遮擋問題:
對於非配合情況下的人臉圖像採集,遮擋問題是一個非常嚴重的問題。
特別是在監控環境下,往往被監控對象都會帶著眼鏡、帽子等飾物,使得被採集出來的人臉圖像有可能不完整,從而影響了後面的特徵提取與識別,甚至會導致人臉檢測算法的失效。
人臉算法在人臉五官被擋的情況下表現的不是很好。
目前對遮擋識別效果較好的DeepID2算法,可穩定識別遮擋在20%以內,塊大小在30*30以下的人臉。
樣本缺乏問題:
基於統計學習的人臉識別算法是目前人臉識別領域中的主流算法,但是統計學習方法需要大量的訓練。
由於人臉圖像在高維空間中的分布是一個不規則的流形分布,能得到的樣本只是對人臉圖像空間中的一個極小部分的採樣。關於「如何解決小樣本下的統計學習問題?」,還有待進一步的研究。
以上就是系列文章的第三篇——《應用層下的人臉識別(三):人臉比對》的相關內容。
歡迎大家添加公眾號「陽春柏樰」與我繼續交流圖像識別相關問題。
應用層下的人臉識別(一):圖像獲取
應用層下的人臉識別(二):人臉庫
本文由@陽春柏樰 原創發布於人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基於CC0協議