技術分享|人臉檢測技術發展及百度「框」實踐

2020-12-13 Apollo開發者社區

更多Apollo智能駕駛相關訊息,盡在【Apollo開發者社區】!

近年來,人臉識別逐漸成為了視覺領域研究裡最熱門的課題,人臉相關應用在安防監控、人證比對、人臉解鎖、人機互動、人臉特效等領域都有重要的應用價值。人臉檢測是很多人臉應用的基礎任務,比如人臉關鍵點,人臉識別,人臉老化等。由於存在姿態變化、遮擋、光照變化、尺度變化等一系列問題,人臉檢測的實際落地應用仍存在較大的挑戰。衍生於手工設計特徵的人臉檢測器,通過深度卷積神經網絡學習後,大大提升了檢測效果。最近的性能領先的人臉檢測器往往受通用目標檢測器的啟發,通常是基於錨點的深度卷積神經網絡。

據我們所知,為了實現高效、準確的人臉檢測器,主流的SOTA人臉檢測框架往往從以下幾個思路去優化:特徵融合、上下文信息、錨點設計、額外監督、數據擴充、網絡結構、感知野設計、單階段Refinement、頭部網絡設計、Anchor Free等。過去幾年,百度視覺技術部在人臉檢測問題上也產出了一系列的研究,本文我們通過人臉檢測器優化的多個角度來剖析下這些研究。

該圖為人臉檢測器設計的幾個優化思路,包括特徵融合、上下文信息、錨點設計、額外監督、數據擴充、網絡結構等等。黃色部分為百度視覺技術部發表在各會議和期刊的相關研究。

Anchor Free&端到端角度:第一個Anchor Free且可以進行端到端訓練的物體檢測器DenseBox (Arxiv 15);

上下文信息角度:引入基於Anchor的上下文輔助方法,用於半監督學習人臉上下文特徵的PyramidBox (ECCV 18),同時更好的利用尺度感知的Data-Anchor-Sampling以改變訓練樣本的分布;

特徵融合角度:基於注意力指引的語義增強特徵融合框架來學習各個尺度的具有豐富語義特徵金字塔的DAFBox (Progressively Refined Face Detection Through Semantics-Enriched Representation Learning. TIFS 19);

錨點設計角度:使得異常人臉被補償高質量錨點的在線高質量錨點挖掘框架HAMBox (HAMBox: Delving into High-quality Anchors Mining for Outlier Faces Detection. CVPR 20);

網絡結構角度:第一個基於神經網絡架構搜索的方法,同時搜索一個適合人臉檢測的特徵提取器(Backbone)和特徵金字塔(FPN)的BFBox (BFBox: Searching Face-appropriate Backbone and Feature Pyramid Network for Robust Face Detector. CVPR 20)。

其中,HAMBox方案幫助百度視覺技術部在2019年WIDER Face and Pedestrian Challenge上以mAP值57.13%的成績奪得人臉檢測的冠軍,超過了第二名0.47%,遠超去年冠軍55.82%的成績。同時將WIDER FACE驗證集hard子集的AP刷新到恐怖的93.3%。PyramidBox和PyramidBox++方案兩次刷新WIDER Face國際榜單世界紀錄。百度已在飛槳(PaddlePaddle)上開源了PyramidBox,並計劃開源HAMBox,該方案將進一步推動人臉檢測相關的研究,幫助更多開發者應用更前沿的人臉技術。

上圖中,紅色框是PyramidBox的檢測效果,可以看出PyramidBox對於姿態、模糊、遮擋、尺度等條件具有極強的魯棒性。

【Anchor Free&端到端角度: DenseBox: Unifying Landmark Localization with End to End Object Detection】

DenseBox這篇工作2015年就已經發表了。現在回過頭看DenseBox,他是第一個anchor free且可以進行端到端訓練的物體檢測器,甚至比Fast R-CNN還要早,極具前瞻性。誰能想到,2019年在物體檢測和人臉檢測領域出現大量借鑑DenseBox思路的anchor-free的文章,諸如CornerNet,FCOS,FoveaBox,ExtremeNet,CenterFace,SFace等等。

DenseBox的主要貢獻如下:

DenseBox設計了一個簡單的全卷積網絡,來高效、準確檢測遮擋的多尺度物體,並且實現了端到端的訓練和測試。而R-CNN系列算法是從Faster R-CNN中使用了RPN代替了Selective Search才開始實現端到端訓練的,而和語義分割的結合更是等到了2017年的Mask R-CNN才開始。DenseBox通過多任務學習的方式引入了關鍵點定位,並且進一步提升了目標檢測的準確率。並且在人臉檢測數據集MALF和車輛檢測數據集KITTI上驗證了其優秀的性能。提出多尺度特徵,而R-CNN系列直到FPN才開始使用多尺度融合的特徵。

▲結合檢測和關鍵點定位的框架圖

【上下文信息角度: PyramidBox: A Context-assisted Single Shot Face Detector (ECCV 18)】

在不受控制的環境中檢測小的、模糊的及部分遮擋的人臉仍舊是一個有待解決的難題。針對棘手的人臉檢測問題,本文提出了一種語境輔助的單次人臉檢測新方法——PyramidBox。考慮到語境的重要性,我們從以下三個方面改進語境信息的利用。首先,我們設計了一種全新的語境 anchor,通過半監督的方法來監督高層級語境特徵學習,我們稱之為 PyramidAnchors。其次,我們提出了一種低層次級特徵金字塔網絡,將充分的高層級語境語義特徵和低層級面部特徵結合在一起,使PyramidBox能夠一次性預測所有尺寸的人臉。再次,我們引入了語境敏感結構,擴大預測網絡的容量,以提高最終的輸出準確率。此外,我們還採用「數據-anchor-採樣」的方法對不同尺寸的訓練樣本進行擴充,增加了較小人臉訓練數據的多樣性。PyramidBox充分利用了語境的價值,在兩個常用人臉檢測基準——FDDB 和 WIDER FACE 上表現非凡,取得當前最優水平。2018年3月該方法在世界最權威的人臉檢測公開評測集 WIDER FACE 的「Easy」、「Medium」和「Hard」三項評測子集中均榮膺榜首,刷新業內最好成績。

如下圖所示,PyramidBox在六個尺度的特徵圖上進行不同層級的預測。該工作主要包括以下模塊:低尺度特徵金字塔LFPN、語境輔助監督模塊Pyramid Anchors、上下文敏感結構CPM、尺度感知的Data-anchor-sampling。

LFPN:LFPN全稱Low-level Feature Pyramid Networks, 在檢測任務中,LFPN可以充分結合高層次的包含更多上下文的特徵和低層次的包含更多紋理的特徵。高層級特徵被用於檢測尺寸較大的人臉,而低層級特徵被用於檢測尺寸較小的人臉。為了將高層級特徵整合到高解析度的低層級特徵上,我們從中間層開始做自上而下的融合,構建Low-level FPN。

Pyramid Anchors:該算法使用半監督解決方案來生成與人臉檢測相關的具有語義的近似標籤,提出基於anchor的語境輔助方法,它引入有監督的信息來學習較小的、模糊的和部分遮擋的人臉的語境特徵。使用者可以根據標註的人臉標籤,按照一定的比例擴充,得到頭部的標籤(上下左右各擴充1/2)和人體的標籤(可自定義擴充比例)。如下圖所示,可以看出由於缺少背景信息,小人臉很難被定位和分類,然而在給出人臉區域充足的上下文信息的條件下,我們能夠清晰準確的定位人臉位置。

CPM:CPM全稱Context-sensitive Predict Module, 本方法設計了一種上下文敏感結構(CPM)來提高預測網絡的表達能力。該模型由混合網絡結構和最大輸入輸出層組成,從融合特徵中學習準確的定位和分類;

Data-anchor-sampling:設計了一種新的採樣方法,稱作Data-anchor-sampling,該方法可以增加訓練樣本在不同尺度上的多樣性。該方法改變訓練樣本的分布,重點關注較小的人臉。

Pyramidbox模型可以在以下示例圖片上展示魯棒的檢測性能,該圖有一千張人臉,該模型檢測出其中的880張人臉。

不同模塊在baseline上的提升對比實驗:

【特徵融合角度:DAFBox:Progressively Refined Face Detection Through Semantics-Enriched Representation Learning (TIFS 19)】

特徵金字塔旨在學習到多尺度的特徵表達,來檢測多尺度的人臉。然而,在不同的尺度下,它們往往缺乏足夠的上下文信息,特別是當數據集有很多小人臉的時候。本文中,我們提出了基於注意力指引的語義增強特徵融合框架來學習各個尺度的具有豐富語義特徵金字塔的DAFBox。高維的抽象特徵被直接通過skip connections的方式引入到低維特徵,這樣可以保持儘可能多的語義信息。除此之外,在特徵融合過程中,我們使用注意力機製作為「門」來強化有用特徵,弱化無用特徵。受人類對於小臉的視覺感知啟發,我們設計了一個深度漸進式強化學習方法(DPRL),可以有效地使特徵學習變得簡單。根據以上原則,我們設計和調研了多種不同的特徵金字塔框架。最終,我們提出了兩種典型的可以端到端訓練的結構:集中注意力特徵CAF和分布式注意力特徵DAF。

▲圖一 特徵提取CAF和DAF

從下圖可以明顯看出,對於小的人臉來說,包含過大上下文信息的感知野並不是十分有利的。

往往是包括頭部或者肩膀的區域能夠更容易被人識別出來。

【錨點設計角度:HAMBox: Delving into High-quality Anchors Mining for Outlier Faces Detection. CVPR 20】

近期的人臉檢測器利用錨點來構建一個結合分類和坐標框回歸的多任務學習問題,有效的錨點設計和錨點匹配策略使得人臉檢測器能夠在大姿態和尺度變化下精準的定位人臉。然而,我們發現在推理階段,超過80%可以正確預測的檢測框是由負樣本錨點(錨點和對應人臉的交並比IoU小於一定閾值)回歸生成。這表明這些負樣本錨點展示出了極好的回歸能力,但是現有的方法都忽略了可以根據負樣本錨點進行學習。在本文中,我們提出了一種在線高質量錨點挖掘策略HAMBox, 它可以使得異常人臉(outer faces)被補償高質量的錨點。我們提出的HAMBox方法可以成為一種基於錨點的單步驟人臉檢測器的通用優化方案。

本文提出了在線高質量錨點挖掘策略HAMBox來給異常人臉補償最合適的錨點。我們首先基於RetinaNet建立了我們的高召回的人臉檢測器。接下來,我們細節化的列舉了在線高質量錨點補償策略。最後,我們針對補償錨點構建了基於回歸敏感的focal loss。

基於錨點的高召回 人臉檢測器

已有的人臉檢測器利用錨點來構建一個結合分類和坐標框回歸的多任務學習問題。我們以RetinaNet作為基線。特徵提取器是ResNet-50。遵循S3FD[3]的設置,我們採用了conv2的特徵來提升檢測器效果。

受啟發於圖一的數理統計,我們調整錨點尺寸(0.68×{16, 32, 64, 128, 256, 512})來匹配到更多人臉。

在線高質量錨點 補償策略

在完成錨點尺寸和比例的設計後,我們需要進一步給錨點分配它們最近鄰的真值或者背景。如下圖所示,已有的錨點匹配策略由兩步組成。人臉首先匹配與之IoU大於一定閾值的錨點,然後不能夠匹配上任何錨點的人臉將被補償一個與之具有最大IoU的錨點。如圖c所示,第二步中被補償的錨點可能會降低網絡回歸和分類的效果,因為這些錨點本質上與人臉有更低的IoU。

我們驚訝的發現隨著訓練迭代次數的增加,一些負樣本錨點具有了正確預測的能力,然而這些錨點在回歸分支被忽略掉了,甚至在分類分支被賦予了背景類的標籤。受這個發現的啟發,我們提出了在線高質量錨點補償策略來解決已有的未對準監督信號的問題。

首先,每個人臉匹配與之IoU大於一定閾值的錨點。但是對於那些剩下的異常人臉來說,我們不補償任何的錨點。其次,在訓練過程中前向傳播的結尾,每個錨點通過它對應的回歸坐標計算回歸檢測框。我們定義B_reg為這個回歸檢測框,F_outer為異常人臉。最後,對於F_outer的每個人臉,我們計算它與B_reg的IoU,並且對這個人臉補償N個額外的負樣本錨點。我們定義所有的IoUs為IoU_set,這些N個補償的負樣本錨點根據以下兩個規則選出。(a)其對應的回歸框和目標人臉之間的IoUs應該大於一個閾值T(T表示在線的正樣本錨點的閾值)。(b)根據規則(a)計算的IoUs應該在IoU_set集合裡面的top-K高的IoU裡面。K是一個超參數,表示F_outer匹配到的錨點的最大數目。在經過以上兩條規則過濾後,如果N大於K-M,則我們在這N個負樣本錨點中選擇出top-(K-M)個高的IoU的錨點來補償這個臉,並且設置N=K-M。M表示第一步中人臉已經匹配上的錨點的數量。我們已經通過改變T,K做了很多消融實驗。

基於回歸敏感的 focal loss

在分析完以上兩章節後,我們已經挖掘出了高質量的錨點,接下來的問題是如何有效的利用這些錨點。我們提出了基於回歸敏感的focal loss來給予新補償的高質量錨點一個更合理的權重。

因此我們基於focal loss做出了兩個改進。(a)考慮到定位和分類之間的弱連接性,新補償的錨點被給予了基於IoU的動態權重。(b)我們定義同時滿足以下三個條件的錨點為可忽略錨點(在訓練中不被優化):

屬於高質量的錨點。在錨點匹配策略的第一步中,被賦予了背景類的標籤。不被包括於新補償的錨點中。

我們定義損失函數為:

除此之外,新補償的錨點的監督被添加到定位損失函數中,特定的公式如下:

總之,我們的主要貢獻可以總結為以下幾點:

我們第一個發現了如此令人鼓舞的現象:一些負樣本錨點有足夠強的回歸能力,並且已有的檢測框回歸分支忽略了這些負樣本錨點的學習。這些現象是限制已有檢測器效果的主要瓶頸之一,我們認為這個觀察對檢測方向具有極大的價值。基於該發現,我們提出了在線高質量錨點挖掘策略HAMBox來採樣訓練過程中的高質量錨點。受益於HAMBox的方法,我們能夠在訓練過程中給異常人臉提供足夠多的有效的錨點。

由於補償了高質量錨點,我們進一步提出了基於動態回歸的focal loss,它幫助人臉檢測器以更靈活的方式訓練。

我們的HAMBox需要的額外計算量幾乎可以忽略,並且它能夠被任意的插入到人臉檢測器中來提升效果。它在訓練階段,僅僅需要很少一部分額外性能成本,在推理階段不需要額外的性能成本。

我們的方法在驗證集和測試集上取得了超過業內最佳模型2.9%和2.3%個AP的效果。更重要的是,該方法幫助我們在2019年WIDER Face and Pedestrian Challenge上以mAP 57.13%獲得冠軍。

【神經網絡搜索角度:BFBox: Searching Face-appropriate Backbone and Feature Pyramid Network for Robust Face Detector. CVPR 20】

本文提出的方法——BFBox,是基於神經網絡架構搜索(NAS)的方法,同時搜索適合人臉檢測的特徵提取器和特徵金字塔。動機是我們發現了一個有趣的現象:針對圖像分類任務設計的流行的特徵提取器已經在通用目標檢測任務上驗證了其重要的兼容性,然而在人臉檢測任務上卻沒有取得預期的效果。同時不同的特徵提取器與特徵金字塔的結合也不是完全正相關的。首先,本文對於比較好的特徵提取器進行分析,提出了適合人臉的搜索空間;其次,提出了圖一的特徵金字塔注意力模塊(FPN-attention Module)去加強特徵提取器和特徵金字塔之間的聯繫;最後, 採取SNAS的方法同時搜出適合人臉的特徵提取器和特徵金字塔結構。多個數據集上(WIDER FACE, FDDB, AFW和PASCAL Face)的實驗表明了我們提出的方法的優越性。

如下圖所示為檢測網絡的結構。網絡是基於RetinaNet的結構加上我們提出的特徵金字塔注意力模塊(FPN-attention Module),訓練超網絡時採用的是隨機採樣的方法。

人臉檢測的討論

通過以上分析,我們講解了人臉檢測優化低維度的思路,包括特徵融合、上下文信息、錨點設計、額外監督、數據擴充、神經網絡搜索、感知野設計、單階段Refinement、頭部網絡設計、Anchor Free等。

也許有人會問,在算法設計上,人臉檢測和通用檢測又有什麼具體的區別呢?基於我們講解的幾篇文章,我們可以看出來:

人臉具有自己的特定結構化特徵,PyramidBox提出用半監督解決方案來生成與人臉檢測相關的具有語義的近似標籤,其上下文具有包含頭部、肩膀等強語義的信息。而通用檢測卻沒有這麼強的上下文語義相關性。人臉檢測框和人臉關鍵點信息足夠匹配,因此DenseBox通過多任務學習的方式引入了關鍵點定位,並且進一步提升了目標檢測的準確率。而通用檢測裡面往往無法引入關鍵點信息。針對圖像分類任務設計的流行的特徵提取器已經在通用目標檢測任務上驗證了其重要的兼容性,然而在人臉檢測任務上卻沒有取得預期的效果。BFBox重點分析了這種不兼容性底層的原因。

在人臉輕量級檢測未來的研究趨勢上,還有哪些點值得我們關注呢?如何在端邊雲上設計更加輕量化的檢測模型?在這方面,我們可以關注下AutoML、 int8量化、蒸餾、裁剪等工作的進展。這裡也歡迎大家關注我們組參與開發的飛槳PaddleSlim平臺,PaddleSlim 實現了目前主流的網絡量化、剪枝、蒸餾、AutoML四種壓縮策略,並可快速配置多種壓縮策略組合使用。我們人臉檢測方向基於PaddleSlim平臺也有對應的業務收益,同時我們也在PaddleDetection開源了輕量級人臉檢測模型FaceBoxes和BlazeFace,其搜索得到的模型結構,相比於原版模型,在FDDB評測集上的離散ROC曲線AP值(DistROC AP)幾乎不變的情況下,體積僅有240KB,壓縮了3.3倍。在高通驍龍855 ARMv8處理器上單線程測試加速1.22倍。

以上是"人臉檢測技術發展及百度「框」實踐"的全部內容。

相關焦點

  • 【人臉技術原理】(三)人臉關鍵點檢測(PFLD算法)
    人臉關鍵點檢測基礎知識人臉關鍵點檢測也稱為人臉關鍵點檢測、定位或者人臉對齊,是指給定人臉圖像,定位出人臉面部的關鍵區域位置,包括眉毛、眼睛、鼻子、嘴巴、臉部輪廓等和人臉檢測類似,由於受到姿態和遮擋等因素的影響
  • 百度人臉識別技術又進階啦!佩戴口罩也能「刷臉識人」
    如今,口罩就像外出必備的保護傘,在AI的加持下,它不再是「刷臉」通行的障礙物,能讓你在公司、校園、小區等場景中暢通無阻……近日,沒有被口罩「蒙蔽雙眼」的百度AI將口罩檢測及戴口罩人臉識別技術應用於百度公司園區的人臉閘機和AI測溫系統中,員工均可在佩戴口罩時刷臉識別身份,保障安全、高效復工。
  • 全國APP個人信息保護監管會舉行 百度參與APP技術檢測平臺共建
    中國信息通信研究院介紹了全國App技術檢測平臺相關情況。全國APP技術檢測平臺由包括百度在內的多家技術支撐單位提供檢測技術及引擎支持,平臺可對全國APP的個人隱私保護情況進行大規模合規檢查。電信終端產業協會發布《App用戶權益保護測評規範》10項標準及《App收集使用個人信息最小必要評估規範》8項標準,涉及人臉、通訊錄、麥克風錄音、位置、圖片、軟體列表、設備、錄像信息等多個方面,這些標準將為企業合規經營提供明確規範要求,為治理工作提供依據和支撐。
  • 百度大腦領先活體檢測+合成圖鑑別 讓人臉「照片活化」無從遁形
    如今,隨著人臉技術的日趨成熟,新興娛樂文化得到了極大的推動,尤其是隨著DeepFake、FaceSwap等人臉編輯及生成技術的發展,虛擬主播、人臉合成帶給人們全新的體驗,但同時也給信息安全帶來了潛在威脅。
  • 戴口罩也能人臉識別?百度AI放大招!兩年前這項技術曾獲世界大獎
    戴口罩也能人臉識別?在這場肺炎抗疫戰中,AI人工智慧正扮演著越來越重要的作用。昨天,百度正式宣布免費開源業內首個口罩人臉檢測及分類模型。通過這一技術,廣大科技公司廠商可以快速檢測出在人流密集區域攜帶和未攜帶口罩的所有人臉,並判斷其是否佩戴口罩。此舉意義重大。從疫情爆發以來,儘管各地防範措施的宣傳已經做得十分不錯,卻依然有不少心存僥倖的人員未佩戴口罩出行,這對公眾安全隱患會造成極大的威脅。
  • 百度大腦最新發布人臉合成圖甄別能力,人臉識別活體檢測更安全
    人臉識別中的活體檢測,普遍通過動作檢驗或靜默驗證,證明是「真人」而非圖片,其解決了用列印、翻拍照片、面具等通過人臉識別的問題,但依然有部分用戶上傳AI變臉、換臉等合成視頻企圖矇混過關。一系列「換臉」技術對人臉圖像的合成及篡改很難通過肉眼辨別真偽,且人臉數據涉及到用戶肖像、隱私等個人信息,篡改人臉數據也對用戶個人信息安全造成了威脅。
  • 國際領先技術初體驗:用百度大腦視頻人臉融合產品打造虛擬IP
    兩個威爾史密斯同臺比演技,大家都知道兩人同框時肯定有一個假的,但換臉技術進化到相當逼真的地步,讓觀眾愣是看不出替身的破綻……影視換臉,可以說是娛樂業的一大殺器,更有許多小夥伴幻想過打造自己的虛擬IP,不過這種技術一般得影視大廠才能實現。
  • ...2021收錄技術搶先體驗:用百度大腦視頻人臉融合產品打造虛擬角色
    在人工智慧技術發展的基礎上,越來越多的新業態正在湧現。近日,百度大腦開放平臺上線視頻人臉融合產品,用戶可通過人臉編輯技術,定製化生成非常接近真人的虛擬人臉圖,並可高保真地替換已有視頻素材中的形象。背靠百度大腦開放平臺領先的圖形圖像AI技術,這一產品解決了廣告創意、互動娛樂、遊戲影視等行業打造虛擬IP被高門檻要求拒之門外的痛點,同時又可以規避肖像權與隱私權風險,應用前景廣闊。
  • 人臉識別技術基礎知識
    用攝像機或攝像頭採集含有人臉的圖像或視頻流,並自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別的一系列相關技術,通常也叫做人像識別、面部識別。 人臉識別系統的研究始於20世紀60年代,80年代後隨著計算機技術和光學成像技術的發展得到提高,而真正進入初級的應用階段則在90年後期;近幾年隨著以深度學習為主的人工智慧技術進步,人臉識別技術得到了迅猛的發展。
  • 從百度沸點關鍵詞看2020後的技術走向
    今年一場突如其來的疫情,對全人類的經濟社會生活產生了消極影響,在這其中,在全球公共衛生風險不斷提升的同時,新一輪的技術進步也肉眼可見。首先是檢測技術的發展,疫情爆發以來,很多國家都迅速開發出便捷有效的檢測方法,大大提高了病例的確診速度。
  • 揭秘:兩張A4紙破解虹膜、人臉識別,百度安全技術小哥怎麼做到的?
    他叫小灰灰,是百度安全實驗室的技術小哥。   2017 年 10 月 24 日 GeekPwn極棒破解大會現場,他在主持人黃健翔、兩位評委以及眾多觀眾的見證下,把一個三星S8 手機塞進一個紙箱子裡,該手機已被現場評委用人臉識別鎖定。  當他再次把手伸出來時,手機已經解鎖。
  • 疫情加速百度人臉識別變革:戴口罩也能準確識別,迅速上線
    百度視覺對此做了一系列的優化。例如:檢測算法方面,採用了百度最新的PyramidBox-lite檢測算法,並加入超過10萬張口罩人臉數據訓練,在準確率不變的情況下,召回率提升了30%,佩戴口罩的人臉檢測準確率超99%以上。
  • 百度飛槳口罩人臉檢測與識別模型再升級,視頻教學帶你實戰
    自百度開源業界首個口罩人臉檢測及分類模型之後,開發者社區進行了充分討論並提出了該模型存在的一些問題和不足。在本文中,百度飛槳官方對這些反饋積極回應,同時提出四大升級方案,為開發者一一解惑。2月13日《百度開源業內首個口罩人臉檢測及分類模型》文章中介紹,該模型可以有效檢測在密集人流區域中攜帶和未攜戴口罩的所有人臉,同時判斷是否佩戴口罩。
  • 發布,百度要做人臉識別硬體了
    雷鋒網按:4月16日,百度為自家的視覺技術(人臉識別)發布了新品牌「度目」,並發布了四款硬體產品:人臉應用套件、AI鏡頭模組、視頻分析盒子、人臉抓拍機。在此次疫情期間,包括紅外測溫、人臉識別技術在諸如車站、機場等場景被廣泛應用於測溫巡邏、人群篩查,人臉識別「熱」也是必然。
  • 跳過人臉檢測和關鍵點定位,Facebook等提出實時3D人臉姿態估計新方法
    假設有一個已知的內在相機,姿態可以使 3D 人臉與它在照片中的位置一致。因此,姿態已經捕捉了照片中人臉的位置。然而,雖然增加了兩個額外的標量(6D 姿態 vs. 每個框的四個值),6DoF 姿態還可以提供人臉的 3D 位置和方向信息。最近,有些研究用上了這一觀察結果,通過提出邊界框和人臉關鍵點的多任務學習來提高檢測準確率。
  • 百度人臉識別可快速「驗明正身」
    如今,口罩就像外出必備的保護傘,在AI的加持下,它不再是「刷臉」通行的障礙物,能讓你在公司、校園、小區等場景中暢通無阻……近日,沒有被口罩「蒙蔽雙眼」的百度AI將口罩檢測及戴口罩人臉識別技術應用於百度公司園區的人臉閘機和AI測溫系統中,員工均可在佩戴口罩時刷臉識別身份,保障安全、高效復工。
  • 中國信通院最新報告:大數據、智能技術支撐「戰疫」 百度展現優異...
    3月2日,中國信息通信研究院聯合多家科技企業共同發布了《疫情防控中的數據與智能應用研究報告(1.0版)》,全景展現了大數據與人工智慧技術在此次疫情防控中的應用情況。報告指出,以百度為代表的中國科技企業充分激活AI技術潛力,在疫情分析與防範、醫療、復工復產等方面抗擊疫情令人印象深刻。新一代信息通信技術成為戰「疫」的強有力武器。
  • FACEBOOK人臉識別軟體系統強大,微美全息 (Nasdaq:WIMI)識別技術過硬
    網際網路和移動網際網路時代的「商業模式創新」帶來的投資紅利,隨著宏觀經濟環境、金融環境、市場和技術的發展,已經不再是未來十年的投資主流了,人工智慧技術已經成為了未來8-10年最大的投資機會,在這個領域的投資機會,即使用「遍地是黃金」來形容也不為過。20世紀60年代,人臉識別工程化應用研究正式開啟。
  • Unity人臉識別插件分享 | 技術貼
    人臉識別技術則藉助真人表演來為虛擬角色賦予豐富的表情與面部動作,小至皺眉帶動眼部肌肉的抽動,大致對話時嘴唇的張合,均可通過人臉識別技術來實現。本文為大家介紹三款在Unity中實現人臉識別的插件,再結合Unity引擎的實時渲染功能,輕鬆定製出次世代的虛擬角色。
  • 騰訊已開源高精度人臉檢測算法DSFD
    任務介紹人臉檢測算法是在圖像上檢測出人臉的位置(通常以矩形框形式輸出),是人臉配準、人臉屬性識別、人臉核身、人臉檢索等技術的基礎。隨著人工智慧行業的發展,人臉相關技術在社交娛樂、智慧零售、網際網路金融等領域得到了越來越廣泛的應用,同時也對人臉檢測技術提出了更多的挑戰。