AI江湖風雲變幻 追求卓越永無止境
正如再厲害的功夫也需要參加武林大會一樣
參與公開數據集測試
是人工智慧公司驗證自身算法能力的
重要途徑
人臉識別作為計算機視覺領域中最熱門的派別
功夫紮實並且弟子眾多
而在人臉檢測領域眾多數據集測試中
WIDER FACE數據集測試
是公開的規模最大、檢測難度最高的
相當於人臉識別算法界的「華山論劍」
吸引了中國科技大學、百度、騰訊、京東等
各大門派的武林高手參與
9月27日
博觀智能人臉檢測算法團隊
突破多尺度、遮擋、多姿態下的人臉檢測等難題
刷新WIDER Face and Person Challenge 2019
人臉檢測開放榜單最佳成績
成為榜單中的第一高手
關於WIDER FACE人臉檢測數據集
WIDER FACE是目前業界公開的規模最大、檢測難度最高的人臉檢測數據集,由香港中文大學於2016年建立,按61個事件分類,涵蓋約40萬張人臉標註。
如圖所示,數據集應用極端的人臉尺寸變化、拍照角度引起的人臉姿態變化、不同程度的人臉遮擋、表情變化、光照強弱差異以及化妝等多種影響因素,各種角度的人臉與姿態變化大、遮擋嚴重,並存在多種風格的特點,是評估人臉檢測算法能力的權威數據集。而博觀此次刷新的WIDER Face and Person Challenge 2019是該數據集最新的開放榜單,是眾多研究機構與企業爭相挑戰的業界標杆。
關於博觀算法團隊如何如何突破業界難題
人臉檢測任務通常接受一張大圖,通過模型提取圖像特徵,並進行坐標回歸,最終得到全部人臉檢測框的位置。而在WIDER FACE數據集中,人臉像素小、表情複雜,給檢測算法提出了很高的要求。團隊通過在人工智慧算法技術領域的深入研發,基於自研AdaptNet深度網絡結構的不斷升級迭代,在人臉檢測算法的多領域取得了突破:
1、融合attention的FPN模塊:
在網絡的多尺度特徵圖融合時,採用自適應特徵加權替換了原來直接將特徵圖合併的方式,不僅使得淺層的位置信息更快傳遞到大目標的檢測特徵圖上,而且避免了不同解析度特徵圖互相干擾的情況,提高了大尺寸人臉的定位精度。對於不同姿態的人臉,每一個卷積擴張為1:1、1:2、2:1三種尺度,使之更容易學習到不同比例的人臉信息。
2、多階段訓練:
在數據集中,小像素的人臉比例較少,同樣模型對於小像素人臉的檢出率較差。算法團隊一方面將數據中的小像素人臉樣本提取出來做單獨的數據增強,另一方面,團隊進行了分階段訓練策略,單獨訓練大像素人臉和小像素人臉,最終再進行模型微調。這樣訓練的模型更容易收斂。
3、自對抗訓練:
博觀自研的網絡自對抗訓練算法,在模型中集成訓練。在訓練中期,將當前batch中未檢測到的目標提取出來,有效找出當前模型的缺陷,對這些困難樣本隨機貼圖再進行一輪額外訓練,對困難樣本的的檢出率得到了有效提升。