《賣拐》是春晚經典小品之一。趙本山通過高超的「忽悠」手段把雙拐賣給了一個雙腿健康的陌生人。放到今天來看,其實我們可以通過一種AI技術,來研究本山大叔是如何一步一步變瘸,姿態是如何從正常演變成不正常,如何從正常人變成瘸子。
這就是人體姿態估計技術,可以實現人體動作、手指運動等姿態的估計,對於描述人體姿態、預測人體行為至關重要。
近日,芯翌研發團隊的論文《UDP-人體姿態估計無偏的數據處理方法》被人工智慧和計算機視覺領域頂級會議CVPR-2020接收。論文關注了人體關鍵點檢測問題的數據處理,提出用於人體姿態估計算法無偏的數據處理方法——UDP,能夠有效解決現有的SOTA人體姿態估計算法中的部分缺點,且在基本不增加模型複雜度的情況下,提升算法性能。
和已經被廣泛應用的人臉識別技術相比,人體姿態估計技術的「出鏡率」並不高。實際上,無論是在安防、刑偵還是在工業生產等領域,人們不經意的姿態動作,都能成為行為估計與識別的重要因素。
UDP彌補現行數據處理方法的缺點
多目標的人體姿態估計以檢測場景內所有人的關鍵點為目的,是既具研究價值又極富挑戰性的課題。芯翌通過深入的研究發現,數據處理作為人體姿態估計算法的一個重要組成部分,現行方法普遍存在兩個問題:一個是在測試過程中由翻轉圖像得到的結果和由原圖得到的結果之間存在偏差,另外一個問題是現有的state-of-the-art方法所使用的編碼解碼方法存在較大的統計誤差。
在對上述兩個問題進行了量化分析的基礎上,芯翌提出用於人體姿態估計的無偏的數據處理方法(UDP)。UDP包含兩個主要的思想,一個是在數據處理的時候,使用單位長度去度量圖像的大小,而非像素的多少,以解決第一個問題。另外,引入一種在理想情況下無統計誤差的編碼解碼方法。
UDP適用於所有top-down的方法,以幾乎可以忽略的計算代價,把現有state-of-the-art算法的性能提升到前所未有的高度。
突破痛點,為場景化落地助力
人體姿態估計技術因其準確度高、非接觸性等諸多優勢,應用價值比較高,既可以應用於伺服器智能引擎,也可以應用於抓拍機等嵌入式智能終端及邊緣盒子等。它的應用場景也比較廣泛。在智能監控領域,固定場景下的人體姿態估計可以應用於家庭監控,如對獨居家中的老年人摔倒情況的識別,也可應用於安保,通過監控識別出特殊的人體姿態,以便及時作出安全響應等。在刑偵領域,人體姿態估計能夠實現對嫌疑視頻片段的姿態識別比對,利用視頻智能分析手段認定嫌疑人,彌補同等條件下其它生物識別技術的應用盲點。
在一些特殊的行業領域,如港口作業場景等,人體姿態估計也有非常強的應用性。這類場景以室外或空曠園區為主,對於安全性要求比較高,傳統方式難以進行有效識別、判斷和防範,而人體姿態估計技術擁有遠距離、非受控的特點,可以有效加強這類場景下的安防體系,及時發現隱患,有效提高安全性。
從人臉到人體姿態,
芯翌探索生物識別新模式
目前,人體姿態估計已經成為繼人臉識別技術之後的又一個生物識別技術熱點,在計算機視覺的其他相關領域的研究中都起到了基礎性的作用,如行為識別、人物跟蹤、步態識別等。人體姿態估計算法也是芯翌在視頻監控、智能安防等領域非常重要的基礎技術之一。
此次在人體姿態估計算法數據處理上的突破,推動了這一技術的進一步發展。對於芯翌而言,在算法技術領域的探索,更多是期許多種技術能力能夠相輔相成,更好地服務於實際應用場景,為在更多場景化領域的技術解決方案落地打下堅實基礎。相信不久以後,人體姿態估計技術將陸續應用在智慧安防、刑事偵查、工業網際網路、運動員輔助訓練等多個領域。在技術突破的同時,芯翌也將不斷積極推動AI技術落地,探索「AI+」的更多可能性,為新基建助力。