如何在行為識別領域奪冠?依圖有答案!

2020-12-01 網易新聞

(原標題:如何在行為識別領域奪冠?依圖有答案!)

繼蟬聯全球權威人臉識別競賽冠軍、先後刷新國際聲紋識別權威競賽(VoxSRC)紀錄、行人重識別(ReID)三大權威數據集之後,依圖在全球AI技術賽道再下一城,又攻下一個第一。

在權威機構ACM MM』20 Grand Challenge主辦的「大規模複雜場景人體視頻解析」挑戰賽中,依圖科技以大幅領先的成績拿下了「Track-4:行為識別」的第一名。

ACM是全球最大的計算機領域專業性學術組織,其評選的圖靈獎(A.M.Turing Award)被公認為世界計算機領域的諾貝爾獎。而ACM MM是全球多媒體領域的頂級會議,屬中國計算機學會(CCF)指定的A類國際會議。

在此次挑戰賽中,包括 Amazon、騰訊、大華科技、中山大學等上百支參賽隊伍參與了超過56000個複雜事件下的人體行為(包括排隊、打架、俯身、同行、跑動、滯留等)解析。視頻中行為識別是本屆比賽中的重點項目,目的是考察算法在複雜場景下對行為(包含多人追蹤、人體姿態、行為識別)的解析能力。

該賽事是該方向最接近真實場景的大規模挑戰賽,依圖科技奪冠的同時,其背後的技術創新和對行為識別難題的攻克一時間備受關注。

行為識別究竟有多難?

如果把人臉識別比作醫院的「普外門診」的話,行為識別尤其是人類的行為識別,其複雜度和識別難度不亞於「心血管內科+神經內科」。

場景複雜多變、動作差異化大、需要捕捉連續動作和長時間動作,這些對行為識別和分析都有著巨大的挑戰,也就需要算法對行為本身有更精準的分析推理能力,甚至還能通過既定的場景推算未曾見過的場景。

結合此次比賽,行為識別是指以人為基礎單位,只分析人的行為,關注單人的動作以及多人的動作(例如:一起走路、奔跑、打架等)。學術界通常用frame mAP (f-mAP@avg)來作為行為識別的評價指標,f-mAP@avg代表的含義是以關鍵幀為單位,評判行為的位置與分類是否準確;與學術界對行為識別的考察指標不同,此次競賽的評價標準是wf-mAP@avg,這意味著更注重對難度較大的擁擠場景的考察,以及比較少見的動作的識別,同時對於人體框的定位的精確性要求也更高。

深度優化算法框架,算法性能極致提升

比賽中,依圖算法的指標達到了wf-mAP@avg 0.26,將以往學術界中的基準算法提升了近3倍。與舉辦了多次的國際競賽不同,這次競賽是首屆,參賽隊伍在賽前也無法了解識別的類別、數據集的大小和識別的具體需求,要在短短一個多月的時間內,設計出最優的算法, 並在眾多實力強勁的隊伍中達到世界第一,難度極高。

首先,視頻相較於圖像的行為識別更加複雜,且如何建模、視頻幀之間的相關性仍是學術界一直存在的難題。依圖認為,當應用場景明確後,在已知分析的對象是人體且明確知道要識別的類別後,就可以針對性的進行算法優化,通過算法定製化來提升算法性能,解決以往不能很好解決的問題。

與此同時,如同一提到依圖大家就會想到多項人工智慧技術挑戰的世界冠軍,由不同場景帶來的先驗知識和經驗,有助於算法對行為的判斷。依圖此次創新性地將算法與場景進行了深度結合。一方面創新性的從視頻中自動提取到了準確豐富的場景信息,結合先進的行人檢測、行人重識別算法,全面構建了人與人、人與場景、人與物之間在視頻中的關係;另一方面,藉助多年來的算法積澱和對行業場景的理解,依圖對比賽中要求的特定的14類任務進行了深度算法優化。

值得關注的是,不同於其他參賽隊伍,依圖此次沒有使用複雜的多模型融合策略,僅用單模型,藉助強大的背景提取和分割算法,將行為的解析與場景結合,就大大降低了問題難度,這也意味著依圖仍可以進一步通過融合多個模型提升算法性能。

依圖在相關行為上持續迭代,不斷積累,行為識別算法的性能已遠超比賽當時的算法性能。同時,運用該技術落地實戰的項目難度也遠超比賽的數據集。

晶片+算法,加速AI技術落地

想像一下,未來運用該技術如何判斷一個都市夜歸人路遇劫匪而自動報警?如何在家中老人倒地時讓及時預警並第一時間告知監護人?如何判斷一個生產線上的工人施工順序出錯並即刻發出告警?如何在一個視頻中對內容進行精準理解,並為其貼上更合適的標籤使得能夠被更精準和更容易檢索到?

在依圖不斷開拓AI新領域的版圖上,相信這些問號背後的答案已逐漸清晰。此前,依圖科技自主研發的全球首款雲端視覺智能晶片求索(questcore™),開啟了算法設計與晶片設計相結合的時代。集合了高性能AI算法和晶片耦合設計優化的晶片平臺,結合世界領先的行為識別算法的依圖,將更有利於賦能智能城市、安全生產、智能商業等領域,打造新一代AI基礎設施。

近日依圖還通過了由英國標準協會(即「BSI」)頒發的ISO/IEC 27701:2019隱私信息管理體系國際認證,成為國內首家通過認證的AI公司。認證由國際標準化組織(ISO)和國際電工委員會(IEC)聯合發布,是全球首個針對隱私信息管理的國際標準,也被公認為是最嚴格、權威的隱私信息管理標準。獲得該認證充分體現了依圖對數據隱私保護的堅持和持續踐行。

新基建趨勢下,各行各業加快數位化,提升各類工作的智能水平成為剛需。作為目前國內唯一具有提供超大規模、複雜環境下億級規模城市的智能化運營管理技術能力的人工智慧公司,在硬核的技術實力和隱私保障上的不斷努力已形成一套「組合拳」,也即將加速解鎖更多的智能應用。

本文來源:大眾新聞 責任編輯:陳體強_NB6485

相關焦點

  • 依圖NIST奪冠,解密人臉識別算法原理
    其中冠軍被中國公司依圖科技再度摘得,中國科學院深圳先進技術研究院獲得第二名,排名前五的另一家企業是曠視科技。  依圖科技其實是第二次獲得NIST比賽人臉識別冠軍,去年6月NIST官方公布的測試結果中,依圖在千萬分之一誤報下達到識別準確率95.5%,是當時全球工業界在此項指標下的最好水平。今年依圖將這一指標提升到了接近極限的水平,即在千萬分之一誤報下的識別準確率已經接近99%。
  • 依圖NIST二次奪冠,人臉識別的幾種方法和解決姿態問題的三種思路
    打開APP 依圖NIST二次奪冠,人臉識別的幾種方法和解決姿態問題的三種思路 工程師黃明星 發表於 2018-06-29 19:45:00
  • 依圖朱瓏答《經濟學人》:人工智慧是為醫生服務,而非取代
    會上,依圖科技聯合創始人、CEO朱瓏受邀對話《經濟學人》美國商業編輯Vijay Vaitheeswaran(範思傑),二人對於技術如何解決中國醫療痛點、算法的公正性、中美人工智慧發展等諸多焦點議題進行了探討。  人工智慧有助改善醫療資源分配的不平衡  「好的醫生都集中在大城市是嗎?人工智慧如何改善這種狀況?」
  • 依圖科技入局語音識別,欲藉助高精確度算法促進行業透明化
    智能語音已然成為人工智慧細分領域中的一塊兵家必爭之地。12月11日,上海依圖網絡科技有限公司(下稱依圖科技)發布了依圖短語音聽寫算法(API),正式向語音識別進軍。依圖科技首席創新官呂昊在發布會上表示,雖然語音識別在日常生活中已得到一定規模的應用,但相關技術發展仍然不夠,未來還有十分巨大的發展空間。依圖成立於2012年,在人工智慧領域的主攻方向包括計算機視覺、自然語言理解、語音識別、人工智慧晶片。此前,這家「獨角獸」企業最為人所知的成就集中在人臉識別領域:今年6月份,依圖科技第二次獲得了NIST比賽人臉識別冠軍。
  • ACM全球冠軍、依圖科技聯合創始人:想奪冠的隊伍是沒有陪練的
    ……這是電影《碟中諜》的場景,而如今,一位叫林晨曦的年輕人,帶領他的依圖科技,使之成為現實。林晨曦,依圖科技聯合創始人。1997年考入上海交通大學材料學院,2000年轉入計算機系,2002年為交大奪得ACM全球大學生程序設計競賽總決賽首個冠軍,打破亞洲零紀錄。2005年加入微軟亞洲研究院。2008年進入阿里雲任技術總監,搭建中國首個擁有自主智慧財產權的分布式計算平臺「飛天」。2012年與同學朱瓏一起聯合創立「依圖科技」開始了人工智慧領域的探索和實踐。
  • 皓圖智能:通過3D行為識別技術改變傳統安防監控
    藉助2D圖像技術的傳統監控設備中看到的平面影像無論多麼高清,都無法實現精準的行為識別。因此,如何利用新的人工智慧技術解決傳統安防監控痛點「迫在眉睫」。成都皓圖智能科技有限公司由伯克利/耶魯團隊於2014年底創立,公司致力於3D行為識別與分析、機器學習及大數據應用的研究,其自主研發的核心技術——3D行為識別引擎,是目前世界上比較先進的人工智慧領域行為識別技術。
  • 依圖科技亮相全球GPU大會 攜手英偉達探索AI新疆界
    中國知名人工智慧公司依圖科技在大會展示了業界領先的人工智慧技術及商業應用解決方案,這些方案已經廣泛應用於智慧城市、醫療健康、商業智能、金融等領域。這是依圖科技首次在美國展示其全球最先進的人工智慧算法,並基於英偉達GPU驅動的商業技術方案。
  • 【乾貨】中國人臉識別產業鏈全景圖!
    這些身體特徵包括指紋、聲音、面部、骨架、視網膜、虹膜和DNA等人體的生物特徵,以及籤名的動作、行走的步態、擊打鍵盤的力度等個人的行為特徵。在不同的生物特徵識別方法中,人臉識別有其自身特殊的特性,因而在生物識別中有著重要的地位。具體來看,人臉識別具有非侵擾性、不需要人的被動配合、直觀、簡單等特性優勢,這些優勢為人臉識別的快速發展與應用提供了基礎。
  • 依圖醫療以AI技術賦能醫學數據
    服務於有想法、有情懷的信息人是聯盟的宗旨。此次會議上,健康信息技術創新聯盟理事長馮傑發表了聯盟成立的回顧與展望,並頒布了2017優秀創新案例獎。  依圖醫療作為AI醫療領域的唯一企業,獲得2017優秀創新案例獎。依圖醫療副總裁方驄博士與會發表了《AI賦能醫學數據》的主題演講,詳述AI技術和醫學數據在依圖碰撞出了怎樣火花,如何為醫生、患者和整個社會帶來顛覆性的創新。
  • 人臉識別和生物識別在支付領域上的風險
    指紋識別技術是現在使用最廣泛,成熟度最高的生物識別技術之一。從早期的軍事、公安偵查、政務等領域,到安全保障等民用領域,隨著方案進步、成本降低,又廣泛被應用到手機等消費級電子產品中。可用於設備解鎖、用戶登錄、敏感操作認證等場景中。其特徵是準確率高,但需要識別對象有專門的配合動作,並且信息採集難度高,基本屬於私密信息。二是人臉識別。
  • 國內醫療科技出現三小巨頭,微醫水滴依圖等優勢都在哪?
    大健康領域,有業內人士從市值規模、商業模式、技術創新等角度,稱平安好醫生、阿里健康、眾安在線為醫療科技領域頭部「三巨頭」,合稱「PAZ」。而今天本文所要講的這三家公司微醫、水滴、依圖,估值規模差不多,盈利模式相近,作為醫療科技領域的三小巨頭,合稱「WSY」。今年以來,「PAZ」在資本市場上備受投資者追捧,這三家公司的股價都翻倍增長。
  • 水螅行為都有啥?算法可學習識別
    ▲美國哥倫比亞大學研究人員發現,一種用於過濾垃圾郵件的算法可以學習和識別水螅的行為。圖中,水螅的神經元已被綠色螢光指示劑所標記。生物學家對動物行為的認知大多來自細緻的觀察和辛勤的記錄。現在,或許有一種更簡單的方法供他們選擇了。
  • 人臉識別的「囚徒困境」
    2018年,人臉識別這個美麗神話到底如何發展?人臉識別的「囚徒困境」一方面是大量資本湧向這個行業,另外一方面,則是人臉識別的變現渠道遙遙無期。因此,人臉識別行業被圈內人號稱「囚徒困境」,要多尷尬有多尷尬。
  • 7月,來世界人工智慧雲端峰會,看依圖醫療的「乘風破浪」
    作為上海本土人工智慧獨角獸,依圖已是連續3年參加世界人工智慧大會,care.ai全棧式AI解決方案也再度亮相,其在臨床診療、健康管理、疫情防控、醫藥研發、城市數據平臺建設、公共衛生決策支持等多個領域的進展受到關注。
  • 科大訊飛DCASE挑戰賽奪冠,「A.I.+工業」前景廣闊
    科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室(USTC-NELSLIP)在Task3任務中奪冠(截圖來源:DCASE挑戰賽官方網站)  這意味著,科大訊飛在人工智慧領域尤其是聲音定位與檢測技術上又有了長足進展
  • 人臉識別時代,我們該如何保護自己的隱私?
    人們刷臉支付、刷臉安檢、刷臉入住酒店……幾乎時時處處都要把臉推到前臺,但是頻繁刷臉背後是否存在安全隱患,我們的「臉」有沒有被盜用或濫用,到底應該如何在享受便利的同時保護自己的「臉」。凡此種種,都成為生活在人臉識別時代的我們需要關注的問題。「新技術總會有安全問題,人臉識別本身為生活提供了便利,而它最大的風險在於信息洩露。」
  • 「人工智慧第一股」依圖科技衝刺科創板,按下國產晶片加速鍵
    從技術角度看,依圖覆蓋的技術包含人工智慧晶片、人工智慧算法技術(計算機視覺、語音技術、自然語言理解技術等;從業務角度看,依圖面向智能公共服務及智能商業業務領域,提供人工智慧行業解決方案。1)人工智慧算力硬體產品將依圖區別於計算機視覺公司的最主要標誌就是「AI 晶片」,依圖是 AI 晶片創業企業中少有的已實現流片且規模化應用的公司。
  • 奪冠不到十天,單依純接連為兩部電影獻唱主題曲,厲害!
    相比往年的《中國好聲音》,2020年的《中國好聲音》顯得格外熱鬧,不只是導師選擇上有了新生代導師李宇春的加盟,而且這一季的冠軍單依純,這位只有18歲的小姑娘用她和年齡不相匹配的天籟之音徹底徵服了觀眾!
  • 人臉識別算法精度不斷提高 讓計算機「看人更準」(創新故事)
    原標題:讓計算機「看人更準」(創新故事)   在前不久的2018世界人工智慧大會上,經過3個多月激烈比拼的世界人工智慧創新大賽最高榮譽獎最終落定,分別是獲卓越獎的「亞馬遜AWS雲上AI創新」項目,獲應用獎的「中國工商銀行智慧未來銀行」項目,獲創新獎的「依圖智能人像大平臺」項目,以及獲先鋒獎的「密集連接卷積神經網絡
  • 有間諜!終止交易!來測測你的間諜行為識別能力
    人類社會間諜竊密行為早已有之《周禮·秋官·士師》記載了古代懲治八類犯罪行為的先例「掌士之八成:一曰邦汋,二曰邦賊當前國家安全領域正日益拓展這其中既包括傳統安全領域:政治安全、國土安全軍事安全、經濟安全文化安全、社會安全更囊括了非傳統安全領域