ECCV 2020 | 騰訊優圖8篇論文入選,涵蓋目標跟蹤、行人重識別...

2020-12-22 DOIT

近日,計算機視覺方向的三大國際頂級會議之一的ECCV 2020公布論文獲獎結果。本次ECCV 2020有效投稿5025篇,最終被接受發表論文1361篇,錄取率為27%,較上屆有所下降。其中,oral的論文數為104篇,佔提交總量的2%;spotlight的數目為161篇,佔提交總量的5%;其餘論文均為poster。

ECCV (European Conference on Computer Vision,即歐洲計算機視覺國際會議)是國際頂尖的計算機視覺會議之一,每兩年舉行一次。隨著人工智慧的發展,計算機視覺的研究深入和應用迅速發展,每次舉行都會吸引大量的論文投稿,而今年ECCV的投稿量更是ECCV 2018的兩倍還多,創下歷史新高。在競爭越來越激烈的情況下,本次ECCV 騰訊優圖實驗室共入選8篇論文,涵蓋目標跟蹤、行人重識別、人臉識別、人體姿態估計、動作識別、物體檢測等熱門及前沿領域,再次展示了騰訊在計算機視覺領域的科研及創新實力。

以下為部分騰訊優圖入選ECCV 2020的論文:

01

鏈式跟蹤器:基於目標對回歸的端到端聯合檢測跟蹤算法

Chained-Tracker: 

Chaining Paired Attentive Regression Results for 

End-to-End Joint Multiple-Object Detection and Tracking

現有的多目標跟蹤(MOT)算法大多是基於傳統的先檢測後跟蹤的框架,包含目標檢測、特徵提取、目標關聯這三個模塊,還有少數MOT算法將三個模塊中的某兩個融合實現部分端到端跟蹤,本文提出了一種鏈式跟蹤算法Chained-TrackerCTracker業內首創兩幀輸入模式,可將上述三個模塊集成至單個網絡中,實現端到端聯合檢測跟蹤,是第一個將跟蹤算法中的目標關聯問題轉化為兩幀檢測框對(Box pair)回歸問題的算法。網絡的輸入為相鄰兩幀,稱之為節點(Chain node),網絡的輸出為表示同一個目標在相鄰兩幀中的檢測框對,相鄰節點的檢測框對可通過共同幀關聯。為進一步提高跟蹤效果,我們還設計了聯合注意力模塊來突出檢測框對回歸中的有效信息區域,包括目標分類分支中的目標註意力機制和身份驗證分支中的身份注意力機制。在不引入額外數據的情況下,CTracker在MOT16和MOT17上均獲得了SOTA的結果,MOTA分別為67.6和66.6。

算法框架圖:

網絡結構圖:

02

請別來打擾我:在其他行人幹擾下的行人重識別

Do Not Disturb Me:

Person Re-identification Under the Interference of Other Pedestrians

傳統的行人重識別假設裁剪的圖像只包含單人。然而,在擁擠的場景中,現成的檢測器可能會生成多人的邊界框,並且其中背景行人佔很大比例,或者存在人體遮擋。從這些帶有行人幹擾的圖像中提取的特徵可能包含幹擾信息,這將導致錯誤的檢索結果。為了解決這一問題,本文提出了一種新的深層網絡(PISNet)。PISNet首先利用Query圖片引導的注意力模塊來增強圖片中目標的特徵。此外,我們提出了反向注意模塊多人分離損失函數促進了注意力模塊來抑制其他行人的幹擾。我們的方法在兩個新的行人幹擾數據集上進行了評估,結果表明,該方法與現有的Re-ID方法相比具有更好的性能。

03

通過分布蒸餾損失改善人臉識別中的困難樣本

Improving Face Recognition 

from Hard Samples via Distribution Distillation Loss

目前基於深度學習的人臉識別算法已經可以較好的處理簡單樣本,但對於困難樣本(低解析度、大姿態等)仍表現不佳。目前主要有兩種方式嘗試解決這一問題。第一種方法是充分利用某種需要處理的人臉畸變的先驗信息,設計特定的結構或損失函數。這種方式通常不能方便地遷移到其他畸變類型。第二種方法是通過設計合適的損失函數,減小類內距離,增大類間距離,得到更具辨別能力的人臉特徵。這種方式一般在簡單和困難樣本上存在明顯的性能差異。為了提升人臉識別模型在困難樣本上的性能,我們提出了一種基於分布蒸餾的損失函數。具體來說,我們首先通過一個預訓練的識別模型構造兩種相似度分布(從簡單樣本構造的Teacher分布和從困難樣本的Student分布),然後通過分布蒸餾損失函數使Student分布靠近Teacher分布,從而減小Student分布中的同人樣本和非同人樣本的相似度重合區域,提高困難樣本的識別性能。我們在常用的大規模人臉測試集和多個包含不同畸變類型(人種、解析度、姿態)的人臉測試集上進行了充分的實驗,驗證了方法的有效性。

04

基於對抗語義數據增強的人體姿態估計

Adversarial Semantic Data Augmentation 

for Human Pose Estimation

人體姿態估計主要目的是定位人體的關鍵點坐標。目前的SOTA方法在嚴重遮擋、旁人幹擾、對稱相似三種困難場景中表現仍有待提升。一個主要的原因是這三種困難場景的訓練數據較少。之前的方法主要是利用scale、rotation、translation等global spatial transform的方法去進行訓練數據增強。這類常規的數據增強方法並不能對上述三種困難場景有提升和幫助。本文提出了一種Adversarial Semantic Data Augmentation(對抗語義數據增強方法)。該方法把人體分成多個有語義的部件,並對這些人體部件在不同的細粒度上進行重組,從而去模擬出上述三種困難場景。在重組人體部件的過程中,有多個空間變換參數來調節每一個人體部件,從而靈活的組合旁人遮擋、手臂交叉、複雜動作等情況。為了讓人體姿態估計網絡能更好的學習到對這些困難場景的魯棒性,我們設計了另外一個生成網絡(G)用於控制每個人體部件的空間變換參數,人體姿態估計網絡作為判別網絡(D)從G生成的困難樣本裡面去學習。G和D在訓練過程中互相對抗。G網絡不斷的生成各種困難樣本,以迷惑人體姿態估計網絡。而人體姿態估計網絡從這個對抗過程中也不斷提升了自己對困難場景的預測準確性。

05

基於特徵解耦的人臉活體檢測

Face Anti-Spoofing via 

Disentangled Representation Learning

活體檢測技術用於在身份驗證場景中確定對象是否為真人,以防禦照片、面具、屏幕翻拍等多種方式的攻擊,保證人臉識別安全。目前基於RGB圖像的活體檢測方法往往從圖片中直接提取判別性特徵,但該特徵可能包含了光照、背景或ID等與活體任務無關的信息,影響方法實際使用的泛化性。針對泛化性問題,本文從特徵解耦角度出發,提出以下創新點:

1、設計解耦框架將圖片特徵解耦成活體相關特徵和活體無關特徵兩部分,並利用活體相關特徵進行真假判別。

2、結合底層紋理特徵約束和高層深度特徵約束,進一步促進活體特徵的解耦。

3、探索並展示了影響活體特徵的因素,例如攻擊介質、採集設備等,進一步深入理解活體任務本質。

本文在多個學術數據集上證明了基於輔助約束的特徵解耦方法在活體任務上的有效性。

06

SSCGAN:基於風格跳躍連接的人臉屬性編輯

SSCGAN:

Facial Attribute Editing via Style Skip Connections

現有的人臉屬性編輯方法通常採用編碼器-解碼器結構,其中屬性信息被表達成一個one-hot向量然後與圖像或特徵層拼接起來。然而,這樣的操作只學到了局部的語義映射而忽略了全局的人臉統計信息。我們在本文提出通過修改通道層面的全局信息(風格特徵)來解決這個問題。我們設計了一個基於風格跳躍連接的生成對抗網絡(SSCGAN)來實現精準的人臉屬性操縱。具體來說,我們在編碼器和解碼器之間的多個風格跳躍連接路徑上注入目標屬性信息。每個連接會抽取編碼器中的隱藏層的風格特徵,然後做一個基於殘差的映射函數來將這個風格特徵遷移到目標屬性的空間。接下來,這個被調整過的風格特徵可以用作輸入來對解碼器的隱藏層特徵做實例歸一化。此外,為了避免空間信息的損失(比如頭髮紋理或瞳孔位置),我們進一步引入了基於跳躍連接的空間信息傳遞模塊。通過對全局風格和局部空間信息的操縱,本文提出的方法可以得到在屬性生成準確率和圖像質量上都更好的結果。實驗結果表明本文的算法和現有的所有方法相比都有優越性。

07

基於時序性差異表徵的動作識別

Temporal Distinct Representation Learning 

for Action Recognition

2D卷積神經網絡已經廣泛應用於圖像識別當中並取得成功,研究人員現在在嘗試利用2D卷積神經網絡來對視頻進行建模。然而利用2D卷積的局限性在於視頻的不同幀共享參數,會導致重複、冗餘的信息提取,尤其是空間語義層面會忽略幀間的重要變化。在這篇工作中,我們嘗試通過兩種方式來解決這一問題:

是設計了一種通道層面的序列化注意力機制PEM來逐步地激活特徵中有區分性的通道,從而避免信息的重複提取;

是設計了一種時序多樣性損失函數(TD Loss)來強制卷積核關注並捕捉幀間的變化而不是表觀相似的區域。

在時序性較強的數據集something-something V1和V2上,我們的方法取得了SOTA效果;另外在時序性較弱但規模較大的Kinetics數據集上,我們的方法也取得了可觀的精度提升。

結構示意圖:

效果示意圖:

08

物體檢測中檢測框學習的深入優化

Dive Deeper Into Box for Object Detection

無錨框檢測模型現已成為具有最高檢測水準的最新方法,歸因於準確的邊界框估計。然而無錨框檢測在邊界定位上還有不足,對於具有最高置信度的邊界框仍有很大的改進空間。在這項工作中,我們採用了一種邊界重排序的邊界框重組策略,使得在訓練中能夠產生更優的邊界框, 從而對物體有更好的貼合。此外,我們觀察到現有方法在邊界框分類與位置回歸學習中存在語義不一致性,所以我們對訓練過程中分類與回歸目標進行了篩選,從而給出了語義一致性的學習目標。實驗證明我們的優化方法上對於檢測性能的提升十分有效。

方法示意圖

未經允許不得轉載:DOIT » ECCV 2020 | 騰訊優圖8篇論文入選,涵蓋目標跟蹤、行人重識別、人臉識別等領域

相關焦點

  • 騰訊優圖11篇論文入選,涵蓋動作識別、人群密度估計、人臉安全等...
    近日,國際人工智慧頂級會議AAAI 2021公布了論文錄取結果。AAAI是人工智慧領域最悠久、涵蓋內容最為廣泛的國際頂級學術會議之一。AAAI 2021一共收到9034篇論文提交,其中有效審稿的數量為7911篇,最終錄取數量為1692篇,錄取率為21.4%。
  • 騰訊優圖11篇論文入選,涵蓋動作識別、人群密度估計、人臉安全等領域
    近日,國際人工智慧頂級會議AAAI 2021公布了論文錄取結果。AAAI是人工智慧領域最悠久、涵蓋內容最為廣泛的國際頂級學術會議之一。AAAI 2021一共收到9034篇論文提交,其中有效審稿的數量為7911篇,最終錄取數量為1692篇,錄取率為21.4%。
  • 全球計算機視覺頂會CVPR 2020論文出爐:騰訊優圖17篇論文入選
    全球計算機視覺頂級會議CVPR2020 (IEEE Conference on Computer Vision and Pattern Recognition,即IEEE國際計算機視覺與模式識別會議) 即將於2020年6月14日-19日在美國西雅圖召開。本屆大會總共錄取來自全球論文1470篇,騰訊優圖實驗室入選17篇。
  • 萬字長文詳解騰訊優圖 CVPR 2019 入選論文
    今年有超過 5165 篇的大會論文投稿,最終錄取 1299 篇。此次,騰訊公司有超過 58 篇論文被本屆 CVPR 接收,其中騰訊優圖實驗室 25 篇、騰訊 AI Lab 33 篇,以下便是對騰訊優圖實驗室 25 篇被錄用論文的詳細介紹。1.
  • 騰訊優圖刷新人體姿態估計國際權威榜單,相關論文被 ECCV2020 收錄
    近日,騰訊優圖實驗室在人體2D姿態估計任務中獲得創新性技術突破,其提出的基於語義對抗的數據增強算法Adversarial Semantic Data Augmentation (ASDA),刷新了人體姿態估計國際權威榜單。
  • 百度的CVPR2020高光時刻——22篇論文 8項冠軍 2場Workshop
    近日,全球計算機視覺頂會CVPR 2020首次召開線上大會,百度不僅入選22篇接收論文,一舉拿下8項挑戰賽冠軍,涵蓋視頻動作分析、動作識別、圖像增強、智慧城市等多個領域,還主辦了2場重量級學術Workshop,在國際舞臺盡顯中國AI硬實力。這不僅從側面反映了百度傾斜AI「新基建」的策略已有成效,也再次讓中國自有的深度學習平臺飛槳閃耀全球。
  • 可微圖學習&弱監督,中山大學提出新型行人重識別方法和史上最大...
    弱監督行人重識別的問題定義如下圖 1 所示,其中圖 1(a)是常規全「監督」行人重識別問題,圖 1(b)是弱監督行人重識別問題,圖 1(c)是測試階段,兩種方式的測試階段一致。精煉行人重識別模塊如圖 6(c),按照公式 (8) 和(9)將粗糙行人重識別分數、外表和袋限制輸入圖模型,圖模型生成的偽標籤就能像人工標註的真實標籤一樣被用來更新網絡參數。
  • EMNLP 2018 | 騰訊AI Lab解讀16篇入選論文
    今年是騰訊 AI Lab 第 2 次參加 EMNLP,共有 16 篇文章入選,涵蓋語言理解、語言生成、機器翻譯等多個研究主題。以下為摘要解讀。此外,在今年的多個頂級學術會議中,騰訊 AI Lab 也入選多篇論文,位居國內企業前列,包括機器學習領域頂會 NIPS(20 篇)和 ICML(16 篇)、計算機視覺領域頂會 CVPR(21 篇)和 ECCV(19 篇),以及語音領域頂會 Interspeech(8 篇)等。
  • 鄭冶楓博士加入騰訊優圖,推動AI+醫療跨界融合
    雷鋒網(公眾號:雷鋒網) AI 科技評論消息,2018 年 1 月,醫療 AI 科學家鄭冶楓博士加盟騰訊優圖實驗室他至今共出版學術專著 3 本,在行業頂尖雜誌和會議上發表論文 100 多篇,被引用 4000 多次。共有將近 70 個美國專利申請和授權;很多專利也同時在多個國家(包括中國,德國,日本)獲授權。
  • 刷新濾波器剪枝的SOTA效果,騰訊優圖論文入選NeurIPS2020
    近日,騰訊優圖實驗室在模型壓縮任務中獲得創新性突破,提出的基於濾波器骨架的逐條剪枝算法(Stripe-Wise Pruning,SWP),刷新了濾波器剪枝的SOTA效果。相關論文(Pruning Filter in Filter)已被機器學習領域的國際頂級會議Conference on Neural Information Processing Systems(NeurIPS 2020)收錄。
  • CVPR2020即將舉行 優必選科技12篇入選論文搶先看
    6月14-19 日,大家期待已久的國際計算機視覺與模式識別頂級會議 CVPR 2020 將舉行。  本屆CVPR共收到6656篇投稿,有1470篇論文被接收,錄用率約22%,創下十年以來的最低記錄。
  • AI算法助力醫生快速識別新冠肺炎 揭秘騰訊背後的醫療AI專利
    2020年4月26日是第二十個「世界智慧財產權日」。今年世界智慧財產權組織發布的智慧財產權日主題是「為綠色未來而創新」,全國開展的智慧財產權宣傳活動周確定的主題為「智慧財產權與健康中國」。作為一家堅持科技創新的網際網路公司,騰訊一直重視智慧財產權保護,建立智慧財產權保護體系,鼓勵科技創新。
  • 30篇亮點論文、5大主題帶你一覽ECCV 2020研究趨勢
    編譯 | 陳彩嫻、Barack編輯 | 陳彩嫻ECCV 2020已圓滿落幕。會議收到了1360篇論文投稿,其中包含104篇Oral論文、160篇Spotlight論文和1096篇Poster論文。為了更好地了解ECCV 2020的會議內容,來自深度學習專業的博士生Yassine Ouali整理了論文投稿的數據,並從以下五大主題總結了一些取得突破性成就的論文,對其進行了簡要概述:識別、檢測、分割和姿態估計半監督、無監督、遷移、表徵和小樣本學習3D計算機視覺與機器人圖像和視頻合成視覺和語言與2018年相比,近兩年ECCV的論文投稿數量一直保持兩倍的增長,與CVPR 2020的論文投稿數量接近
  • 騰訊雲AI公有雲份額進入國內前三,騰訊優圖視覺AI全面發力
    從調用量以及營收來看,在人臉人體識別領域,騰訊雲依託人臉核身、特效、人臉融合能力,市場表現全面領先國內其他雲廠商。騰訊雲的背後,騰訊優圖實驗室持續輸出視覺AI能力,把多年的技術積累、產業實踐經驗尤其是人臉核身、特效、人臉融合等能力,通過騰訊雲對外開放。
  • 京東雲與AI 10篇論文被AAAI 2020收錄,京東科技實力亮相世界舞臺
    美國時間2月7-12日,AAAI 2020大會在紐約正式拉開序幕,AAAI作為全球人工智慧領域的頂級學術會議,每年評審並收錄來自全球最頂尖的學術論文,這些學術研究引領著技術的趨勢和未來。本屆會議共收到的有效論文投稿超過8800篇,其中7737篇論文進入評審環節,最終錄取數量為1591篇,錄取率為20.6%。
  • 騰訊優圖實驗室黃飛躍:科技向善 讓AI守護青少年網絡淨土
    9月11日,2020騰訊全球數字生態大會AI專場正式在雲端線上舉行。騰訊優圖實驗室副總經理黃飛躍發表了以《技術爆炸時代裡的優圖:從跋山涉水,到越過山丘》為主題的演講。他演講中表示,人類已經進入技術爆炸時代,人工智慧正成為未來經濟的主要增長點之一;驅動科技向善,AI應該更好的為社會服務。
  • 騰訊優圖實驗室黃飛躍:科技向善,讓AI守護青少年網絡淨土
    9月11日,2020騰訊全球數字生態大會AI專場正式在雲端線上舉行。騰訊優圖實驗室副總經理黃飛躍發表了以《技術爆炸時代裡的優圖:從跋山涉水,到越過山丘》為主題的演講。他演講中表示,人類已經進入技術爆炸時代,人工智慧正成為未來經濟的主要增長點之一;驅動科技向善,AI應該更好的為社會服務。
  • 雲知聲- CMU 合作論文入選全球 AI 頂會 NeurIPS 2020
    在官方公布的論文入選名單中,雲知聲與 CMU (卡內基梅隆大學)張坤教授團隊等合作的針對機器學習典型的無監督領域自適應問題論文《Domain Adaptation As a Problem of Inference on Graphical Models》,憑藉基於數據驅動的圖模型框架解決方案的創新研究成功入選,彰顯了雲知聲在人工智慧與機器學習原創技術領域的持續創新能力。
  • 騰訊優圖斬獲IJCAI 2020挑戰賽第一,首次提出卡通臉檢測算法ACFD
    近日,在人工智慧國際會議 (IJCAI) 舉辦的2020 iCartoonFace挑戰賽中,騰訊優圖實驗室基於自研的「千尋」檢測平臺,首次提出面向動漫場景的卡通臉檢測算法ACFD,並從國內頂尖學術機構和商業公司中脫穎而出,取得第一名的成績。目前,論文已在arXiv公開。
  • 韓端科技攜手騰訊優圖合作產品「Ui無人駕駛智能小車」發布
    9月8日,韓端科技與騰訊優圖合作產品「Ui無人駕駛智能小車」在深圳發布,2020-2021「韓端-優圖杯」AI科普主題活動啟動儀式同步舉行。據了解,本次發布會的新產品「Ui無人駕駛智能小車」是由韓端科技和騰訊優圖合作開發完成的,目前主要應用於青少年人工智慧基礎教育領域。