BMVC18|無監督深度關聯學習大幅提高行人重識別性能(附Github地址)

2021-02-20 我愛計算機視覺

(歡迎關注「我愛計算機視覺」公眾號,一個有價值有深度的公眾號~)

本文選自BMVC2018的論文《Deep Association Learning for Unsupervised Video Person Re-identification》,使用無監督學習解決行人重識別的問題,更加貼近行人重識別的應用場景,同時性能也大幅提升。

作者信息:

深度學習方法已開始主導基於視頻的行人重識別(re-id)研究。但是現有方法主要考慮監督學習,需要手工標註大量的不同畫面的成對數據。因此,它們在現實世界的視頻監控應用中缺乏可擴展性和實用性。

(上圖來自本文第二作者所在公司Vision Semantics Ltd官網)

為了解決視頻行人重識別任務,本文作者發明了一種新的深度關聯學習(Deep Association Learning,DAL)方法,這是第一種在模型初始化和訓練中不使用任何身份標籤的端到端深度學習方法。 DAL通過以端到端方式聯合優化兩個基於間隔的關聯損失來學習深度重新匹配模型,這有效地限制了每個幀與最佳匹配的同一攝像機表示和跨攝像機表示的關聯。
實驗結果表明,DAL算法在三個基準測試(PRID 2011,iLIDS-VID和MARS)中顯著優於當前最先進的無監督視頻行人重識別方法。

作者認為,在視頻序列中,含有同一個人的並有視點、遮擋、姿態等變化的一小段視頻幀(作者稱之為tracklets)本身就是可以利用的信息源,在不加入其他人工標註的情況下,可以用來訓練用於行人重識別的神經網絡。
如下圖:

三個行人重識別資料庫(PRID 2011,iLIDS-VID和MARS)上的tracklets示例:

在上述數據上利用視頻中兩種數據一致性(Local Space-Time Consistency 與 Global Cyclic Ranking Consistency)進行關聯學習。

深度關聯學習(Deep Association Learning)示意圖:

包括同攝像頭內部關聯學習與跨攝像頭的關聯學習。

在三個行人重識別資料庫中相比其他無監督學習方法,性能取得了大幅提升。

代碼地址:
https://github.com/yanbeic/Deep-Association-Learning

代碼是MIT協議。

點擊閱讀原文可以在www.52cv.net查看本文。

更多精彩推薦:

基於OpenCV與Dlib的行人計數開源實現

重磅!清華&商湯開源CVPR2018超高精度人臉對齊算法LAB

(歡迎關注「我愛計算機視覺」公眾號,一個有價值有深度的公眾號~)

相關焦點

  • 可微圖學習&弱監督,中山大學提出新型行人重識別方法和史上最大...
    在本文中,中山大學研究者提出的弱監督行人重識別方法恰恰克服了這兩方面的障礙,並發布了一個大型行人重識別數據集。近期,中山大學發布了一種基於可微圖學習的弱監督行人重識別(person re-ID)方法和一個大型數據集。該方法結合可微圖學習和弱監督學習方法,為行人重識別深度神經網絡加入自動生成訓練標籤的模塊並與其一體訓練。
  • ECCV 2020|清華提出基於循環關聯的自監督行人再識別,無標籤ReID僅...
    他們提出了一種簡單有效的自監督行人再識別解決方案——CycAs,它的良好性能證明了針對任務設計的自監督學習大有可為。更多ECCV精彩內容,後臺回復「ECCV」即可查看!本文提出了CycAs,一種簡單、有效的自監督行人再識別解決方案,僅需兩個攝像頭拍攝到的行人視頻作為輸入,通過數據關聯的循環一致性即可學習到有鑑別力的行人再識別特徵。這是自監督學習在行人再識別領域的一次早期嘗試,CycAs的良好性能告訴我們針對任務設計的自監督學習大有可為。
  • 自步對比學習: 充分挖掘無監督學習樣本
    這項工作在無監督的目標重識別任務上顯著地超越最先進技術高達16.7%;領域自適應的目標重識別任務中,在無監督的目標域上超越最先進技術高達5.0%,同時可以提升有監督的源域性能高達6.6%。實驗結果充分證明其廣泛的應用場景及有效性:可被應用於解決無監督學習任務,也可被應用於利用額外無監督數據提升有監督學習的任務。代碼和模型均已公開,方法也被收錄於OpenUnReID代碼庫。
  • 深度學習與圖像識別
    例如語音識別採用高斯混合模型和隱馬爾可夫模型,物體識別採用SIFT特徵,人臉識別採用LBP特徵,行人檢測採用HOG特徵。2006年,Geoffrey  Hinton提出了深度學習。之後深度學習在諸多領域取得了巨大成功,受到廣泛關注。神經網絡能夠重新煥發青春的原因有幾個方面。首先是大數據的出現在很大程度上緩解了訓練過擬合的問題。例如ImageNet[2]訓練集擁有上百萬有標註的圖像。
  • 今日論文|機器「讀懂」二次元:無約束漫畫文本檢測與識別&深度聚類損失無監督度量&文本欄位標記一次學習&稀疏路由持續學習&MORE
    - 無監督深度距離度量學習(Unsupervised Deep Distance Metric Learning, UDML)旨在從未標記的數據集中學習嵌入空間中裡的樣本相似性。傳統UDML方法通常使用三重損失或成對損失,這需要挖掘正樣本、負樣本和錨點。但是,無人監督情況下沒有標註信息,因此具有挑戰。[2]提出一種克服該問題的新UDML方法。
  • 華人一作獲最佳論文獎,第四大視覺頂會BMVC大獎出爐
    英國機器視覺會議(BMVC)是英國機器視覺協會(BMVA)的年度機器視覺、圖像處理和模式識別會議。它是在英國舉行的有關計算機視覺和相關領域的主要國際會議之一。隨著知名度和質量的不斷提高,它已成為視覺大會中享有盛譽的會議。
  • 深度學習訓練過程可視化(附github源碼)
    其實很多還是無法可解釋,但是通過可視化,具體可以知道深度學習在訓練過程到底學習了哪些特徵?到底對該目標的哪些特徵感興趣?這些我們現在已經有很多渠道可以得知,我先給大家介紹幾個比價好的工具!1.深度學習網絡結構畫圖工具地址:https://cbovar.github.io/ConvNetDraw/
  • 超詳綜述 | 基於深度學習的命名實體識別
    基於無監督學習的NER方法10. 基於特徵的有監督學習NER方法(傳統機器學習)11.無監督學習方法,不需要標註數據,依賴於無監督學習算法;論文簡要地介紹了前三種方法,著重地介紹第四種方法。18年出的一篇綜述比較有意思,主題是複雜實體識別,也就是重疊實體或者非連續性實體。最近對此進行了一些研究,先挖個坑,後續整理一下工作,再做分享。
  • BMVC 2020 各獎項公布!最佳論文可能就是你要的漲點神器
    對於CNN,眾所周知的一大缺陷:即使圖片移動幾個像素都可能導致分類識別任務出現巨大的結果改變,對於號稱超越人類識別能力的CNN來說這是不應該的,是什麼造成這一問題的呢?其中重要原因是網絡中的被大量的用來降低參數兩的下採樣層造成了圖像邊緣等高頻信息的退化。
  • 深度 一篇文章帶你進入無監督學習:從基本概念到四種實現模型(附論文)
    無監督學習可謂是深度學習的聖杯,其目標是建立可兼容小數據集進行訓練的通用系統,即便是很少的數據。如今深度學習模型往往在大型監督型數據集上訓練。所謂監督型數據集,即每條數據都有一個對應的標籤。比如流行的 ImageNet 數據集,有一百萬張人為標記的圖像。一共有 1000 個類,每個類有 1000 張圖像。創建這樣的數據集需要花費大量的精力,同時也需要很多的時間。
  • 圖像識別中的深度學習【香港中文大學王曉剛】
    經典的人臉識別算法Eigenface[6] 在LFW測試集上只有60%的識別率。在非深度學習算法中,最高的識別率是96.33%[7]。目前深度學習可以達到99.47%的識別率[8]。  在欣頓的科研小組贏得ImageNet比賽冠軍之後的6個月,谷歌和百度都發布了新的基於圖像內容的搜尋引擎。他們採用深度學習模型,應用在各自的數據上,發現圖像搜索準確率得到了大幅度提高。
  • ECCV 2020 | 騰訊優圖8篇論文入選,涵蓋目標跟蹤、行人重識別...
    在競爭越來越激烈的情況下,本次ECCV 騰訊優圖實驗室共入選8篇論文,涵蓋目標跟蹤、行人重識別、人臉識別、人體姿態估計、動作識別、物體檢測等熱門及前沿領域,再次展示了騰訊在計算機視覺領域的科研及創新實力。
  • 2016深度學習重大進展:從無監督學習到生成對抗網絡 | 網際網路數據...
    無監督學習一直以來都是研究人員所面臨的一個主要挑戰。我們認為該領域在 2016 年真是發展得非常不錯,這主要是得益於在生成模型(Generative Model)上大量研究。無監督學習無監督學習指在沒有額外信息的情況下,從原始數據中提取模式和結構的任務,它與需要標籤的監督學習相互對立。使用神經網絡解決該問題的經典方法是自動編碼器。其基礎的版本由多層感知機(Multilayer Perceptron)組成,其中輸入層和輸出層有同樣的大小,並會訓練一個較小的隱藏層來恢復輸入。
  • ...2深度學習環境到神經機器翻譯,上手機器學習這些開源項目必不可少
    算法:如何處理和分析數據機器學習算法可利用數據執行特定的任務,最常見的機器學習算法有如下幾種:1.監督學習。監督學習使用以及標註過的和結構化的數據,通過制定一組輸入數據集合所需的輸出,機器可以學習如何識別目標並且映射到其他的學習任務上。
  • 從星際2深度學習環境到神經機器翻譯,上手機器學習這些開源項目必...
    算法:如何處理和分析數據機器學習算法可利用數據執行特定的任務,最常見的機器學習算法有如下幾種:1.監督學習。監督學習使用以及標註過的和結構化的數據,通過制定一組輸入數據集合所需的輸出,機器可以學習如何識別目標並且映射到其他的學習任務上。
  • 算法庫開源講座第三講:港中文在讀博士葛藝瀟主講無監督重識別算法庫OpenUnReID解析與開發實踐 | 公開課預告
    12月4日晚8點,算法庫開源講座第三講上線,由香港中文大學在讀博士葛藝瀟主講,主題為《無監督重識別算法庫OpenUnReID解析與開發實踐 》。近年來,在無監督學習的浪潮下,無監督及領域自適應的目標重識別任務也受到了大家的關注。
  • 半監督學習入門基礎(一)
    SSL的目標是要比單獨使用有標記數據訓練的監督學習技術得到更好的結果。這是半監督學習系列文章的第1部分,對這個機器學習的重要子領域進行了簡要的介紹。區分半監督學習,監督學習和無監督學習整個數據集中可用於訓練的有標記數據的範圍區分了機器學習的這三個相關領域。
  • NIPS2018深度學習(18)|亮點: 貝葉斯深度學習;圖卷積(論文及代碼)
    代碼地址https://github.com/yaringal/DropoutUncertaintyExps參數L的影響示例如下幾種方法在單詞識別中的效果對比如下代碼地址https://github.com/gablg1/ORGANJT-VAE對應的論文為Junction tree variational autoencoder for molecular graphgeneration代碼地址https://github.com/wengong-jin/icml18-jtnn
  • 【深度】從經典深度學習模型探討圖像識別新方向
    【導讀】1月22日,深度學習工程師George Seif發布一篇文章,主要介紹了一些經典的用於圖像識別的深度學習模型,包括AlexNet、VGGNet、GoogLeNet、ResNet、DenseNet的網絡結構及創新之處,並展示了其在ImageNet的圖像分類效果。
  • 深度學習角度 | 圖像識別將何去何從?
    這些經典的模型其實在很多博文中早已被介紹過,作者的創新之處在於透過這些經典的模型,討論未來圖像識別的新方向,並提出圖像識別無監督學習的趨勢,並引出生成對抗網絡,以及討論了加速網絡訓練的新挑戰。文章梳理了用於圖像識別的深度學習方法的脈絡,並對將來的挑戰和方法做了分析,非常值得一讀!專知內容組編輯整理。