(歡迎關注「我愛計算機視覺」公眾號,一個有價值有深度的公眾號~)
本文選自BMVC2018的論文《Deep Association Learning for Unsupervised Video Person Re-identification》,使用無監督學習解決行人重識別的問題,更加貼近行人重識別的應用場景,同時性能也大幅提升。
作者信息:
深度學習方法已開始主導基於視頻的行人重識別(re-id)研究。但是現有方法主要考慮監督學習,需要手工標註大量的不同畫面的成對數據。因此,它們在現實世界的視頻監控應用中缺乏可擴展性和實用性。
(上圖來自本文第二作者所在公司Vision Semantics Ltd官網)
為了解決視頻行人重識別任務,本文作者發明了一種新的深度關聯學習(Deep Association Learning,DAL)方法,這是第一種在模型初始化和訓練中不使用任何身份標籤的端到端深度學習方法。 DAL通過以端到端方式聯合優化兩個基於間隔的關聯損失來學習深度重新匹配模型,這有效地限制了每個幀與最佳匹配的同一攝像機表示和跨攝像機表示的關聯。
實驗結果表明,DAL算法在三個基準測試(PRID 2011,iLIDS-VID和MARS)中顯著優於當前最先進的無監督視頻行人重識別方法。
作者認為,在視頻序列中,含有同一個人的並有視點、遮擋、姿態等變化的一小段視頻幀(作者稱之為tracklets)本身就是可以利用的信息源,在不加入其他人工標註的情況下,可以用來訓練用於行人重識別的神經網絡。
如下圖:
三個行人重識別資料庫(PRID 2011,iLIDS-VID和MARS)上的tracklets示例:
在上述數據上利用視頻中兩種數據一致性(Local Space-Time Consistency 與 Global Cyclic Ranking Consistency)進行關聯學習。
深度關聯學習(Deep Association Learning)示意圖:
包括同攝像頭內部關聯學習與跨攝像頭的關聯學習。
在三個行人重識別資料庫中相比其他無監督學習方法,性能取得了大幅提升。
代碼地址:
https://github.com/yanbeic/Deep-Association-Learning
代碼是MIT協議。
點擊閱讀原文可以在www.52cv.net查看本文。
更多精彩推薦:
基於OpenCV與Dlib的行人計數開源實現
重磅!清華&商湯開源CVPR2018超高精度人臉對齊算法LAB
(歡迎關注「我愛計算機視覺」公眾號,一個有價值有深度的公眾號~)