當CV碰上無人機:ICCV 2019 VisDrone挑戰賽冠軍解決方案解讀

2021-01-11 機器之心Pro

機器之心發布

作者:羅志鵬

近日,在 ICCV 2019 Workshop 舉辦的 Vision Meets Drone: A Challenge(簡稱:VisDrone2019) 挑戰賽公布了最終結果,來自深蘭科技北京 AI 研發中心的 DeepBlueAI 團隊斬獲了「視頻目標檢測」和「多目標追蹤」兩項冠軍。我們可以通過這篇文章來了解一下 DeepBlueAI 團隊的解決方案。

The VisDrone2019 挑戰賽

如今,配備攝像頭的無人機或通用無人機已經廣泛地應用在農業、航空攝影、快速交付、監視等多個領域。

挑戰賽官網地址:http://aiskyeye.com/

VisDrone2019 數據集由天津大學機器學習與數據挖掘實驗室 AISKYEYE 隊伍負責收集,全部基準數據集由無人機捕獲,包括 288 個視頻片段,總共包括 261908 幀和 10209 個靜態圖像。

這些幀由 260 多萬個常用目標(如行人、汽車、自行車和三輪車)的手動標註框組成。為了讓參賽隊伍能夠更有效地利用數據,數據集還提供了場景可見性、對象類別和遮擋等重要屬性。

本屆挑戰賽包含四個任務:

任務 1:圖像中的目標檢測。任務旨在從無人機拍攝的單個圖像中檢測預定義類別的對象(例如,汽車和行人);任務 2:視頻中的目標檢測。該任務與任務 1 相似,不同之處在於需要從視頻中檢測對象;任務 3:單目標跟蹤挑戰。任務旨在估計後續視頻幀中第一個幀中指示的目標狀態;任務 4:多目標跟蹤挑戰。該任務旨在恢復每個視頻幀中對象的軌跡。

數據集下載連結:https://github.com/VisDrone/VisDrone-Dataset

這次比賽的難點主要有:

1. 大量的檢測物體

與常規檢測數據集不同的是,每張圖片包含上百個待檢測物體,數據集總共含有 260 萬個標註框,如果使用佔用顯存較大的模型,可能會出現資源不夠的情況。同時面對一些重疊的結果時,我們需要選擇合適的閾值去過濾出最好的結果。

2. 部分目標過小

因為數據集是由無人機拍攝而來,行人和遠景的物體的標註框就非常小,這對模型產生 anchor 的能力形成了一定的挑戰,高解析度的空間信息和高質量的 proposal 在本次賽題中就顯得尤為重要。

3. 不同的數據分布

常用的數據集如:COCO 數據集、OBJ365 都是廣泛應用的數據集,所以大家經常用它們的預訓練來 fine-tune 其他數據集。而這一次的數據集由於拍攝角度問題,預訓練所帶來的效果不如預期。

評測指標

為了進行綜合評估並反映每個對象類別的性能,本次測評採用類似於 MS COCO 數據集的評估方案,使用 AP, APIOU=0.50, APIOU=0.75, ARmax=1, ARmax=10, ARmax=100, 和 ARmax=500,且這些指標是基於 10 個對象類別計算出來的。

最終,來自電子科技大學的李宏亮團隊獲得了 Task1「圖像中的目標檢測」的冠軍;中科院信息工程研究所的葛仕明團隊獲得了 Task3「單目標跟蹤挑戰」的冠軍;來自深蘭科技北京 AI 研發中心的 DeepBlueAI 團隊獲得了 Task2「視頻目標檢測」和 Task4「多目標追蹤」兩項冠軍。以下是 DeepBlueAI 團隊分享的解決方案

任務 2:視頻中的目標檢測

檢測器:Cascade RCNN + DCN + FPN + DH

團隊基於現有數據集,並結合以往檢測經驗,打造了一個強大的目標檢測器。

1. Cascade RCNN

用低 IoU 閾值進訓練會導致效果不好,因為會產很多噪聲框;所以我們希望閾值儘量,但 IoU 閥值設過時,訓練出的 detector 效果卻會呈現下降趨勢。Cascade RCNN 將多個閾值越來越的 detector 串聯,得到了更好的效果。

先,在每次 detector 計算後,IoU的 bbox 的分布都會提升,使得下階段更閾值下正樣本的數量得到保證;其次,每經過次 detector 計算,bbox 都會變得更準確,更的閾值可保證下次回歸效果更好。

2. DCN(Deformable Convolution Network)

deformable convolution network 提出了「deformable convolution」和「deformable RoI pooling」兩種網絡結構單元,deformable convolution 和 deformable RoI pooling 都是基於通過學習一個額外的偏移(offset),使卷積核對輸入 feature map 的採樣產生偏移,集中於感興趣的目標區域, 從而產生更好的感受野。

3. Double Heads

通過對比實驗可發現:用 fc-head 去做分類,同時用 conv-head 去做回歸,可以實現最好的效果。因為分類更多的需要語義信息,而回歸坐標框需要更多的空間信息,這種方法採用「分而治之」的思想,針對不同的需求設計 head 結構,當然這種方法增加了計算量,在平衡速度和準確率的情況下,最後選擇了 3 殘差、2non-local,共 5 個模塊。

實驗細節:

1. 我們將 Faster rcnn + DCN + FPN 作為我們的 baseline,因為這兩個模塊總是能在不同的數據集上起到效果。

2. 將原有 head 改為 Double head

3. 採用級聯檢測 (Cascade rcnn)

4. 將 ResNeXt101 作為 backbone

5. 使用 cascade rcnn COCO-Pretrained weight

6. 多尺度訓練+Testing tricks

實驗結果 (驗證集)

任務 4 : 多目標跟蹤

跟蹤算法:IOU tracker + KCF + tracklet vote

根據賽題描述與數據集分析結果,我們可以知道,如果圖中有大量目標且大部分都為小目標,在這種情況下仍然使用 reid 相關跟蹤算法的話,不僅最終效果不理想,而且也會在匹配排序的過程中耗費大量的資源,所以我們最終決定使用 iou-tracker。

原因:

使用不需要圖片信息,僅根據檢測結果的相鄰幀的 iou 進行計算;iou-tracker 對檢測結果有著較高的要求,我們對自己的檢測結果有信心;運行速度極快,不涉及到神經網絡,節省時間和 GPU 資源。

MOT Pipeline:

難點:使用 iou tracker 之後,還是會不可避免地遇到斷幀 (一條軌跡無法全部預測,被預測為多個子段) 的問題,這樣會大大降低最後的得分,所以我們使用 KCF 對現有結果進行一個更新。

KCF 的原理極為複雜,但 KCF 作用就是根據現有結果使用傳統算法,去預測之後幾幀的結果,這相當於對一些丟失的信息進行補充的操作。

得到新的軌跡之後再使用 IOU 相關投票融合方法,將更新後的結果融合,融合過程如圖所示:

KCF 更新軌跡之後,正常情況下軌跡之間就會有相互重疊的地方,我們使用一個基於 IOU 的投票方法,如果軌跡之間重疊部分的投票結果大於某個閾值,就將這兩個軌跡進行融合。

實驗細節:

1. 我們將任務二中的檢測結果當做輸入,先使用 GOG 方法作為我們的 baseline

2. 將方法改為 IOU tracker

3. 調整閾值,以及一些測試技巧

4.+KCF +tracklet voting

5. 得到更好的檢測結果

實驗結果 (驗證集)

實驗數據。

下一步工作

在檢測方面,在網絡結構上有一些其他可以使用的模塊,例如「PAFPN--FPN 的改進版」,可以在特徵提取之後更好地處理各層級之間的信息;以及「GCnet」,一種結合了兩個不錯的 attention 機制所得到的網絡,等等。

由於時間的限制,在更新原有跟蹤結果的時候,我們使用的是比較傳統的 KCF 算法,這類算法比較節省時間,但同時也有很大的局限性。如果有機會,以後想嘗試一些更好的、基於神經網絡的方法進行更新。

參考文獻

[1]Lin T Y , Dollár, Piotr, Girshick R , et al. Feature Pyramid Networks for Object Detection[J]. 2016.

[2]Dai J, Qi H, Xiong Y, et al. Deformable Convolutional Networks[J]. 2017.

[3]Cai Z , Vasconcelos N . Cascade R-CNN: Delving into High Quality Object Detection[J]. 2017.

[4]Xie S , Girshick R , Dollar P , et al. Aggregated Residual Transformations for Deep Neural Networks[C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE Computer Society, 2017.

[5]Bochinski E , Eiselein V , Sikora T . High-Speed tracking-by-detection without using image information[C]// 2017 14th IEEE International Conference on Advanced Video and Signal Based Surveillance (AVSS). IEEE, 2017.

[6]Henriques J F , Caseiro R , Martins P , et al. High-Speed Tracking with Kernelized Correlation Filters[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(3):583-596.

相關焦點

  • 圖鴨科技 CVPR 2019 CLIC 圖像壓縮挑戰賽冠軍方案全解讀
    2019 CLIC 圖像壓縮挑戰賽中,圖鴨科技所提出的算法 TucodecSSIM 奪得了 MS-SSIM 和 MOS 兩項指標的冠軍,算法 TucodecPSNR 奪得了 PSNR 指標的冠軍,算法 TucodecPSNR40dB 則奪得高碼點圖像壓縮 Transparent Track 的冠軍。
  • 交大學子獲第16屆歐洲計算機視覺大會VisDrone2020技術挑戰賽冠軍
    西安交通大學電信學部軟體學院教授龔怡宏組織研究團隊參加了此次會議舉辦的技術挑戰賽並獲得冠軍。 ,西安交通大學代表隊VisDrone-MOT提出的Coarse-to-Fine Multi-Class Multi-Object Tracking(COFE)方法獲得了多目標跟蹤競賽的冠軍。
  • 西電人工智慧學子斬獲2019 IGARSS數據融合競賽冠軍
    2019年IEEE國際地球科學與遙感大會(International Geoscience and Remote Sensing Symposium,IGARSS)會議由IEEE地球科學與遙感協會(IEEEGRSS)與東京大學聯合主辦,會議議題為「Disasters and Environment」。
  • 科大訊飛摘得ICFHR 2020數學公式識別挑戰賽冠軍
    近日,科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室,以顯著優勢獲得ICFHR 2020 OffRaSHME數學公式識別挑戰賽冠軍。這是科大訊飛繼ICPR 2018 MTWI圖文識別挑戰賽上獲得三項冠軍、ICDAR 2019 CROHME數學公式識別挑戰賽上獲得兩項冠軍後,在複雜版面文檔圖像識別理解方向上所取得的又一佳績,再次展現科大訊飛在相關領域的技術先進性。
  • ICCV 2019 Tiger Pose Detection 冠軍團隊技術分享
    2019 Workshop 舉辦的 CVWC2019 公布了最終結果,來自深蘭科技北京 AI 研發中心的 DeepBlueAI 團隊斬獲了 Tiger Pose Detection 賽道冠軍。我們可以通過這篇文章來了解一下 DeepBlueAI 團隊的解決方案。
  • IROS 2019 機器視覺全球挑戰賽:賦予 AI 終生學習能力(附冠軍算法...
    挑戰賽在澳門 IROS 2019 大會上成功舉辦。多位機器人領域大咖來到現場進行特邀報告和圓桌討論,包括:義大利技術研究院科學主任 Giorgio Metta 教授、漢堡大學張建偉教授、浙江大學章國鋒教授等知名學者,演講主題從 Lifelong Learning 算法到 SLAM 均有涉獵;同時,決賽入圍團隊——海康威視、新加坡南洋理工大學、香港中文大學等也在現場向大家分享了賽事算法報告,雷鋒網 AI 開發者將賽事內容及冠軍方案整理如下
  • 2060的猜想 圍觀2017洛杉磯設計挑戰賽
    洛杉磯設計挑戰賽除了最終的「評委獎」(Judges Pick),參賽隊伍還有機會贏得「行業獎」(Industry Pick),它由業內和媒體專業人員通過觀看參賽方案演示,投票選出他們最喜愛的方案。「大眾獎」(People Pick),由全球支持洛杉磯設計挑戰賽的愛好者在官網上投票選出他們最喜愛的方案(在線投票12月10日已截止)。按慣例,我們先介紹一下這三位獲獎作品。
  • 從CVPR到ICDAR 科大訊飛橫掃2019年度計算機視覺頂級會議多項冠軍
    從計算機視覺頂級會議CVPR的物體檢測挑戰賽DIW 2019到文檔分析與識別頂級會議ICDAR的手寫數學公式識別挑戰賽CROHME、場景文本視覺問答挑戰賽ST-VQA,這個6月不乏有一些計算機語言與人工智慧專業比賽陸續落幕。在這些行業賽事中,自然少不了科大訊飛的身影。
  • Kaggle座頭鯨識別落下帷幕,冠軍方案解讀
    點擊我愛計算機視覺標星,更快獲取CVML新技術本文經機器之心(微信公眾號:almosthuman2014)授權轉載,禁止二次轉載機器之心專欄作者:Earhian (喬健), YourVenn (王乙衡)不久之前,Kaggle座頭鯨識別挑戰賽結束
  • MICCAI 2019落幕,商湯成功舉辦兩大挑戰賽
    作為匯聚大量全球頂尖AI人才的創新企業,商湯科技深知人才培養的重要性,因此通過舉辦MICCAI 2019挑戰賽,一方面迅速定位具備出眾能力的參賽者,為他們提供展示自我的平臺,另一方面在競賽中也促進了人才交流、分享和學習,為AI醫療行業提供了一次迅速培養研究人員能力的機會。
  • 西班牙技術工組和無人機導航合作拓展了無人機的解決方案
    技術工組公司和無人機導航公司都擁有100%的西班牙資本,將為下一代武器系統(NGWS)/未來空戰系統(FCAS)等主要航空計劃貢獻其創新能力。技術工組公司和無人機導航公司擴大了無人機解決方案的範圍該協議產生的工業和技術合作將加強西班牙對大型歐洲未來空中系統計劃的貢獻技術工組公司和無人機導航公司已經籤署了一項在未來的航空系統範圍內進行戰略合作的框架協議
  • 2019《球球大作戰》塔坦杯精英挑戰賽新王誕生
    8月13日下午,由巨人網絡主辦的2019《球球大作戰》塔坦杯精英挑戰賽決賽終於順利在青島舉行。期間,選手們感受到了來自玩家們的熱情,重整旗鼓的六強戰隊TOP、CD、VLK、SC、RBT、STNB當天下午競技狀態極佳。
  • 京東AI Fashion-Challenge 挑戰賽冠軍方案詳解(風格識別+時尚單品...
    最終,「西天取京」隊以 0.6834 F2 Score 獲得時尚風格識別子賽道冠軍,「Fashion_First」隊以 0.5886 mAP 獲得時尚單品搜索子賽道冠軍。Fashion_First」隊成員如下:陳亮雨,中國科學院自動化研究所實習生吳旭貌,中國科學院自動化研究所實習生方治煒,中國科學院自動化研究所博士在讀劉靜(帶隊老師),中國科學院自動化研究所研究員以下為這兩個賽道冠軍方案
  • CVPR 2020 Anti-UAV Workshop徵稿啦,「反無人機」挑戰賽等你來戰
    近日,CVPR官方網站公布了Proposal的最終收錄結果,各式各樣的Workshop和挑戰賽已相繼啟動報名。2019年09月14日,沙烏地阿拉伯國家石油公司(阿美石油公司)兩處石油設施遭無人機襲擊,給沙特帶來了巨大的經濟損失,並導致國際油價在短期內飆升。如果能夠在受到襲擊傷害之前對入侵無人機進行精準探測,就能夠採取有效反制措施最大化降低損失。
  • 2020深圳無人機精英賽預賽決賽即將啟動
    40周年,響應《深圳市建設中國特色社會主義先行示範區的行動方案(2019—2025年)》中關於「全面推進光明科學城建設」的號召,全面貫徹落實國務院《新一代人工智慧發展規劃》(2017年7月20日印發)精神,宣傳特區40年發展成果,2020深圳無人機精英賽總決賽將於10月在深圳光明區舉行。
  • 淺談工業無人機在安防行業的解決方案
    在安防行業,工業無人機以成本低,易操縱,具有高度靈活性,可超低空飛行等特點,可從空中完成特殊任務,且工業無人機在執行特殊任務時,一般不會造成人員傷亡;工業無人機的生存能力強,機動性能好,使用方便。工業無人機能利用承載的高靈敏度照相機可以進行不間斷的畫面拍攝,獲取影像資料,並將所獲得信息和圖像傳送回地面。
  • 羅切斯特理工大學研究員獲Facebook眼動追蹤挑戰賽冠軍
    Facebook希望通過這項大賽來鼓勵社區開發先進眼動追蹤解決方案,而由三名羅切斯特理工大學Chester F. Carlson Center for Imaging Science的博士生領銜的團隊贏得了第一名。眼動追蹤功能可以幫助虛擬實境系統進一步實現更具沉浸感的體驗。所以,眼動追蹤必須準確,穩定,支持所有人和所有環境。
  • CIKM2019 挑戰杯冠軍方案:層次GNN模型在推薦中的應用
    現雷鋒網 AI 開發者將 WWG 團隊冠軍方案整理如下,希望能給開發者們一些經驗與啟發。冠軍團隊本次冠軍團隊WWG成員分別來自浙江大學,中央財經大學,阿里巴巴等機構;兩位學生孟憲令和焦宇航在阿里巴巴搜索推薦事業部的商業賦能算法團隊實習期間,參與了該比賽;比賽過程中,團隊負責人李朝博士,以及兩位師兄潘旭明和鄒朋成在算法的創新和思路上給予了一定的輔導。
  • 在中國,什麼才是ATP挑戰賽的意義?
    在安寧溫泉半島國際網球中心和球員酒店之間,豎著一個兩人多高的籤錶板,上面是2019昆明網球公開賽暨ATP安寧挑戰賽男單和男雙每一輪的對陣、比分以及選手們的國籍。
  • 鵬城不惑·光明有約-2020深圳無人機精英賽總決賽圓滿落幕
    10月11日,為期四個月的2020深圳無人機精英賽在光明區樓村小學順利舉行,賽事於6月份在光明區群眾體育中心開始啟動,在主辦單位的統籌安排、組委會的精心組織下,共吸引了來自光明、寶安、羅湖、南山、福田、龍崗6個區150支隊伍360人參賽,經過一個月的選拔,最終39支隊伍105人拿到總決賽名額,全市最優秀的飛行選手齊聚樓村小學,經過一天緊張激烈的角逐