大盤點!CVPR 2020目標檢測論文精選!CV必讀系列

2020-09-03 計算機視覺聯盟

本文為學習筆記

參與:王博kings,Sophia

最近結束的CVPR 2020在推動物體檢測方面做出了巨大貢獻。在本文中,我們將介紹一些特別令人印象深刻的論文。

1、A Hierarchical Graph Network for 3D Object Detection on Point Clouds(用於點雲3D目標檢測的分層圖網絡)

HGNet包含三個主要組件:

  • 基於GConv的U形網絡(GU-net)
  • 提案生成者
  • 提案推理模塊(ProRe Module)-使用完全連接的圖對提案進行推理

作者提出了一種注重形狀的GConv(SA-GConv),以捕獲局部形狀特徵。這是通過對相對幾何位置進行建模以描述對象形狀來完成的。

基於SA-GConv的U型網絡可捕獲多級功能。然後將它們通過投票模塊映射到相同的特徵空間,並用於生成建議。下一步,基於GConv的提案推理模塊使用提案來預測邊界框。

以下是在SUN RGB-D V1數據集上獲得的一些性能結果。

2、HVNet: Hybrid Voxel Network for LiDAR Based 3D Object Detection(HVNet:基於雷射雷達的三維物體檢測的混合體素網絡)

在本文中,作者提出了混合體素網絡(HVNet),這是一個用於基於點雲的3D對象檢測自動駕駛的一級網絡。

本文中使用的體素特徵編碼(VFE)方法包含三個步驟:

  • 體素化—將點雲分配給2D體素網格
  • 體素特徵提取-計算與網格相關的逐點特徵,該點特徵被饋送到PointNet樣式特徵編碼器
  • 投影-將逐點特徵聚合到體素級特徵並將其投影到其原始網格。這形成偽圖像特徵圖

體素的大小在VFE方法中非常重要。較小的體素尺寸可以捕獲更精細的幾何特徵。它們也更擅長對象本地化,但推理時間更長。使用較粗的體素可以獲得更快的推理速度,因為這會導致較小的特徵圖。但是,它的性能較差。

作者提出了混合體素網絡(HVNet),以實現細粒度體素功能的利用。它由三個步驟組成:

  • 多尺度體素化-創建一組特徵體素尺度並將它們分配給多個體素。
  • 混合體素特徵提取-計算每個比例的體素相關特徵,並將其輸入到關注特徵編碼器(AVFE)中。每個體素比例尺上的要素都是逐點連接的。
  • 動態要素投影-通過創建一組多比例項目體素將要素投影回偽圖像。

這是在KITTI數據集上獲得的結果。

3、Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud(Point-GNN:用於點雲中3D對象檢測的圖神經網絡)

本文的作者提出了一種圖神經網絡-Point-GNN-從LiDAR點雲中檢測物體。網絡預測圖形中每個頂點所屬的對象的類別和形狀。Point-GNN具有自動回歸機制,可以一次檢測多個物體。

所提出的方法包括三個部分:

  • 圖形構建:體素降採樣點雲用於圖形構建
  • T迭代的圖神經網絡
  • 邊界框合併和評分

以下是在KITTI數據集上獲得的結果:

代碼:https://github.com/WeijingShi/Point-GNN

4、Camouflaged Object Detection

本文解決了檢測嵌入在其周圍環境中的物體的挑戰-偽裝物體檢測(COD)。作者還介紹了一個名為COD10K的新數據集。它包含10,000張圖像,覆蓋許多自然場景中的偽裝物體。它具有78個對象類別。圖像帶有類別標籤,邊界框,實例級別和消光級別的標籤注釋。

作者開發了一種稱為搜索標識網絡(SINet)的COD框架。該代碼在這裡可用:

https://github.com/DengPingFan/SINet/

網絡有兩個主要模塊:

  • 搜索模塊(SM),用於搜索偽裝的物體
  • 用於檢測物體的識別模塊(IM)

以下是在各種數據集上獲得的結果:

5、Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector

本文提出了一個短時目標檢測網絡,該網絡的目標是檢測不可見類別的目標,並帶有一些注釋示例。

他們的方法包括注意RPN,多重關係檢測器和對比訓練策略。該方法利用少拍支持集和查詢集之間的相似性來標識新對象,同時還減少了錯誤標識。作者還貢獻了一個新的數據集,其中包含1000個類別,這些類別的對象具有高質量的注釋。https://github.com/fanq15/Few-Shot-Object-Detection-Dataset

該網絡體系結構由一個權重共享框架組成,該框架具有多個分支-一個分支是查詢集,其餘分支用於支持集。權重共享框架的查詢分支是Faster R-CNN網絡。

作者介紹了帶有多關係模塊的注意力RPN和檢測器,以在支持和查詢中的潛在框之間產生準確的解析。

以下是在ImageNet數據集上獲得的一些結果。

以下是在許多數據集上獲得的一些觀察結果。

6、D2Det: Towards High-Quality Object Detection and Instance Segmentation

本文的作者提出了D2Det,一種解決精確定位和精確分類的方法。他們引入了密集局部回歸,可以預測對象提案的多個密集框偏移。這使他們能夠實現精確的定位。

作者還介紹了區分RoI池方案,以實現準確的分類。合併方案從提案的幾個子區域進行採樣,並執行自適應加權以獲得區別特徵。

該代碼位於:https://github.com/JialeCao001/D2Det

該方法基於標準的Faster R-CNN框架。在這種方法中,Faster R-CNN的傳統盒偏移回歸被提議的密集局部回歸所替代。在該方法中,通過判別式RoI池增強了分類。

在兩階段方法中,第一階段使用區域提議網絡(RPN),第二階段使用單獨的分類和回歸分支。分類分支基於判別池。局部回歸分支的目標是對象的精確定位。

以下是在MS COCO數據集上獲得的結果:

連結:https://heartbeat.fritz.ai/cv...

計算機視覺聯盟 報導 | 公眾號 CVLianMeng

相關焦點

  • CVPR 2020 目標檢測論文精選
    字幕組雙語原文:CVPR 2020 目標檢測論文精選英語原文:CVPR 2020: The Top Object Detection Papers翻譯:雷鋒字幕組(李珺毅、沫年惜雪)一、基於在點雲上的3D目標檢測的分層圖形網絡原文標題:A Hierarchical Graph Network for 3D Object
  • CVPR2020|行人檢測與重識算法推薦論文源碼大盤點
    本文收集了CVPR 2020 一些行人檢測與人員重識別優秀論文,我們知道在視頻監控相關領域這些技術方向可以得到很好得廣泛應用。相關論文1.Detection in Crowded Scenes: One Proposal, Multiple Predictions曠視研究院提出密集場景檢測新方法:一個候選框,多個預測結果
  • CVPR2020|3D目標檢測算法推薦論文源碼大盤點
    本文收集了CVPR 2020 關於目標檢測相關論文和算法,自動駕駛依然熱門,所以帶動著3D目標檢測論文居多,當然2D目標檢測依舊熱門,神經架構搜索也開始在應用與目標檢測,樣本少和跨域的研究也是非常值得關注研究。
  • 多目標追蹤最新頂會論文集錦「ICML2020」【CVPR2020】
    【回復文章名字前面的編號 獲取論文pdf及項目源碼雲盤連結】cv02:實現實時多目標跟蹤cv03:基於不相交路徑消除的多目標跟蹤cv04:僅僅欺騙檢測是不夠的:對抗多目標跟蹤的攻擊cv05:學習多目標跟蹤的神經求解器cv06:如何訓練你的深度多目標跟蹤器
  • 300篇 CVPR 2019 Oral 論文精選匯總,值得一看的 CV 論文都在這裡
    CVPR 2019 Oral 論文精選PDF下載地址:https://ai.yanxishe.com/page/resourceDetail/819CVPR 2019 全部論文PDF合集下載地址:https://ai.yanxishe.com/page/resourceDetail
  • 做目標檢測,這6篇就夠了:CVPR 2020目標檢測論文盤點
    CVPR 2020 會議上,有哪些目標檢測論文值得關注?目標檢測是計算機視覺中的經典問題之一。憑藉大量可用數據、更快的 GPU 和更好的算法,現在我們可以輕鬆訓練計算機以高精度檢測出圖像中的多個對象。前不久結束的 CVPR 2020 會議在推動目標檢測領域發展方面做出了一些貢獻,本文就為大家推薦其中 6 篇有價值的目標檢測論文。
  • 「每周CV論文推薦」深度學習人臉檢測入門必讀文章
    歡迎來到《每周CV論文推薦》。在這個專欄裡,還是本著有三AI一貫的原則,專注於讓大家能夠系統性完成學習,所以我們推薦的文章也必定是同一主題的。人臉圖像是整個圖像處理領域裡面研究時間最長,應用最廣的方向,今天給大家介紹入門深度學習人臉檢測必讀的文章。
  • CVPR 2020 |基用於3D目標檢測的層級圖網絡
    論文:A Hierarchical Graph Network for 3D Object Detection on Point Clouds論文地址:https://www.aminer.cn/pub/5eccb534e06a4c1b26a834c7?
  • Hinton、Bengio、何愷明等經典論文貢獻:機器學習必讀TOP100論文
    http://www.cv-foundation.org//openaccess/content_cvpr_workshops_2014/W15/papers/Razavian_CNN_Features_Off-the-Shelf_2014_CVPR_paper.pdf本文考慮了一種問題,假設有一個現成的,針對某個具體問題A訓練好的CNN,僅僅使用它的前幾層來提取圖像信息
  • CVPR最有趣的5篇論文,不容錯過!內含最佳學生論文! | CVPR2017
    我們精選其中 5 篇論文,帶大家概覽國際學術界在動作識別、計算呈像、視覺跟蹤、時間定位、圖像資料庫方面的創新成果,除了論文下載、項目地址等資源連結,還有即將呈現在大會現場口頭報告的視頻,讓大家先睹為快。 1.
  • 機器學習必讀TOP 100論文清單:高引用、分類全、覆蓋面廣丨GitHub...
    http://www.cv-foundation.org//openaccess/content_cvpr_workshops_2014/W15/papers/Razavian_CNN_Features_Off-the-Shelf_2014_CVPR_paper.pdf本文考慮了一種問題,假設有一個現成的,針對某個具體問題A訓練好的CNN,僅僅使用它的前幾層來提取圖像信息
  • NeurIPS 2020最佳論文;全卷積網絡實現E2E目標檢測
    機器之心 & ArXiv Weekly Radiostation參與:杜偉、楚航、羅若天本周的重要研究包括 NeurIPS 2020最佳論文以及拋棄 Transformer 使用全卷積網絡來實現端到端目標檢測的探索。
  • CVPR 2020 | 商湯提出 Anchor-free 目標檢測新網絡
    1  導讀  CVPR 2020上,商湯移動智能事業群-3DAR-身份認證與視頻感知團隊提出了基於向心偏移的anchor-free目標檢測網絡centripetalnet,為基於關鍵點的目標檢測方法研究帶來了新思路。
  • 機器學習必讀TOP 100論文清單:高引用、分類全、覆蓋面廣
    本文整合了Hiton、Bengio、何愷明等大牛經典論文。想要入門機器學習,奈何領域的新論文太多,不知道該看哪一篇?自2017年以來,超越SOTA的方法天天有,但往往針對性非常強,不一定是顛覆機器學習圈的重要成果。又回到了熟悉的話題:要想入行,還得看高引用經典論文。
  • 三篇目標檢測最新論文 |PP-YOLO:一個有效且高效的對象檢測器實現
    (v1), last revised 27 Jul 2020 (this version, v2)]摘要:目標檢測是計算機視覺研究的重要領域之一,在各種實際場景中起著至關重要的作用。5秒免費獲取論文pdf文檔,及項目源碼Transformers端到端目標檢測
  • 曠世提出類別正則化的域自適應目標檢測模型 | CVPR 2020
    論文基於DA Faster R-CNN系列提出類別正則化框架,充分利用多標籤分類的弱定位能力以及圖片級預測和實例級預測的類一致性,從實驗結果來看,類該方法能夠很好地提升DA Faster R-CNN系列的性能   來源:曉飛的算法工程筆記 公眾號論文: Exploring Categorical
  • 22篇入選CVPR 2020,百度 15 篇精選論文詳解
    2、目標檢測&跟蹤論文:Associate-3Ddet: Perceptual-to-Conceptual association for 3D Point Cloud Object Detection
  • ECCV 2020論文大盤點-3D目標檢測篇
    重磅乾貨,第一時間送達 隨著自動駕駛的火熱,3D目標檢測在計算機視覺領域持續升溫,學術和工業界都有眾多研究學者,這其中基於點雲數據的3D目標檢測是主流,近年來基於單目RGB數據的也越來越多了。本部分總計 21 篇,1篇spotlight,8篇開源。
  • 【盤點影響計算機視覺Top100論文】從ResNet到AlexNet
    本文梳理了2012到2017年計算機視覺領域的大事件:以論文和其他乾貨資源為主,並附上資源地址。囊括上百篇論文,分ImageNet 分類、物體檢測、物體追蹤、物體識別、圖像與語言和圖像生成等多個方向進行介紹。 今年2月,新智元曾經向大家介紹了近5年100篇被引用次數最多的深度學習論文,覆蓋了優化/訓練方法、無監督/生成模型、卷積網絡模型和圖像分割/目標檢測等十大子領域。
  • CVPR 2020 Oral | 廈大、深度賦智提出指向性目標的實時聯合檢測...
    機器之心機器之心發布機器之心編輯部上個月,計算機視覺頂會 CVPR 2020 接收論文結果已經正式公布。在 6656 篇有效投稿中,最終有 1470 篇論文被接收,錄取率約為 22%。