MMDetection新版本V2.7發布,支持DETR,還有YOLOV4在路上!

2021-01-15 機器學習算法工程師

最近CV界最大的新聞就是transformer的應用,這其中最火的就是Facebook提出的基於transformer的目標檢測模型DETR(https://arxiv.org/abs/2005.12872)。目前,港中文維護的MMDetection庫發布了最新的V2.7版本,在新版本中支持DETR模型



其實transformer提出已久,但是主要在NLP領域,而且基於transformer的模型如BERT也徹底革新了NLP領域。所以,我們也期待transformer能夠同樣給CV領域帶來驚喜,畢竟CNN統治CV領域太長時間了,是時候需要加點新鮮料(雖然是NLP用過的料)。transformer的論文名是

Attention Is All You Need,其實從名字中就知道了transformer的核心組件是attention,關於transformer的解讀文章太大了,這裡不做詳細介紹,這裡簡單說一下transformer為啥可以應用在CV上。其實transformer主要適合處理的數據輸入是a set of objects,就是一坨東西然後attention。對於文本的句子來說,其實是一個word序列,而對於圖像來說,其實就是一堆像素點,其實這都在a set of objects的範圍內,另外transformer採用位置嵌入(positional encoding)來解決objects間的位置關係,所以無論是句子的word順序還是像素點的空間位置都可以解決。具體到目標檢測問題上,因為detection的輸出更是a set of objects,這簡直不能和transformer更契合了:


不過令大家失望的是,transformer帶給CV雖然是新的視角,但是性能上談不上超越。對於DETR來說,也存在一些問題,不如收斂慢訓練時間長,而且對小目標檢測不太好,不過也有一些新的工作開始做了改進:


Deformable DETR: Deformable Transformers for End-to-End Object Detection (https://arxiv.org/abs/2010.04159)Sparse R-CNN: End-to-End Object Detection with Learnable Proposals (https://arxiv.org/abs/2011.12450)
UP-DETR: Unsupervised Pre-training for Object Detection with Transformers (https://arxiv.org/abs/2011.09094)


我們也期待transformer能給檢測問題帶來更多驚喜,另外transformer也已經成功應用在圖像分類問題上,如ViT: An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale:


檢測和分類都有了,基於transformer的分割還遠麼,期待ing...


另外值得期待的一件事是,MMDetection庫已經有了YOLOv4的分支(https://github.com/open-mmlab/mmdetection/tree/yolov4),這意味不遠的明天你可以用上mmdet版本的YOLOv4模型:

@DETECTORS.register_module()class YOLOV4(SingleStageDetector):
def __init__(self, backbone, neck, bbox_head, train_cfg=None, test_cfg=None, pretrained=None): super(YOLOV4, self).__init__(backbone, neck, bbox_head, train_cfg, test_cfg, pretrained)



推薦閱讀

CNN:我不是你想的那樣

TF Object Detection 終於支持TF2了!

無需tricks,知識蒸餾提升ResNet50在ImageNet上準確度至80%+

不妨試試MoCo,來替換ImageNet上pretrain模型!

重磅!一文深入深度學習模型壓縮和加速

從源碼學習Transformer!

mmdetection最小復刻版(七):anchor-base和anchor-free差異分析

mmdetection最小復刻版(四):獨家yolo轉化內幕


機器學習算法工程師

                                    一個用心的公眾號

 


相關焦點

  • 使用Yolov5進行端到端對象檢測
    現在,Ultralytics已經發布了YOLOv5,具有可比的AP和比YOLOv4更快的推斷時間。這就產生了許多疑問:新版本是否保證了與YOLOv4相似的準確性?無論答案是什麼,這絕對是目標檢測界發展速度的一個標誌。
  • MMDetection v2.0 訓練自己的數據集
    1 新建容器進入正題 mmdetection docker環境上次已經介紹一次了 ,現在我們新建一個容器sudo nvidia-docker run -shm-size=8g -name mm_det -it -v /train_data:/mmdetection/datanvidia-docker:新建容器能調用GPU
  • PyTorch版YOLOv4更新了,適用於自定義數據集
    從今年 4 月 YOLOv4 發布後,對於這個目標檢測框架,問的最多的問題或許就是:「有沒有同學復現 YOLOv4 的, 可以交流一下麼」。由於原版 YOLO 使用 C 語言進行編程,光憑這一點就讓不少同學望而卻步。網上有很多基於 TF/Keras 和 Caffe 等的復現版本,但不少項目只給了代碼,並沒有給出模型在 COCO、PASCAL VOC 數據集上的訓練結果。
  • Facebook AI的DETR,一種基於Transformer的目標檢測方法
    要了解有關目標檢測的更多信息,請參閱以下文章:基本目標檢測算法的分步介紹https://www.analyticsvidhya.com/blog/2018/10/a-step-by-step-introduction-to-the-basic-object-detection-algorithms-part-
  • 從R-CNN到YOLO,一文帶你了解目標檢測模型(附論文下載)
    /yolo.torchhttps://github.com/nilboy/tensorflow-yolo相關應用:Darkflow:將darknet轉換到tesorflow平臺。利用分類標籤和自定義的數據進行訓練,darknet支持Linux / Windows系統。https://github.com/Guanghan/darknetIOS上的YOLO實戰:CoreML vs MPSNNGraph,用CoreML和新版MPSNNGraph的API實現小型YOLO。
  • 從零開始PyTorch項目:YOLO v3目標檢測實現
    在本教程中,我們將使用 PyTorch 實現基於 YOLO v3 的目標檢測器,後者是一種快速的目標檢測算法。本教程使用的代碼需要運行在 Python 3.5 和 PyTorch 0.3 版本之上。作者稱這幫助 YOLO v3 在檢測較小目標時取得更好的性能,而這正是 YOLO 之前版本經常被抱怨的地方。上採樣可以幫助該網絡學習細粒度特徵,幫助檢測較小目標。輸出處理對於大小為 416 x 416 的圖像,YOLO 預測 ((52 x 52) + (26 x 26) + 13 x 13)) x 3 = 10647 個邊界框。
  • YOLO項目復活!大神接過衣缽,YOLO之父隱退2月後,v4版正式發布
    然而學術界和開源社區的力量是強大的,YOLO v4開發者正是開發過Windows版和Linux版YOLO的Alexey Bochkovskiy。這次的YOLO v4在性能上相比前代也有巨大提升,在保持和前代相同運行速度下,精確度大幅提高。
  • mmdetection使用目標檢測工具箱訓練,測試
    商湯科技和港中大組成的團隊在 2018年的COCO 比賽的物體檢測(Detection)項目中奪得冠軍,而 mmdetection 正是基於 COCO 比賽時的 codebase 重構。https://github.com/open-mmlab/mmdetection這個開源庫提供了已公開發表的多種視覺檢測核心模塊。
  • Win10 v2004 最穩版本出爐!全新 UI 虛擬桌面,支持幾乎所有 CPU
    Win10 v2004 最穩版本出爐!全新 UI 虛擬桌面,支持幾乎所有 CPU看過我前面文章的朋友都知道,Windows 10 v2004 正式版將帶來全新的開始 UI 界面,基於 Chromium 內核的全新 Edge 瀏覽器,更強大的任務通知欄系統,全新的 Cortana(小娜) 對話式界面,新一代 Windows Subsystem for Linux,更人性化的系統設置/搜索功能,任務管理器增加
  • MMDetection 入門|二
    (https://github.com/open-mmlab/mmdetection/blob/master/demo/inference_demo.ipynb)中找到。異步接口-受Python 3.7+支持異步接口允許不阻塞GPU綁定推理代碼上的CPU,並為單線程應用程式提供更好的CPU / GPU利用率。
  • FineUIPro v3.0發布,手機、平板、桌面全支持!
    FineUI(專業版)v3.0.0 已經正式發布,全面支持手機、平板和桌面!
  • 百度Paddle Fluid v1.3版本官方正式發布
    前言:Paddle Fluid v1.3版本於今日發布,在基礎框架、預測引擎、模型建設、分布式訓練各個方向上完成多項升級。下面將Paddle Fluid v1.3版本所發布的內容,全面介紹給廣大開發者:重要更新統一Executor和ParallelExecutor接口,用戶只需通過CompiledProgram將單卡模型轉化多卡模型,並利用Executor進行訓練或者預測。
  • mmdetection最小復刻版(六):FCOS深入可視化分析
    貼一下github:https://github.com/hhaAndroid/mmdetection-mini歡迎star    不清楚retinanet結構的請看:mmdetection最小復刻版(二):RetinaNet和YoloV3分析    retinanet的結構大概可以總結為:resnet輸出是4個特徵圖,按照特徵圖從大到小排列,分別是c2 c3 c4 c5,stride
  • DRYCC Workflow v1.3.0 版本發布 - OSCHINA - 中文開源技術交流社區
    DRYCC工作流包括通過git push從原始碼構建和部署的功能、簡單的應用程式配置、創建和回滾發布、管理域名和SSL證書、提供無縫邊緣路由、聚合日誌以及與團隊共享應用程式。所有這些都是通過一個簡單的RESTAPI和命令行接口公開的。
  • 百度發布 Paddle Fluid v1.3 版本,帶來多項重要更新
    v1.3 版本,一如既往地, Fluid v1.3 版本在基礎框架、預測引擎、模型建設、分布式訓練各個方向上都實現了多項更新,而其中比較重要的更新包括:統一 Executor 和 ParallelExecutor 接口,用戶只需通過 CompiledProgram 將單卡模型轉化多卡模型,並利用 Executor 進行訓練或者預測。
  • Selenium v2.45.0 發布,支持 Firefox 36
    Selenium v2.45.0 發布,此版本現已提供下載:http://selenium-release.storage.googleapis.com/2.45/selenium-server-standalone
  • 《缺氧》v218235版本冷卻水方法
    導 讀 《缺氧》在近日更新了v218235版本,在新版本中有什麼不少內容改動,那麼在新的版本中如何冷卻水呢
  • Dubbo-go v1.5.1 發布,Apache Dubbo 的 Go 實現
    Dubbo-go 團隊近期發布了 Dubbo-go v1.5.1,Dubbo-go 是 Apache Dubbo 項目的 Go
  • Pholcus(幽靈蛛)爬蟲軟體 v1.0 穩定版正式發布
    自2015年5月 Pholcus 發布第一個版本起歷經一年的版本迭代,今日 v1.0 穩定版本終於正式發布了。在此感謝所有關注過Pholcus、反饋過開發建議以及運行bug的朋友們。
  • 版本更新丨新增化合物百科,KingDraw PC v1.1.0全新發布
    上周發布的【化合物百科】,大家用得還順手嗎?想不到吧,不過幾天的時間,我們的KingDraw PC版也完成了升級!KingDraw For Windows v1.1.0 已經正式發布!在最新PC版本中,我們添加了【化合物百科】入口,支持直接打開化合物百科檢索化合物,也支持用繪製好的結構式直接搜索,並且新增了多語言支持。