PyTorch 版 YOLOv4 更新了,可自定義數據集,還集成了 MobileNet

2022-01-09 計算機視覺聯盟

點上方藍字計算機視覺聯盟獲取更多乾貨

距離 YOLO v4 的推出，已經過去 5 個多月。YOLO 框架採用 C 語言作為底層代碼，這對於慣用 Python 的研究者來說，實在是有點不友好。因此網上出現了很多基於各種深度學習框架的 YOLO 復現版本。近日，就有研究者在 GitHub 上更新了基於 PyTorch 的 YOLOv4。

從今年 4 月 YOLOv4 發布後，對於這個目標檢測框架，問的最多的問題或許就是：「有沒有同學復現 YOLOv4 的，可以交流一下麼」。由於原版 YOLO 使用 C 語言進行編程，光憑這一點就讓不少同學望而卻步。網上有很多基於 TF/Keras 和 Caffe 等的復現版本，但不少項目只給了代碼，並沒有給出模型在 COCO、PASCAL VOC 數據集上的訓練結果。近日，有研究者在 GitHub 上開源了一個項目：基於 PyTorch 深度學習框架的 YOLOv4 復現版本，該版本基於 YOLOv4 作者給出的實現 AlexeyAB/darknet，並在 PASCAL VOC、COCO 和自定義數據集上運行。項目地址：https://github.com/argusswift/YOLOv4-PyTorch 除此以外，該項目還向主幹網絡添加了一些有用的注意力方法，並實現了 mobilenetv2-YOLOV4 和 mobilenetv3-YOLOV4。該項目向主幹網絡添加了一些注意力方法，如 SEnet、CBAM。

該研究還實現了 mobilenetv2-YOLOV4 和 mobilenetv3-YOLOV4（只需更改 config/yolov4_config.py 中的 MODEL_TYPE 即可）。下表展示了 mobilenetv2-YOLOV4 的性能結果：

Nvida GeForce RTX 2080TI

CUDA10.0

CUDNN7.0

windows 或 linux 系統

python 3.6

DO-Conv (https://arxiv.org/abs/2006.12030) (torch>=1.2)

Attention

fp_16 training

Mish

Custom data

Data Augment (RandomHorizontalFlip, RandomCrop, RandomAffine, Resize)

Multi-scale Training (320 to 640)

focal loss

CIOU

Label smooth

Mixup

cosine lr

運行腳本安裝依賴項。你需要提供 conda 安裝路徑（例如 ~/anaconda3）以及所創建 conda 環境的名稱（此處為 YOLOv4-PyTorch）。

pip3 install -r requirements.txt 
需要注意的是：安裝腳本已在 Ubuntu 18.04 和 Window 10 系統上進行過測試。如果出現問題，請查看詳細的安裝說明：https://github.com/argusswift/YOLOv4-PyTorch/blob/master/INSTALL.md。git clone github.com/argusswift/YOLOv4-PyTorch.git
然後更新配置文件「config/yolov4_config.py」中「PROJECT_PATH」。該項目準備了 Pascal VOC 和 MSCOCO 2017 數據集。其中 PascalVOC 數據集包括 VOC 2012_trainval、VOC 2007_trainval 和 VOC2007_test，MSCOCO 2017 數據集包括 train2017_img、train2017_ann、val2017_img、val2017_ann、test2017_img、test2017_list。# Download the data.cd $HOME/datawget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tarwget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tarwget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar# Extract the data.tar -xvf VOCtrainval_11-May-2012.tartar -xvf VOCtrainval_06-Nov-2007.tartar -xvf VOCtest_06-Nov-2007.tar
  2017 Train images [118K/18GB]   2017 Val images [5K/1GB]   2017 Test images [41K/6GB]   2017 Train/Val annotations [241MB]   #step2: arrange the data to the following structure   COCO   ---train   ---test   ---val   ---annotations
將數據集放入目錄，更新 config/yolov4_config.py 中的 DATA_PATH 參數。
（對於 COCO 數據集）使用 coco_to_voc.py 將 COCO 數據類型轉換為 VOC 數據類型。
轉換數據格式：使用 utils/voc.py 或 utils/coco.py 將 pascal voc *.xml 格式（或 COCO *.json 格式）轉換為 *.txt 格式（Image_path xmin0,ymin0,xmax0,ymax0,class0 xmin1,ymin1,xmax1,ymax1,class1 ...）。
1）darknet 預訓練權重：yolov4（https://drive.google.com/file/d/1cewMfusmPjYWbrnuJRuKhPMwRe_b9PaT/view）。mobilenetv2：（https://pan.baidu.com/share/init?surl=sjixK2L9L0YgQnvfDuVTJQ，提取碼：args）；mobilenetv3：（https://pan.baidu.com/share/init?surl=75wKejULuM0ZD05b9iSftg，提取碼：args）。3）在根目錄下創建 weight 文件夾，將下載好的權重文件放到 weight / 目錄下。4）訓練時在 config/yolov4_config.py 中設置 MODEL_TYPE。4. 轉換成自定義數據集（基於自定義數據集進行訓練）1）將自定義數據集的圖片放入 JPEGImages 文件夾，將注釋文件放入 Annotations 文件夾。2）使用 xml_to_txt.py 文件將訓練和測試文件列表寫入 ImageSets/Main/*.txt。3）轉換數據格式：使用 utils/voc.py 或 utils/coco.py 將 pascal voc *.xml 格式（或 COCO *.json 格式）轉換為 *.txt 格式（Image_path xmin0,ymin0,xmax0,ymax0,class0 xmin1,ymin1,xmax1,ymax1,class1 ...）。運行以下命令開始訓練，詳情參見 config / yolov4_config.py。訓練時應將 DATA_TYPE 設置為 VOC 或 COCO。CUDA_VISIBLE_DEVICES=0 nohup python -u train.py  --weight_path weight/yolov4.weights --gpu_id 0 > nohup.log 2>&1 &
它還支持 resume 訓練，添加 --resume，使用以下命令即可自動加載 last.pt。CUDA_VISIBLE_DEVICES=0 nohup python -u train.py  --weight_path weight/last.pt --gpu_id 0 > nohup.log 2>&1 &
修改檢測圖像路徑：DATA_TEST=/path/to/your/test_data# your own images。for VOC dataset:CUDA_VISIBLE_DEVICES=0 python3 eval_voc.py --weight_path weight/best.pt --gpu_id 0 --visiual $DATA_TEST --eval --mode detfor COCO dataset:CUDA_VISIBLE_DEVICES=0 python3 eval_coco.py --weight_path weight/best.pt --gpu_id 0 --visiual $DATA_TEST --eval --mode det
修改評估數據集路徑：DATA_PATH=/path/to/your/test_data # your own imagesfor VOC dataset:CUDA_VISIBLE_DEVICES=0 python3 eval_voc.py --weight_path weight/best.pt --gpu_id 0 --visiual $DATA_TEST --eval -
修改評估數據集路徑：DATA_PATH=/path/to/your/test_data # your own imagesCUDA_VISIBLE_DEVICES=0 python3 eval_coco.py --weight_path weight/best.pt --gpu_id 0 --visiual $DATA_TEST --eval --mode val
type=bboxRunning per image evaluation...      DONE (t=0.34s).Accumulating evaluation results...   DONE (t=0.08s). Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.438  Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.607  Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.469  Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.253  Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.486  Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.567  Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.342  Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.571  Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.632  Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.458  Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.691  Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.790
在 val_voc.py 中設置 showatt=Ture，網絡即可輸出熱圖。for VOC dataset:CUDA_VISIBLE_DEVICES=0 python3 eval_voc.py --weight_path weight/best.pt --gpu_id 0 --visiual $DATA_TEST --evalfor COCO dataset:CUDA_VISIBLE_DEVICES=0 python3 eval_coco.py --weight_path weight/best.pt --gpu_id 0 --visiual $DATA_TEST --eval
這是我的私人微信，還有少量坑位，可與相關學者研究人員交流學習 目前開設有人工智慧、機器學習、計算機視覺、自動駕駛（含SLAM）、Python、求職面經、綜合交流群掃描添加CV聯盟微信拉你進群，備註：CV聯盟
博士筆記 | 周志華《機器學習》手推筆記第一章思維導圖
博士筆記 | 周志華《機器學習》手推筆記第九章
點個在看支持一下吧

PyTorch 版 YOLOv4 更新了,可自定義數據集,還集成了 MobileNet

相關焦點

PyTorch 版 YOLOv4 更新了,不僅適用於自定義數據集,還集成了注意力和 MobileNet

PyTorch版YOLOv4更新了,不僅適用於自定義數據集,還集成了注意力和MobileNet

Scaled-YOLOv4 快速開始,訓練自定義數據集

乾貨 | YOLOV5 訓練自動駕駛數據集,並轉Tensorrt,收藏!

YOLOv4 的各種新實現、配置、測試、訓練資源匯總

YOLOv4最全復現代碼合集(含PyTorch/TF/Keras和Caffe等)

【CV】YOLOv4最全復現代碼合集(含PyTorch/TF/Keras和Caffe等)

YOLOv4的PyTorch最小化實現

使用google colab訓練YOLOv5模型

基於YOLOv5預訓練模型訓練自定義數據集實現檢測並分類圖像中的Logo功能

在Android上進行yolov5目標檢測,使用torchscript方式

【項目實踐】YOLO V4萬字原理詳細講解並訓練自己的數據集(pytorch完整項目打包下載)

目標檢測系列之五(YOLO V4)

pip安裝YOLOv5

深入淺出Yolov3和Yolov4

使用 YOLOv5 訓練自動駕駛目標檢測網絡

多平臺輕量級PyTorch模型推理框架MsnhNet

YOLOv5 深度可視化解析

YOLOV4視頻對象檢測,python+opencv輕鬆實現

實用教程詳解:用OpenCV的DNN模塊部署YOLOv5目標檢測

PyTorch 版 YOLOv4 更新了,可自定義數據集,還集成了 MobileNet

相關焦點

PyTorch 版 YOLOv4 更新了,不僅適用於自定義數據集,還集成了注意力和 MobileNet

PyTorch版YOLOv4更新了,不僅適用於自定義數據集,還集成了注意力和MobileNet

Scaled-YOLOv4 快速開始,訓練自定義數據集

乾貨 | YOLOV5 訓練自動駕駛數據集,並轉Tensorrt,收藏!

YOLOv4 的各種新實現、配置、測試、訓練資源匯總

YOLOv4最全復現代碼合集(含PyTorch/TF/Keras和Caffe等)

【CV】YOLOv4最全復現代碼合集(含PyTorch/TF/Keras和Caffe等)

YOLOv4的PyTorch最小化實現

使用google colab訓練YOLOv5模型

基於YOLOv5預訓練模型 訓練自定義數據集 實現檢測並分類圖像中的Logo功能

在Android上進行yolov5目標檢測,使用torchscript方式

【項目實踐】YOLO V4萬字原理詳細講解並訓練自己的數據集(pytorch完整項目打包下載)

目標檢測系列之五(YOLO V4)

pip安裝YOLOv5

深入淺出Yolov3和Yolov4

使用 YOLOv5 訓練自動駕駛目標檢測網絡

多平臺輕量級PyTorch模型推理框架MsnhNet

YOLOv5 深度可視化解析

YOLOV4視頻對象檢測,python+opencv輕鬆實現

實用教程詳解:用OpenCV的DNN模塊部署YOLOv5目標檢測

基於YOLOv5預訓練模型訓練自定義數據集實現檢測並分類圖像中的Logo功能