卷積神經網絡 物體檢測 SSD

2021-01-05 三姐的哥

2015年,YOLO之後,另外一個直接回歸的方法SSD,以state-of-the-art的檢測效果和檢測效率橫空出世;

SSD,single shot multibox detector

直接看下圖吧,可以看出,YOLO是在卷積層後加了FC,然後預估2*7*7共49個位置98BBox;而SSD顯著的不同就是多尺度:1) 多尺度的feature map上提取特徵,通過3*3的卷積核,保證特徵的細粒度和豐富性; 2) 多尺度feature map上抽取anchor,每張圖共有7308個BBox,遠大於YOLO的98;

上圖中,Conv4_3上面的Conv: 3*3(4*(classes+4)),前面的3*3是卷積核,後面的4是每個點的有4個anchor,所以這一層共有38*38*4個BBox,把7個卷積層加起來,一共就是7308個BBox;

另外,每個正例BBox學習的並不是絕對位置或者相對grid的位置,而是相對於ground truch的偏移,如下圖:

因此,其loss function包括兩部分,分類的confidence+回歸相對ground truth的位置偏移,如下:

在VOC和COCO上的效果

1. 準確率上:VOC達到最高80%,COCO這個小物體也是最高26.8%;

2. 速度上,500尺寸下,SSD和YOLO基本持平,20幀,但是mAP高10點;

另外,16年的YOLOv2在檢測效果和速度上更高一層,在效果保持state-of-the-art的基礎上,FPS能達到50+,是SSD的2倍+,但是!小物體檢測依然是YOLO的短板,COCO上的依然低於SSD5個百分點,如下:

SSD: Single Shot MultiBox DetectorWei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg

相關焦點

  • 卷積神經網絡 物體檢測 FPN
    2017年,kaiming和rbg再次合作(一作Tsung-Yi Lin),提出了FPN解決小物體檢測的問題FPN(feature pyramid network)從rcnn到fater rcnn,物體的分類都是在最後conv層的feature map上做的,而此時
  • 基於3D數據卷積神經網絡的物體識別
    打開APP 基於3D數據卷積神經網絡的物體識別 退思 發表於 2020-01-16 16:36:00 受此啟發,我們在Matroid公司所著的論文提出了FusionNet,這一框架用於在一個名為Princeton ModelNet的標準數據集上做3D CAD物體分類。 FusionNet的核心是全新的、應用於3D物體的三維卷積神經網絡(Convolutional Neural Networks, CNN)。我們必須在多個方面調整傳統的CNN以使其有效。
  • 卷積神經網絡 物體檢測 Faster-RCNN
    map轉化為固定的長度給全連接層,通過分類和位置組合Loss學習;在fast rcnn裡除了region proposal外,其他的部分都可以end to end了,fast rcnn不算region proposal是0.3s每張圖片,而region proposal最快也要0.2s,這就是本篇要解決的問題了,如何提升region proposal的效率,按照之前的套路肯定是加入到一個網絡中
  • 卷積神經網絡理解(一):濾波器的意義
    卷積神經網絡的發展二. 卷積神經網絡的重要性三. 卷積神經網絡與圖像識別四. 濾波器一.卷積神經網絡的發展卷積神經網絡受到視覺細胞研究的啟發,1962年,Hubel和Wiesel發現初級視覺皮層中的神經元會響應視覺環境中特定的簡單特徵(比如有向的邊等)。
  • 一文讀懂卷積神經網絡工作原理
    卷積神經網絡(Convolutional Neural Network, CNN)是人工神經網絡的一種,是當下語音分析和圖像識別領域的研究熱點。這篇文章用最簡明的語言和最直觀的圖像,帶你入門CNN。準備好了嗎?
  • 基於PVANet卷積神經網絡模型的交通標誌識別算法
    針對這一瓶頸問題, 採用對PVANet網絡的淺層特徵提取層、深層特徵提取層和HyperNet層(多層特徵信息融合層)進行改進的措施, 提出了一種適用於小目標物體檢測的改進PVANet卷積神經網絡模型, 並在TT100K(Tsinghua-Tencent 100K)數據集上進行了交通標誌檢測算法驗證實驗。
  • 卷積神經網絡(CNN)新手指南
    我們可以毫不猶豫迅速識別出我們周圍的環境以及物體,當我們看到一張圖片或者觀察周遭環境時,大部分時間我們都能馬上對場景做出判斷並且給每個物體都打上標識,這些甚至都不需要刻意去觀察。這些技能能夠迅速識別其模式,從我們以前的經驗中做出推論,然後將其運用至不同的圖片或者環境中——這些都是我們與機器不同的地方。
  • 計算機視覺(及卷積神經網絡)簡史
    幾年後,在1989年,一位年輕的法國科學家Yann LeCun將一種後向傳播風格學習算法應用於Fukushima的卷積神經網絡結構。 在完成該項目幾年後,LeCun發布了LeNet-5--這是第一個引入我們今天仍在CNN中使用的一些基本成分的現代網絡。在他面前的Fukushima,LeCun決定將他的發明應用於角色識別,甚至發布了用於閱讀郵政編碼的商業產品。
  • 解析卷積神經網絡的應用
    解析卷積神經網絡的應用 貿澤電子 發表於 2019-08-21 15:29:46 目前,人們對性能強大且結構複雜的計算機已是司空見慣。
  • 卷積神經網絡(CNN)簡易教程
    讓我們先來了解一下我們的大腦是如何識別物體的。我們將學習什麼是CNN, CNN如何利用大腦的啟發進行物體識別,CNN是如何工作的。讓我們來了解一下我們的大腦是如何識別圖像的根據諾貝爾獎獲得者Hubel和Wiesel教授的說法,視覺區域V1由簡單細胞和複雜細胞組成。
  • 人工智慧TensorFlow(十三)讀懂CNN卷積神經網絡
    ),然後抽象(大腦判定,眼前的物體的形狀,是圓形的),然後進一步抽象(大腦進一步判定該物體是只氣球)。CNN卷積神經網絡就是來源於此識別過程來實現。  卷積神經網絡  卷積神經網絡依舊是層級網絡,只是層的功能和形式做了變化,可以說是傳統神經網絡的一個改進。比如下圖中就多了許多傳統神經網絡沒有的層次。
  • 給你一個卷積神經網絡工作原理最直觀的解釋
    卷積神經網絡(Convolutional Neural Network, CNN)是人工神經網絡的一種,是當下語音分析和圖像識別領域的研究熱點。這篇文章用最簡明的語言和最直觀的圖像,帶你入門CNN。準備好了嗎?Let’s go——我們先從最基礎的內容說起。對二維數位訊號(圖像)的操作,可以寫成矩陣形式。
  • 卷積神經網絡的卷積到底是什麼
    卷積神經網絡是一種特殊的神經網絡結構,是自動駕駛汽車、人臉識別系統等計算機視覺應用的基礎,其中基本的矩陣乘法運算被卷積運算取代。 歷史 卷積神經網絡最初是由福島核電站在1980年引入的,當時名為Neocognitron。它的靈感來自於Hubel和Weisel提出的神經系統的層次模型。
  • 目標檢測|SSD原理與實現
    前言目標檢測近年來已經取得了很重要的進展,主流的算法主要分為兩個類型(參考RefineDet):(1)two-stage方法,如R-CNN系算法,其主要思路是先通過啟發式方法(selective search)或者CNN網絡(RPN)產生一系列稀疏的候選框,然後對這些候選框進行分類與回歸,two-stage
  • SSD物體檢測算法詳解
    物體檢測算法,按算法結構,可以分為one-stage和two-stage兩類。
  • 深度學習入門:淺析卷積神經網絡
    至今已有數種深度學習方法,如卷積神經網絡(CNN)、自編碼神經網絡(包括Auto encoder和Sparse Coding)和深度置信網絡(DBN),並在各個領域中取得了極好的效果。二卷積神經網絡搭建1.
  • Magic Leap公布卷積神經網絡SLAM定位技術
    文章相關引用及參考:roadtovr兩個深層卷積神經網絡(CNNs)提供的追蹤系統。
  • 卷積神經網絡在圖像領域中的發展及存在問題
    自1974年Paul Werbos等人提出反向傳播算法(BP算法),解決了由淺層的神經網絡模型應用到深層的神經網絡模型中線性不可分的問題。深層神經網絡一般使用反向傳播算法的方法來訓練,但是由於層數較多並且隨機初始化的方法較粗糙,隨著深度加深,會造成的訓練結果不穩定或產生「梯度消失」的問題,使得深層神經網絡無法work。
  • 9大主題卷積神經網絡(CNN)的PyTorch實現
    上文聚焦於源碼和論文,對於各種卷積神經網絡模型的實現,本文將介紹它們的 PyTorch 實現,非常有用!這份資源已經開源在了 GitHub 上,連結如下:https://github.com/shanglianlm0525/PyTorch-Networks先來個總結介紹,該系列的卷積神經網絡實現包含了 9 大主題,目錄如下:1. 典型網絡2. 輕量級網絡3. 目標檢測網絡4.
  • 卷積神經網絡做簡單任務原來有 BUG?UBER AI Lab 來支招
    Uber 在許多領域中都需要應用到卷積神經網絡,從設計自動駕駛車輛到路牌自動檢測,從地圖構建到最大化 Uber 市場中的空間調度效率。同時這些領域的研究又都涉及到坐標變換問題。任務簡化與發現二:卷積神經網絡不擅長處理基於監督的坐標分類任務那麼為什麼通過卷積神經網絡來處理監督渲染任務效果會這麼差呢?這點值得我們進行深入挖掘。畢竟,如果採用直接監督訓練的渲染任務都如此困難,那麼當我們採用無監督學習來實現渲染時,這只會變得更加困難。例如,在相同的數據集上訓練生成對抗網絡(GAN),並由一個訓練過的判別器來提供損失。