圖像識別中的卷積神經網絡

2021-02-26 畢老師大家庭

        深度卷積神經網絡(ConvolutionalNeural Networks, CNN)解決了傳統神經網絡參數量過大的問題,為圖像分類實現了突破。CNN在層級網絡結構的基礎上,以端到端的多層方式集成了不同的功能,並且功能的「級別」可以通過神經網絡的層數(深度)來豐富。得益於CNN卓越的模型性能,目前圖像識別技術幾乎都是以CNN模型來進行訓練。目前經典的卷積神經網絡模型有以下幾種:

    圖中表達了LeNet-5的結構:首先是一個5*5*6的卷積層,緊跟著是一個2*2*6的池化層,然後便是一個5*5*16的卷積層和2*2*16的池化層,最後跟著兩個長度分別為120,84的全連接層和一個長度為10的輸出層。


        LeNet-5的結構簡單,它的深度也和目前動輒幾十層上百層的CNN模型比起來顯得比較貧瘠,但後來的神經網絡都是在它的結構上進行擴張加深。LeNet-5用簡單的結構表現出了卷積神經網絡的三個要點:局部感受野、權值共享和下採樣。這三個要點也解釋了為什麼CNN能夠在結構更複雜的情況下擁有更少的參數和訓練準確率。

2.AlexNet

      Krizhevsky等人提出了AlexNet,這是一種LeNet-5的擴展模型,因為AlexNet首次將CNN用於計算機視覺領域中的ImageNet數據集而被廣為人知,從此揭開了CNN應用於計算機視覺領域的序幕。

       儘管AlexNet相比於LeNet-5僅在結構上進行了加深,但得益於硬體GPU強大的計算力,縱使是在大數據的情況下,GPU可以幫助研究者將原本需要數周乃至數月的網絡訓練過程縮短至短短幾天,這無疑大大縮短了深度網絡研究的時間成本。

3.VGGNet

  在2014年,VGGNet獲得ILSVRC分類任務比賽的亞軍。VGGNet具備更優秀的泛化能力,能夠用於圖像識別、檢索、圖片風格化等各種任務中,並且證明了網絡深度是模型優良性能的關鍵因素。

      而GoogleNet在2014年力壓VGGNet獲得了ILSVRC分類任務比賽的冠軍。GoogleNet應用了Inception V1的基本結構,在減少了參數量的情況下,實現了比VGGNet更高的分類精度。

5.ResNet

       VGGNet和GoogleNet的網絡已經有十幾層,已經屬於比較複雜的模型,但比起足足有152層的殘差網絡(Residual Network,  ResNet)仍然是小巫見大巫。ResNet創造性的應用了殘差模塊,使得訓練上百層的神經網絡成為可能,後來的CNN模型逐漸朝深度發展。

        如圖所示,x為淺層的輸出,H(x)為更深層映射的輸出,F(x)為夾在二者中間的兩層代表的變換。殘差結構複製x加給F(x),映射關係就變換為H(x):=F(x)+x。假設x代表的特徵映射已經足夠成熟,那麼在結構中,若任何對於x的改變都會使得損失變大,F(x)會自動趨於0,使x能夠從恆等映射的路徑中繼續傳遞。這樣就在不增加計算成本的情況下實現了最初的目的:在前向鏈路中,當淺層的輸出已經優化到一定程度時,讓深層網絡後面的層能夠實現恆等映射的作用。

參考文獻:

[1]A. Krizhevsky,I. Sutskever, and G. Hinton. Imagenet classification with deep convolutional neuralnetworks. In NIPS, 2012.

[2] LeCun et al. Grandient-based learningapplied to document recognition. THE IEEE,VOL. 86, NO. 11, NOVEMBER 1998.

[3] K. Simonyan, A. Zisserman. Very deepconvolutional networks for large-scale image recognition. In ICLR, 2015.

[4] Szegedy et al. Going deeper withconvolutions s[C]//Proceedings of the IEEE conference on computervision and pattern recognition.2015:1-9.

[5] He K, Zhang X, Ren S, et al. Deep ResidualLearning for Image Recognition. s[C]//Proceedings of the IEEE conference oncomputer vision and pattern recognition.2016:770-778.

相關焦點

  • 【論文精選】基於差分放大卷積神經網絡的小麥葉部病害圖像識別新方法
    基於差分放大卷積神經網絡的小麥葉部病害圖像識別新方法董萌萍1,牟少敏1*,時愛菊2,牟文芊1,孫文杰1(1. 山東農業大學信息科學與工程學院,泰安,山東 271018,中國;2.山東農業大學化學與材料科學學院,泰安,山東 271018,中國)摘要:為了提高小麥葉部病害圖像識別準確率,緩解深層網絡對迭代訓練中的誤差遺漏現象,提出了一種差分放大卷積神經網絡DACNN,其在較深的卷積層之間添加1條支路,放大真實輸出與期望輸出之間的微小差異,使權重更新對於每次迭代訓練產生的反饋誤差更加敏感,增強網絡的擬合能力,從而獲得更高的識別準確率
  • 在深度學習的革命中,談談卷積神經網絡(CNN)
    #掃描上方二維碼進入報名#文章連結:https://my.oschina.net/u/876354/blog/1620906
  • 華為開發者學院|卷積神經網絡與圖像處理,聽這一節課就夠了
    允中 發自 凹非寺量子位 編輯 | 公眾號 QbitAI隨著人工智慧技術越來越多地融入到我們的生活中,出現了智能音箱、智能助理、智慧機器人等實用性產品。華為開發者學院特邀國內首本TensorFlow知名書籍作者鄭澤宇老師,帶您了解卷積神經網絡基本原理和基本的卷積神經網絡結構,介紹圖像分類和圖像識別的核心思路和基本算法,在直播間中,您可將當前在學習中遇到的難點和困惑與大咖講師鄭澤宇交流,通過大咖的解讀,帶給你學習的方法與捷徑。
  • 卷積神經網絡在圖像分割中的進化史:從R-CNN到Mask R-CNN
    他在Medium上發布了一篇博客文章,介紹了在具體的圖像分割任務中如何應用卷積神經網絡,來得到更好的效果。圖4:在圖像分割中,其任務目標是對圖像中的不同對象進行分類,並確定對象邊界。卷積神經網絡可以幫助我們處理這個複雜的任務嗎?
  • 卷積神經網絡(CNN)綜述
    1989年,LeCun[4]結合反向傳播算法與權值共享的卷積神經層發明了卷積神經網絡,並首次將卷積神經網絡成功應用到美國郵局的手寫字符識別系統中。1998年,LeCun[5]提出了卷積神經網絡的經典網絡模型LeNet-5,並再次提高手寫字符識別的正確率。
  • 圖像識別技術的行業應用
    圖像識別,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術,自動識別圖像中的對象,人物,位置和動作等。圖像識別用於執行任務,是應用深度學習算法的一種實踐應用。如何實現圖像識別?圖像識別對於人類和動物來說是很自然的,但是對於計算機來說卻是一項極其困難的任務。
  • 圖像處理一定要用卷積神經網絡?這裡有一個另闢蹊徑的方法
    (CNN)以其局部權值共享的特殊結構在語音識別和圖像處理等方面得到了快速發展,特別是大型圖像處理方面,更是表現出色,逐漸成為了行業內一個重要的技術選擇。這裡雷鋒網從一個衛星圖像分析的具體實例出發,介紹了CNN建模和本地拉普拉斯濾波這兩種分析技術的效果對比,最終我們發現,本地拉普拉斯濾波的效果反而更好。  卷積神經網絡為了從衛星圖像中分析和評估一項自然災害造成的損失,首先需要得到相關地理區域實時的高解析度的衛星圖像,這是進行後續所有分析的數據基礎。
  • 卷積神經網絡概念與原理
    近年來卷積神經網絡在多個方向持續發力,在語音識別、人臉識別、通用物體識別、運動分析、自然語言處理甚至腦電波分析方面均有突破。       卷積神經網絡與普通神經網絡的區別在於,卷積神經網絡包含了一個由卷積層和子採樣層構成的特徵抽取器。在卷積神經網絡的卷積層中,一個神經元只與部分鄰層神經元連接。
  • 機器學習|卷積神經網絡(CNN) 手寫體識別 (MNIST)入門
    ,哪些不包含,你從我給的照片中總結出人臉的特徵,這就是訓練過程。所以文檔後面介紹的都是關於監督學習,因為手寫體識別需要有一些訓練集告訴我這些圖像實際上應該是什麼數字,不過監督學習的方法也有很多,主要有分類和回歸兩大類:
  • 用於圖像分割的卷積神經網絡:從R-CNN到Mask R-CNN
    選自Athelas作者:Dhruv Parthasarathy機器之心編譯參與:王宇欣、hustcxy、黃小天卷積神經網絡(CNN)的作用遠不止分類那麼簡單!在本文中,我們將看到卷積神經網絡(CNN)如何在圖像實例分割任務中提升其結果。
  • CDA 試聽課|什麼是卷積神經網絡運算?
    卷積神經網絡(Convolutional Neural Network,CNN或ConvNet)是一種具有局部連接、權重共享等特性的深層前饋神經網絡。卷積神經網絡最早是主要用來處理圖像信息。如果用全連接前饋網絡來處理圖像時,會存在以下兩個問題:(1)參數太多:如果輸入圖像大小為100 × 100 × 3(即圖像高度為100,寬 度為100,3個顏色通道:RGB)。在全連接前饋網絡中,第一個隱藏層的每個神經元到輸入層都有100 × 100 × 3 = 30, 000個相互獨立的連接,每個連接都對應一個權重參數。
  • CNN卷積神經網絡— LeNet(二)
    它的人工神經元可以響應一部分覆蓋範圍內的周圍單元,對於大型圖像處理有出色表現。一般神經網絡VS卷積神經網絡:相同點:卷積神經網絡也使用一種反向傳播算法(BP)來進行訓練不同點:網絡結構不同。卷積神經網絡的網絡連接具有局部連接、參數共享的特點。局部連接:是相對於普通神經網絡的全連接而言的,是指這一層的某個節點只與上一層的部分節點相連。
  • CNN卷積神經網絡原理講解+圖片識別應用(附源碼)
    而機器識圖的方式正好和繡十字繡的方式相反,現在有了一幅圖片,機器通過識別圖片中每個格子(像素點)上的顏色,將每個格子裡的顏色都用數字類型存儲,得到一張很大的數字矩陣,圖片信息也就存儲在這張數字矩陣中。
  • 使用CNN(卷積神經網絡)和OpenCV進行手勢識別
    要構建SLR(手語識別),我們需要做三件事:機器學習數據集構建機器學習模型(我們將使用CNN)應用模型平臺(我們將使用我們的機器學習數據集包含24個(J和Z除外)American Sign Laguage字母表的許多圖像。每個圖像的大小為28x28像素,這意味著每個圖像總共784個像素。
  • 卷積神經網絡(CNN)新手指南
    然而最經典的,或者說最流行的神經網絡使用範例是將其用於圖像處理領域。提到圖像處理,本文主要介紹的是如何使用卷積神經網絡來進行圖像分類。我們可以毫不猶豫迅速識別出我們周圍的環境以及物體,當我們看到一張圖片或者觀察周遭環境時,大部分時間我們都能馬上對場景做出判斷並且給每個物體都打上標識,這些甚至都不需要刻意去觀察。這些技能能夠迅速識別其模式,從我們以前的經驗中做出推論,然後將其運用至不同的圖片或者環境中——這些都是我們與機器不同的地方。
  • 卷積神經網絡(CNN)簡易教程
    這有助於對象識別,因為圖像表示對圖像變換(如平移、旋轉或小變形等)保持不變。我們使用卷積神經網絡進行圖像識別和分類。讓我們了解什麼是CNN,以及我們如何使用它。CNN是什麼?CNN是Convolutional Neural Network卷積神經網絡的縮寫,卷積神經網絡是一種專門用來處理數據的神經網絡,它的輸入形狀類似於二維的矩陣圖像。CNN通常用於圖像檢測和分類。圖像是二維的像素矩陣,我們在其上運行CNN來識別圖像或對圖像進行分類。識別一個圖像是一個人,還是一輛車,或者只是一個地址上的數字。
  • CNN卷積神經網絡層級結構
    在傳統的神經網絡中,比如多層感知機(MLP),其輸入通常是一個特徵向量:需要人工設計特徵,然後將這些特徵計算的值組成特徵向量,在過去幾十年的經驗來看,人工找到的特徵並不是怎麼好用,特徵有時多了(需要PCA降維),特徵有時少了(容易過擬合),有時選擇的特徵根本就不起作用(真正起作用的特徵在浩瀚的未知裡面)。這就是為什麼在過去卷積神經網絡一直被SVM等完虐的原因。
  • 深度學習入門:淺析卷積神經網絡
    它在語音識別、自然語言處理、計算機視覺、圖像與視頻分析、多媒體等諸多領域的應用取得了巨大成功。至今已有數種深度學習方法,如卷積神經網絡(CNN)、自編碼神經網絡(包括Auto encoder和Sparse Coding)和深度置信網絡(DBN),並在各個領域中取得了極好的效果。
  • 卷積神經網絡的前世今生
    作為人工智慧的核心研究內容,以卷積神經網絡(ConvolutionalNeural Networks, CNNs)為代表的深度學習技術已在計算機視覺應用,如智能監控、智慧醫療及機器人自動駕駛等領域取得突破性進展,而這些應用的成功落地很大程度上依賴於視覺識別模塊。結合前文內容,本章將詳細介紹如何構建並利用CNNs 這一功能強大的深度學習模型解決實際的圖像識別問題。
  • 卷積神經網絡小白入門手冊
    學習深度學習,最常接觸到的就是各式各樣的神經網絡了,其中卷積神經網絡是諸多神經網絡中最典型最常用的神經網絡了。本文原始素材來源於freecodecamp博客,經本人翻譯首發於此。希望能幫助到大家!覺得不錯就點個讚,或者關注下我吧,後續我還會分享更多相關的精彩內容。