一文讀懂卷積神經網絡工作原理 | 網際網路數據資訊網-199IT | 中文...

2020-12-11 199IT

卷積神經網絡(Convolutional Neural Network, CNN)是人工神經網絡的一種,是當下語音分析和圖像識別領域的研究熱點。

這篇文章用最簡明的語言和最直觀的圖像,帶你入門CNN。準備好了嗎?Let’s go——

我們先從最基礎的內容說起。

對二維數位訊號(圖像)的操作,可以寫成矩陣形式。

比如對圖像做平滑,一個典型的8領域平滑,其結果中的每個值都來源於原對應位置和其周邊8個元素與一個3X3矩陣的乘積:

也就相當於對原矩陣,按照順序將各區域元素與W矩陣相乘,W 矩陣為:

這也被稱作核(Kernel, 3X3)

其處理效果如下:

也就是,這個核對圖像進行操作,相當於對圖像進行了低通濾波。因此這個核也被稱為濾波器,整個操作過程按照概念稱為卷積。

擴展來講,對二維圖像的濾波操作可以寫成卷積,比如常見的高斯濾波、拉普拉斯濾波(算子)等。

濾波器跟卷積神經網絡有什麼關係呢。不如我們預想一個識別問題:我們要識別圖像中的某種特定曲線,也就是說,這個濾波器要對這種曲線有很高的輸出,對其他形狀則輸出很低,這也就像是神經元的激活。

我們設計的濾波器和想要識別的曲線如下:

假設上面的核(濾波器)按照卷積順序沿著下圖移動:

那麼當它移動到上面的位置時,按照矩陣操作,將這個區域的圖像像素值與濾波器相乘,我們得到一個很大的值(6600):

而當這個濾波器移動到其他區域時,我們得到一個相對很小的值:

如此,我們對整個原圖進行一次卷積,得到的結果中,在那個特定曲線和周邊區域,值就很高,在其他區域,值相對低。這就是一張激活圖。對應的高值區域就是我們所要檢測曲線的位置。

在訓練卷積審計網絡(CNN)的某一個卷積層時,我們實際上是在訓練一系列的濾波器(filter)。比如,對於一個32x32x3(寬32像素x高32像素xRGB三通道)的圖像,如果我們在CNN的第一個卷積層定義訓練12個濾波器,那就這一層的輸出便是32X32X12.按照不同的任務,我們可以對這個輸出做進一步的處理,這包括激活函數,池化,全連接等。

簡單來說,訓練CNN在相當意義上是在訓練每一個卷積層的濾波器。讓這些濾波器組對特定的模式有高的激活,以達到CNN網絡的分類/檢測等目的。

 一個實際CNN(AlexNet)第一個卷積層的濾波器>

卷積神經網絡的第一個卷積層的濾波器用來檢測低階特徵,比如邊、角、曲線等。隨著卷積層的增加,對應濾波器檢測的特徵就更加複雜(理性情況下,也是我們想要的情況)。

比如第二個卷積層的輸入實際上是第一層的輸出(濾波器激活圖),這一層的濾波器便是用來檢測低價特徵的組合等情況(半圓、四邊形等),如此累積,以檢測越來越複雜的特徵。實際上,我們的人類大腦的視覺信息處理也遵循這樣的低階特徵到高階特徵的模式。

可參考之前文章《為什麼無彩色系(黑白灰色)在色彩搭配中可以和諧地與任何彩色搭配?》

最後一層的濾波器按照訓練CNN目的的不同,可能是在檢測到人臉、手寫字體等時候激活[1]。

所以,在相當程度上,構建卷積神經網絡的任務就在於構建這些濾波器。也就是,將這些濾波器變成這樣(改變濾波器矩陣的值,也就是Weight)的——能識別特定的特徵。這個過程叫做訓練。

在訓練開始之時,卷積層的濾波器是完全隨機的,它們不會對任何特徵激活(不能檢測任何特徵)。這就像剛出生的孩子,TA不知道什麼是人臉、什麼是狗,什麼是上下左右。

TA需要學習才知道這些概念,也就是通過接觸人臉、狗、上下左右,並被告知這些東西分別是人臉、狗、上下左右。然後TA才能在頭腦中記住這些概念,並在之後的某一次見到之後能準確的給出結果。

把一個空白的濾波其,修改其權重(weights)以使它能檢測特定的模式,整個過程就如工程裡面的反饋。

想想一下,如果有一隻無意識的猴子,完全隨機的修改一個5X5濾波器矩陣的25個值,那完全可能經過一定的輪次之後,這個濾波器能夠檢測稜角等特徵。這是一種無反饋的訓練情況。對神經網絡的訓練當然不能如此,我們不可能靠運氣去做這件事情。

舉個例子,我們要訓練一個用於分類的神經網絡,讓它能判定輸入圖像中的物體最可能是十個類別的哪一類。那麼,訓練過程就是這樣的:

第一次訓練,輸入一張圖像,這個圖像通過各層卷積處理輸出量一組向量[1,1,1,1,1,1,1,1,1,1], 也就是,對於完全由隨機濾波器構建的網絡,其輸出認為這張圖等概率的是十個類別中的某一種。

但是對於訓練,我們有一個Gound Thuth, 也就是這張圖中物體所屬的類別:[0,0,1,0,0,0,0,0,0,0],也就是屬於第三類。這時候我們可以定義一個損失函數,比如常見的MSE(mean squared error)。

我們假定L是這個損失函數的輸出。這時候我們的目的就是,讓L的值反饋(這種神經網絡概念下稱為 back propagation, 反向傳輸)給整個卷積神經網絡,以修改各個濾波器的權重,使得損失值L最小。

這是一個典型的最優化問題。當然地,在工程上我們幾乎不可能一次就把濾波器的權重W修改到使L最小的情況,而是需要多次訓練和多次修改。

如果情況理想的話,權重修改的方向是使得L的變化收斂的。這也就是說很可能達到了我們訓練這個神經網絡的目的——讓各個卷積層的濾波器能夠組合起來最優化的檢測特定的模式。

自 36kr

相關焦點

  • 一文讀懂卷積神經網絡CNN
    卷積神經網絡簡介(Convolutional Neural Networks,簡稱CNN)卷積神經網絡是近年發展起來,並引起廣泛重視的一種高效識別方法。由於CNN的特徵檢測層通過訓練數據進行學習,所以在使用CNN時,避免了顯示的特徵抽取,而隱式地從訓練數據中進行學習;再者由於同一特徵映射面上的神經元權值相同,所以網絡可以並行學習,這也是卷積網絡相對於神經元彼此相連網絡的一大優勢。
  • 大數據造就老大哥? | 網際網路數據資訊網-199IT | 中文網際網路數據...
    199IT數據中心微信帳戶:i199IT譯者: 紅鼻子cj科技進步日新月異,兩年前完全無法想像的東西,到今天已然成了家常便飯。前途一片光明,卻也難免刺眼。NSA和大數據企業將資料庫資源和計算能力用在了不同的地方,前者用它們來偵查間諜和恐怖分子,後者利用它們來將合適的服務提供給適合的用戶。他們同樣利用了超大型資料庫以及模式識別(pattern recognition)和網絡分析(network analysis)之類的技術手段。
  • 一文看懂卷積神經網絡-CNN(基本原理+獨特價值+實際應用)
    1000×1000×3=3,000,000這麼大量的數據處理起來是非常消耗資源的,而且這只是一張不算太大的圖片!卷積神經網絡 - CNN 解決的第一個問題就是「將複雜問題簡化」,把大量參數降維成少量參數,再做處理。更重要的是:我們在大部分場景下,降維並不會影響結果。
  • 卷積神經網絡概念與原理
    一、卷積神經網絡的基本概念       受Hubel和Wiesel對貓視覺皮層電生理研究啟發,有人提出卷積神經網絡(CNN),Yann Lecun
  • 2017年全球AI和機器學習領域6大頂級專家 | 網際網路數據資訊網-199...
    對於人類生成並收集的越來越多數據,研究者正在探索更好的利用方式。其中一些重量級的研究者在機器學習領域取得了重要突破。目前,這些技術進步已成為了我們開發數字工具,將人工智慧應用於社交網絡、無人駕駛汽車,以及工業網際網路的基礎。1、吳恩達
  • 網際網路營銷效果監測數據體系 | 網際網路數據資訊網-199IT | 中文...
    隨著網際網路的多元化發展,網絡營銷的表現形式也越來越多,如何有效監測和評估網絡營銷的效果也成為現代企業運營推廣的重點。數據來源:網舟科技廣告大師約翰·沃納梅克曾說過,」我知道我的廣告費有一半是浪費的,但我不知道浪費的是哪一半」,但隨著網際網路廣告投放技術和精準化程度的不斷提高,浪費的廣告費正在被不斷地被確認,被找回。
  • 山寨也能成大器 | 網際網路數據資訊網-199IT | 中文網際網路數據研究...
    199IT數據中心微信帳戶:i199IT翻譯:劉鑫一般認為,真正的企業家應當避免模仿,努力做到真實原創。我不相信這種策略具有廣泛的商業合理性。「山寨」的好處的的確確受到了低估。三兄弟經營著一家名叫「Rocket」的山寨「工廠」,孵化著幾十家網際網路初創公司,其中很多都是從矽谷照搬經營方案。他們學會了快速擴張,學會了讓網絡公司適應歐洲的品位與文化,並因此取得成功。比起投資於真正的開創性想法,我通常更傾向於贊助高利潤、經過完全考驗的企業的「複製品」(但「複製品」與原先的企業應位於不同地區)。前者聽上去更有趣,但可能無法成功,而後者成功的概率要大得多。
  • 29個網絡營銷必須知道的數據 | 網際網路數據資訊網-199IT | 中文...
    3、85%的人寧願提供郵件地址(而不是以推文tweet的方式)獲得一本免費電子書。注: Email Marketing仍然一項十分有效的工具,我所指的並不是那些濫發郵件,而是那些與貴公司已建立了一定關係的收件者,可能是你的顧客或你的支持者。在香港,大部份人都會有電子郵件,每一個郵件的效用及價值沒有外國那麼高,但還是有價值的一項投資。
  • 銀行業深度報告:網際網路改變金融 | 網際網路數據資訊網-199IT | 中文...
    根據《大數據時代》,「2007年人類大約存儲了超過300艾(2的60次 方)字節的數據,其中模擬數據只有7%,其餘全部是數字數據。人類存儲信息量的增長速度比GDP增速快4倍,計算機數據處理能力增速則快9倍。」而且,數據的維度也在進一步多元化。例如,移動網際網路技術就將「位置」這一維度與其他維度的信息關聯起來,此外交叉驗證進一步豐富了信息的維度,信息的用途也因此實現幾何倍的增長。
  • 卷積神經網絡工作原理直觀的解釋
    我嘗試去理解神經網絡及其變體,但依然感到困難。接著有一天,我決定一步一步,從基礎開始。我把技術操作的步驟分解開來,並手動執行這些步驟(和計算),直到我理解它們如何工作。這相當費時,且令人緊張,但是結果非凡。
  • 2015年網際網路職場生態報告 | 網際網路數據資訊網-199IT | 中文互聯...
    一、網際網路人群求職意向數據統計得知,CTO、CFO、COO、CMO、產品總監、技術總監、架構師、互動設計總監、網絡推廣、視覺設計總監是平均工資排名前十的網際網路職位。其中,CTO 最為吸金,以平均 35.06 萬的年薪位居榜首。
  • Dice:網絡安全薪資調查 | 網際網路數據資訊網-199IT | 中文網際網路...
    網絡安全的重要性已經不言而喻,隨著GDPR的施行,全球企業對用戶數據保護的需求也空前高漲,而網絡安全人才短缺的問題也日益嚴峻,但是對於準備投身,或者期望在職場升值的安全行業人士來說
  • 卷積神經網絡CNN:卷積的來源和原理
    卷積神經網絡(Convolutional Neural Network,簡稱為CNN或ConvNet)是一種具有
  • 數據挖掘的知識類型 | 網際網路數據資訊網-199IT | 中文網際網路數據...
    的人發表論文不少於三篇且主講課程不少於一門。這一規則涉及到年齡、收入和購買三個變量(即三維),可稱為多維關聯規則。神經網絡用於分類的時候,是一組類似於神經元的處理單元,單元之間加權連接。另外,最近有興起了一種新的方法—粗糙集(rough set)其知識表示是生產式規則。分類通常用來預測對象的類標號。
  • 谷歌掌門人:網際網路即將消失 | 網際網路數據資訊網-199IT | 中文互聯...
    在過去一年,雲計算和大數據繼續發酵,物聯網也成為未來大趨勢之一。很多網友對於物聯網和網際網路之間有何關係存在疑惑,讓我們一起來看看。什麼是網際網路?即 Internet,又稱網際網路、網際網路等,是網絡和網絡之間串聯而成的龐大網絡。而物聯網是的英文縮寫是TheInternet of things,也即物物相連的網絡。
  • 數據挖掘價值變現,靠譜嘛? | 網際網路數據資訊網-199IT | 中文互聯...
    網際網路行業一直都有熱點,從SNS到微博到移動互聯,再到數據挖掘,就像腳下的這片土地,永遠不缺神奇。
  • ...達到65.8% | 網際網路數據資訊網-199IT | 中文網際網路數據研究...
    199IT原創編譯        根據SaaS分析應用companyMoat Analytics的數據,大廣告牌展示廣告在PC可視性方面排在第一位。
  • 多圖帶你讀懂 Transformers 的工作原理
    並行化 (按層) 利用局部依賴 位置間的距離是對數級的 一些最流行的序列傳導網絡, 例如 Wavenet和Bytenet就採用卷積神經網絡。 Wavenet, 模型採用卷積神經網絡 (CNN). 動圖摘自此文 卷積神經網絡可並行處理是因為,輸入的每個單詞可被同時處理並不必依賴於前一個單詞翻譯的結果。
  • 女性網民消費者研究 | 網際網路數據資訊網-199IT | 中文網際網路數據...
    這肯定是一項讓女人們狂喜,讓男人們痛恨的網際網路創新!它還有一個風騷的名字,叫「撒嬌支付」。支付寶的最新數據顯示,今年6月,這項業務同比增加約六成。使用它很簡單:用戶在進入付款頁面時選擇「代付」,交易平臺會隨即自動生成一串連結,用戶將該連結通過郵箱、旺旺、QQ等方式發送給其他人比如男友、老公後,則由後者來付款。
  • 一文讀懂卷積神經網絡中的1x1卷積核
    點擊上方「深度學習工坊」,「星標」或"置頂"關鍵時刻,第一時間送達本文轉載自:CVer作者:Amusi前言在介紹卷積神經網絡中的1x1卷積之前,首先回顧卷積網絡的基本概念[1]。卷積核(convolutional kernel):可以看作對某個局部的加權求和;它是對應局部感知,它的原理是在觀察某個物體時我們既不能觀察每個像素也不能一次觀察整體,而是先從局部開始認識,這就對應了卷積。卷積核的大小一般有1x1,3x3和5x5的尺寸(一般是奇數x奇數)。