GoogLeNet的心路歷程(一)

2021-02-13 LeadAI OpenLab

這一段時間擼了幾篇論文,當我擼到GoogLeNet系列論文的時候,真是腦洞大開!GoogLeNet絕對可以稱為已公開神經網絡的複雜度之王!每當我看到它那錯綜複雜的網絡圖時,心裡總有一種說不出的苦澀滋味,我也不知為何。

然後,我萌生了一個想法,用自己的語言描述一下GoogLeNet的發展歷程和關鍵技術點,我知道網上已經有很多人總結過GoogLeNet的各種版本,但那畢竟是別人的東西,自己總結一遍會提升自己的水平。計劃是寫4篇文章,希望能在一個月內完成吧。下面是GoogLeNet的4篇論文:

[v1] Going Deeper with Convolutions,ensemble top5 error 6.67%,2014

[v2] Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift,ensemble top5 error 4.8%,2015

[v3] Rethinking the Inception Architecture for Computer Vision,ensemble top5 error 3.5%,2015

[v4] Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning,ensemble top5 error 3.08%,2016

v4版本top5錯誤率只有3.08%!這個應該是目前錯誤率最低的吧。

不過有時候自己也會萌生一些悲觀想法,現在深度學習的網絡是越做越複雜,針對某些數據集的識別率是越來越高,可是,然並卵,當我們換個數據集,換個環境,換個照片,換個……以後,效果就不行了,這真是個問題啊!

本文介紹關於GoogLeNet第一篇正式論文,習慣稱為inception v1,如下:

[v1] Going Deeper with Convolutions,top5 error 6.67%

在開始介紹論文之前,先說一些題外話,GoogLeNet這個名字的誕生由兩方面促成,一是設計者在Google工作,二是向LeNet致敬。GoogLeNet只是一個名字,它的核心內容是發明了Inception Architecture(以下簡稱IA),發明IA的靈感來自於2013年的一篇論文《Provable Bounds for Learning Some Deep Representations》,這篇論文讀起來非常困難,需要很多的數學知識,有興趣的可以看看。

1、提出inception architecture並對其優化

2、取消全連層

3、運用auxiliary classifiers加速網絡converge

接下來對以上幾點分別介紹。

首先得說一下Szegedy發明IA的動機,他估計是在某天閱讀了Provable Bounds for Learning Some Deep Representations這篇論文,又結合自己多年來在深度學習界摸爬滾打的經驗,發現傳統的提高網絡精度的方法是一條邪路(P.S. 傳統的方法指的是 擴大網絡規模 或 增大訓練數據集),而想從本質上提高網絡性能,就得用sparsely connected architectures,即「稀疏連接結構」。

我自己對「稀疏連接結構」的理解是這樣的,用儘可能的「小」、「分散」的可堆疊的網絡結構,去學習複雜的分類任務,怎麼體現「小」、「分散」呢?如下圖:

Inception Architecture,naive version

原來造神經網絡,都是一條線下來,我們可以回想一下AlexNet、VGG等著名網絡,而IA是「分叉-匯聚」型網絡,也就是說在一層網絡中存在多個不同尺度的kernels,卷積完畢後再匯聚,為了更好理解,「匯聚」的tensorflow代碼寫出來是這樣的:

net = tf.concat(3, [branch1x1, branch5x5, branch3x3, branch_pool])

就是簡單的在kernel維度把矩陣concatenate起來。但是這麼做有一個問題,會產生「維度爆炸」,什麼意思呢?假如branch1x1、branch3x3、branch5x5都有256個kernels,加上branch_pool的kernels(假定為256),經過tf.concat操作,最終的kernels是256×4=1024個kernels!這沒法接受啊!如果多層IA疊加起來,那kernels的數量豈不上天!!於是Szegedy就改進了一下,如下圖:

Inception module with dimension reductions

他加入了kernels數量控制方式,就是那些1×1的卷積層,這些1×1的卷積層輸出kernels會比上一層要少,這樣即便在經過tf.concat以後,總kernels數量不會增加太多。另外,這些1×1的卷積層還增加了網絡的非線性程度。

關於IA的結構就介紹完了,可是,為什麼?這樣的結構有啥用?Szegedy在論文裡解釋過一點點:IA之所以能提高網絡精度,可能就是歸功於它擁有多個不同尺度的kernels,每一個尺度的kernel會學習不同的特徵,把這些不同kernels學習到的特徵匯聚給下一層,能夠更好的實現全方位的深度學習!

為什麼VGG網絡的參數那麼多?就是因為它在最後有兩個4096的全連層!Szegedy吸取了教訓,為了壓縮GoogLeNet的網絡參數,他把全連層取消了!其實我個人也認為全連層作用確實沒那麼大,取消了也好,GoogLeNet網絡詳細配置如下:

GoogLeNet詳細配置

從上圖就可以看出,網絡的最後幾層是avg pool、dropout、linear和softmax,沒有看到fully connect的影子。現在取消全連層貌似是個大趨勢,近兩年的優秀大型神經網絡都沒有全連層,可能是全連層參數太多,網絡深度增加了以後,難以接受吧。

搞機器學習的都知道,梯度消散是所有深層網絡的通病,往往訓練到最後,網絡最開始的幾層就「訓不動了」!於是Szegedy加入了auxiliary classifiers(簡稱AC),用於輔助訓練,加速網絡converge,如下圖畫紅框部分:

GoogLeNet

以上圖片摘自此文,因為網絡太深了,豎著太長,就把它橫過來看了。可以看到,筆者在網絡中間層加入了兩個AC,這兩個AC在訓練的時候也跟著學習,同時把自己學習到的梯度反饋給網絡,算上網絡最後一層的梯度反饋,GoogLeNet一共有3個「梯度提供商」,先不說這麼做有沒有問題,它確實提高了網絡收斂的速度,因為梯度大了嘛。另外,GoogLeNet在做inference的時候AC是要被摘掉的。

AC這種加速收斂訓練方式與ResNet表面上看不太一樣,但是我感覺本質上應該是類似的。ResNet也很深,但是它先是通過構建淺層網絡學習參數,再把淺層網絡的參數應用到較深網絡中,從而儘可能減少梯度消散的影響。GoogLeNet是直接把淺層網絡的訓練和深層網絡的訓練揉到一起了。關於這個問題還有待深究。

原文連結:https://www.jianshu.com/p/33197e469414
https://www.jianshu.com/p/a2ad00eddbd5


查閱更為簡潔方便的分類文章以及最新的課程、產品信息,請移步至全新呈現的「LeadAI學院官網」:

www.leadai.org


請關注人工智慧LeadAI公眾號,查看更多專業文章

大家都在看

相關焦點

  • 巨蟹座吵架後的心路歷程
    3.  系列推薦雙魚座吵架後的心路歷程白羊座吵架後的心路歷程雙子座吵架後的心路歷程
  • 男人的洗澡心路歷程
    今天刷某某蝦小視頻,看到一個外國小姐姐的洗頭心路歷程,覺得有點意思,不如和大家分享一下中國直男們的洗澡心路歷程吧。首先來說,男人們不愛洗澡,幾乎是一種標杆。比如那一條內褲穿兩個禮拜的「傳說」,之所以在傳說上打引號,那是因為半個月算什麼,一條內褲穿一個學期的室友每個學校都會有。
  • 《暖暖,請多指教》:一段有關愛情的心路歷程
    每部作品當中,往往都有屬於它們自身的人物心路歷程。這些歷程的演繹,很多時候透露出人物角色的性格、品質以及成長等。它們,通常是值得我們觀眾去回味的。王巖執導、梁靖康以及李凱馨等主演的都市甜美暖劇《暖暖,請多指教》,就是那樣一部演繹了有關人物角色那份愛情世界裡心路歷程的影視作品。
  • Moodmill:心路歷程的記錄網站
    一旦你選擇心情等級就會在你的心情曲線上留下痕跡,通過這個曲線圖片你可以看到你最近的心路歷程,同時將心情通過量化的形式形象化的表現出來也比較有創意。另外Moodmill也是一個心情記錄的迷你blog,你可以發布也可以訂閱別人的心情歷程;你可以在線添加好友並得知好友的心情狀況;你可以在wordpress上放置你的心情;唯一的遺憾就是不支持中文。
  • 80份「心靈故事」講述大學生的「心路歷程」
    80份「心靈故事」講述大學生的「心路歷程」 2013-05-27 15:45:12   來源:淮河晨刊
  • 一個女人由愛到不愛的心路歷程
    一個女人由愛到不愛的心路歷程,其實並不遙遠,有時候只是一瞬間一剎那,只是經歷了一件很簡單的事情,就讓一個女人從愛到不愛。這似乎就是所謂的「壓死駱駝的最後一根稻草。」一個女人從愛到不愛,或許只是一瞬間的事情,但在這之前必然是經過了漫長的積累,和無限的失望,才會讓她霎時心如死灰。
  • 寶媽總結育兒心路:你的一年級,我的成長心路歷程
    一眨眼功夫,我家的娃一年級畢業了,九月份就順利升為二年級小學生啦,恭喜你哦!回頭想想一年級,我是從一開始的恐懼不安到現在的心態平和,不得不說我的心態有了巨大的轉變。相信每個用心陪伴孩子成長的媽媽經過這一年的磨練,心裡都有一個平和的轉變。
  • 廬陽大小事|重溫心路歷程 永遠跟黨走
    ▽▽▽1.重溫心路歷程 永遠跟黨走近日,亳州路街道栢景灣社區組織共建單位、非公企業等99名黨員代表在亳州路小學小禮堂,開展「重溫心路歷程 永遠跟黨走」慶「七一」活動。活動中,8名不同年代的黨員代表上臺發言,回憶自己當初入黨的心路歷程以及感悟。
  • 明日比賽前瞻,李指導的心路歷程
    有了這些文章做鋪墊之後,我們下一階段,就要學會理解籃球,理解比賽。這也是我想和大家聊的,關於比賽不在是簡單的輸贏了,而是輸贏背後的東西。 明天重點要看的是廣廈與福建,我會為大家帶來《李指導的心路歷程》,我希望我能解讀出比賽局面的變化,已經李指導做調整的初衷和效果。 對於福建隊而已,今晚讓勞森好好休息好,大王安心睡覺,明天陳林堅不要緊張,戰術都是明牌,福建隊能調整的並不多,勞森和大王 往死裡打吧,反正輸贏就一場。
  • 金牛座男生變渣的心路歷程
    今天老貓就給大家講講金牛座渣男的心路歷程,他到底如何渣!首先對比純情牛男和渣渣牛男的區別。純情的牛男跟女生接觸女生:咱們是先看電影,還是先吃飯,或者玩遊戲?渣渣牛男一看對方的姑娘,盤算著這個姑娘什麼樣子,一聊天感覺對方不好看。渣渣牛男轉身屁股就走,在這之前他把自己咖啡錢買單了。女生一臉蒙B很多人會覺的這個渣渣牛男好沒有品啊,甚至會責怪渣渣牛男。
  • 董完了與讀者分享「錦鯉」心路歷程
    在籤售會現場,董完了和讀者們分享了自己的寫作體會、心路歷程,工作生活等。董完了坦言,雖然自己在微博上展現了幸福、陽光、成功的一面,其實在成功的背後,也有諸多的勞碌、辛苦與摩擦。談到如何平衡工作與家庭時,董完了說,在兼顧個人品牌、活動、育兒帳號的同時,她經常寫作到深夜,親身經歷加上真情實感,使她覺得寫作激情源源不斷。找到對的人,「嫁給愛情」,經營好大家庭成員之間的關係,是幸福的要訣。
  • 王源朗讀《彼得·潘》分享成長的心路歷程
    (原標題:王源朗讀《彼得·潘》分享成長的心路歷程)
  • 雙魚座吵架後的心路歷程
    細節控雙魚一開始一定是會糾結在吵架中某個字,詞語,或者一個句子,有點摘抄吵架過程的「好詞好句」的意思:吵架的時候他叫我滾,他叫我滾一定是不愛我了,他從來不說這麼重的話… 2. 摘抄完以後,就開始一段漫長的前情回顧:上個月,他天天說要加班,也不陪我;上個星期,他沒有主動找過我,都是我主動找他;前天晚上,他好像沒有跟我說晚安!
  • 《西遊記》最高境界:一個人覺悟的心路歷程,磨練心智,堅守信念
    西遊記主要講一個人覺悟的心路歷程。一個人的心路有多遠?十萬八千裡!就是孫悟空一個跟頭的功夫,就是一個人的一念之差。一念是佛,一念是魔;一念是菩薩,一念是妖精;一念向善,一念向惡。一念就是十萬八千裡,結果相差甚遠。今天修什麼行?
  • 《裝進書包的秘密》:呈現少年成長的心路歷程
    出版方供圖《裝進書包的秘密》:呈現少年成長的心路歷程南報網訊(記者 解悅 )《裝進書包的秘密》是一部描寫新時代少年在困境中成長的小說。它更是一部反映當代少年兒童心路歷程和精神成長的小說。毫無疑問,它是當代現實主義兒童長篇小說的又一部力作。」國家「萬人計劃」教學名師、江蘇省特級教師、兒童閱讀推廣人周益民說小說具有鮮明的「衛衛質素」,就是對兒童和世界的善意。這種質素的本質是作家人格在作品中的投射,表現為悲而不慘,哀而不傷,儘管書寫苦難和挫折,但更致力於幫助兒童建立對世界的信任與信心,幫助他們產生對未來的嚮往與期待。
  • 這場演唱會為何群星雲集 發起人周迅分享心路歷程
    蔡依林、吳青峰、竇靖童、白舉綱、馬伯騫先後登臺,為愛獻唱,發起人周迅還與大家一起回顧了項目發起五年來的心路歷程。周迅 主辦方供圖  演出當晚,白舉綱作為首位主唱嘉賓,攜《某某》登場,傳遞對孩子的關愛,接著以《觥籌》《一拳》《著陸》分享了自己對於生命的感悟。
  • 一位普通妹子玩家的心路歷程
    本期,就讓我們走進一位普通且平凡的妹子玩家心路歷程。玩家介紹遊戲ID:智障美少女丶所在大區:艾歐尼亞段位:榮耀黃金I星座:天蠍座感情狀態:孤芳自賞擅長位置:輔助、ADC常用英雄:心路歷程玩LOL兩年了,回憶整個卸載重裝卸載重裝的過程還真是蠻感慨的。我之前沒有接觸過任何競技類的遊戲,剛玩的時候真是菜到不行,總是被隊友罵哭(就。
  • 報課家長說說心路歷程!
    報課家長說說心路歷程!阿卡索英語怎麼樣?8名外教供家長選擇,家長可以通過音頻介紹,上課視頻來挑選自己滿意的外教,如果後期不適合也可以隨時換,可以提前約好兩周的課,如果臨時有事上不了,提前24小時找客服幫忙取消即可,還是比較方便的;第三個要看的是收費,長期學的話壓力會不會太大我來說說阿卡索英語收費標準,阿卡索英語是大家公認的高性價比外教課,有國際和定製兩種課程,國際主要為菲教上課,定製都是歐美外教,折扣國際課程一節在
  • 《特別教育心路歷程》
    (陳善卿在江蘇省陶行知研究會特別教育專業委員會成立大會上的講話)     省陶研會特別教育專委會名譽理事長,南京曉莊範學院政教系原主任、陶行知研究所陳善卿教授在會上作了題為《特別教育心路歷程工作組專家學者深入第一線進行調查研究,先後考察了南京市建寧中學(工讀性質學校,後為特別教育實踐基地)、石家莊劉曉斌教育訓練工作室、貴陽行知科技職業學校、成都52中(工讀性質學校)等教育訓練機構,重點解剖了「工作室」十幾年來從醞釀初創、全面發展到不斷提高艱苦創業的心路歷程。
  • 乒娃家長心路歷程 | 你符合嗎?
    練桌球的孩子越來越多,絕大部分家長(不含最後走到頂峰的)的心路歷程,基本上分為以下幾個階段:一、醞釀幻想階段這個階段出現在孩子學球之前,家長們琢磨:自己喜歡桌球,也打的不錯,我得帶著孩子練,滿腦子都是孩子登上領獎臺,我跟愛人在現場或電視前流眼淚的感人畫面。