SqueezeNet輕量級模型開端

2021-01-11 百度校園

作者:李珺 來源:人工智慧學習圈 本文未經授權,嚴禁轉載,轉載請聯繫作者本人。

深度學習模型不斷發展,其分類能力和準確度不斷提高。同時,隨著模型理論的不斷研究,模型結構呈現越來越深的趨勢,從16層的VGG,到22層的inception再到後來152層的ResNet,模型在不斷加深,參數量在逐漸增大,並且每秒浮點運算次數(FLOPS)也越來越高。固然硬體的發展能夠一定程度上解決計算複雜的問題,但是依然存在一些特殊條件,如硬體運算速度不高、模型存儲空間不足以及實時性要求高。因此,能夠用一個足夠小的模型實現滿足精度要求分類、檢測是目前很多學者關注的問題。小模型參數少、訓練速度快且運行耗時少、運算成本低,能夠滿足高實時性的和低性能的運算場景;同時,由於參數量的減少,所需的存儲空間減少,使模型能夠在低性能存儲設備上部署,並能實現雲端部署。

相關工作

Denton等人在一個預先訓練好的CNN模型上採用將奇異值分解(SVD)將其壓縮,Han等人提出了網絡剪枝的思想,即將預先訓練好的模型中低於一定閾值的參數替換為零,形成稀疏矩陣,從而提供了參數壓縮存儲的可能;隨後,他們將哈夫曼編碼應用於壓縮存儲,實現了模型的壓縮。但這些方法都僅限於在現有模型結構不變的基礎上優化存儲,並不能解決運算能力和速度的問題。

為了解決模型結構龐大的問題,最初的採用卷積神經網絡替換全連接網絡實現了初步意義上的壓縮;之後3*3卷機核替換7*7卷積核能夠有效減少參數量,而在之後的全卷積和1*1卷積同樣起到減少參數量的作用。而更有效的方法則是縮小模型結構。

網絡結構

本文提出了Fire模塊結構,其基本結構為一層壓縮層與一層擴展層的連接。壓縮層採用1*1卷積結構,同時將通道數按一定比例降低,從而有效減少了卷積核的參數量。在參數量減少的情況下,數據特徵被高度壓縮,為了確保數據特徵不失真,需要將數據復原,因此,本文在壓縮層後添加了擴展層『擴展層結構為一定數量的1*1卷積核與3*3卷積核的組成,3*3卷積核採用一定程度的稀疏操作,從而使其可壓縮,通道數在壓縮層的基礎上有一定增加,從而確保了模型能夠較大程度地保留特徵。

SqueezeNet的主要結構如圖所示:

本文在基本模型的基礎上提出了兩種改進模型,引入了ResNet中的殘差連接,在一定程度上犧牲模型體積的前提下,不同程度上提高了模型的準確率。本文將第一層Fire模塊的通道數設置為128,在每經過K層Fire模塊後,輸出通道增加increase*i/K個,increase為增加的通道數(文中設置為128),i為Fire模塊的層數。Fire模塊的輸出為模塊中擴展層的輸出,因此,Fire模塊的通道數即為擴展層的卷積核個數。而在Fire模塊中的壓縮層中,其通道數設置策略為將壓縮層通道數設置為擴展層通道數*SR,SR為壓縮比率取值為0到1。在Fire模塊的擴展層中,1*1卷積核與3*3卷積核的比例也是可調的,通過padding操作使1*1卷積和3*3卷積輸出的特徵圖尺寸一致便可以將其有效拼接,可以理解為3*3卷積為主要的特徵復原手段,1*1卷積為次要復原手段,因此權衡好兩種卷積核的比例是模型在體積和精度之間選擇的條件。

實驗

論文中,作者通過實驗對比了SqueezeNet基礎模型以及兩種改進版與AlexNet的原版和壓縮版,在對比精度外還重點對比了模型大小:

通過對比可見,深度壓縮方法可以有效壓縮參數體積同時確保模型精度,而本文提出的SqueezNet模型有效地減小了模型體積,使模型總參數量較少,從而可以壓縮到更小的尺寸,同時模型的精度還得到了保證。

在驗證了模型有效性的基礎上,本文嘗試研究了模型結構設計的超參數對模型精度的影響。設置不同的壓縮比率以及擴展層中3*3卷積核的佔比,來比較模型精度的變化。

壓縮率和卷積核比例

由左圖可以得到,壓縮比率在取0.5時模型精度達到85.3%,繼續增大壓縮比率模型精度增加不明顯,而降低會導致模型精度的大幅下降,通過權衡精度與體積,作者建議SR取0.5。由右圖可見,當3*3卷積核比例為50%時,模型精度達到85.3%,繼續增大壓縮比率模型精度增加不明顯,而降低會導致模型精度的大幅下降。作者建議了在保證最大精度基礎上的最小模型參數,即比例為50%。

此外,作者提出在基本模型的基礎上引入殘差連接,通過引入不同複雜程度的連接模塊,模型的性能有了不同程度的提升,而簡單旁路連接的精度提升最高,同時模型體積也沒有過大。

體積分別為4.8MB、 4.8MB、 7.7MB

本人嘗試復現論文結構,在西安景點、美食、民俗、特產、工藝品等圖像數據集上進行調優和測試。模型在SR取0.6,3*3卷積核比例取0.5時精度最高,達到了79.6%,而由於數據集樣本不平衡,對一定類別的分類結構較差。部分分類結果如下所示:

由於實驗條件有限,僅採用控制變量法驗證了部分參數,以上結果均為在數據集上調優迭代20個epoch的結果。本人未考慮模型尺寸。

五、結論

Squeezenet提出了Fire壓縮模塊,能夠在確保精度的基礎上有效減少參數量。同時作者研究參數選取的過程值得參考學習,對比研究的思想值得在今後科研中效仿。

測試數據樣例:

原文連結:https://zhuanlan.zhihu.com/p/158519674

相關焦點

  • 它的輕量級建模滿足你的需求!
    它的輕量級建模滿足你的需求!傳統的智能建築/建築自動化/建築安全/智能校園經常採用建築信息模型建築信息模型(BIM)軟體,如Autodesk的Revit和Bentley,但這些BIM建模模型的數據往往過於肥大
  • Google 開源 AdaNet:快速靈活的輕量級 AutoML 框架
    雷鋒網 AI 科技評論編者按:近期,Google 開源了輕量級整合了不同機器學習模型預測的模型集成,被廣泛運用於神經網絡來實現最優性能,它受益於悠久的歷史和理論,從而在 Netflix Prize 和各項 Kaggle 競賽等挑戰賽中拔得頭籌。然而由於訓練耗時長,以及機器學習模型的選擇機制需要自身具備領域專業知識,它們在實踐中的應用並不多。
  • 輕量級拳王終極統一戰:洛佩茲勝洛馬琴科,新王一統輕量級天下
    北京時間10月18日,現WBA/WBO/WBC輕量級拳王——烏克蘭人瓦西裡 年輕的洛佩茲僅用2回合,就輕鬆KO了前IBF輕量級拳王、加納人理察-康梅(29-3,26KO),成為了IBF輕量級的最新第一人。洛佩茲身體強壯,身體優勢突出,且擅長打防守。
  • 總結|百度Paddle輕量級目標檢測挑戰賽
    作者:李珺 來源:人工智慧學習圈競賽任務為輕量級目標檢測,在獲取準確的目標檢測BBOX時,要兼顧模型推理速度。提交形式以提交推理代碼由官方進行推理,計算精度和耗時。筆者為炮灰,只獲得了挑戰賽第10名,在此僅僅是總結一下比賽經驗。
  • 「輕量級的」Istio,微軟開源了一個基於 Envoy 的服務網格
    它是一種在 Kubernetes 上運行的輕量級且可擴展的服務網格;旨在作為 Service Mesh Interface(SMI)規範的參考實現。微軟的軟體工程師 Michelle Noorali 介紹稱,OSM 使用戶能夠在高度動態的微服務環境中統一管理,保護和觀察服務到服務的通信。並表示,其希望這一項目能成為一個由社區主導的項目,且具有開放的治理機制。
  • [拳擊]WBC輕量級拳王爭霸賽 史蒂文森VS方法拉
    北京時間5月25日,2014年WBC輕量級拳王爭霸賽,史蒂文森迎戰方法拉。經過12回合大戰,史蒂文森戰勝對手,成功衛冕。 [拳擊]WBC輕量級拳王爭霸賽 史蒂文森VS方法拉 北京時間5月25日,2014年WBC輕量級拳王爭霸賽,史蒂文森迎戰方法拉。經過12回合大戰,史蒂文森戰勝對手,成功衛冕。
  • 全世界最強輕量級搏擊選手榜單,小鷹第一,嘴炮也上榜!
    2018年11月3日,美國權威搏擊網站Combat做出了世界上最能打的輕量級搏擊選手!這個排名包括美國所有的搏擊比賽,不過大部分人來自UFC!下面我們來看看前五位都有誰吧!第一個是UFC輕量級冠軍小鷹。
  • 安博會|業界首款3D結構光人臉識別視頻鎖發布,奧比中光賦能輕量級...
    安博會第一天,大華樂橙發布業內首款3D結構光AI人臉識別視頻鎖,該新品搭載了奧比中光3D攝像頭模組U1,可為用戶建立毫米級3D人臉模型,可有效防止照片、視頻、頭套面具的攻擊。U1尺寸小、功耗低,可為用戶建立毫米級3D人臉模型,並可通過軟硬體結合的方法進行活體檢測,有效避免各種身份冒用情況,為用戶帶來金融級3D刷臉開鎖體驗。此外,基於U1 3D結構光模組,大華樂橙V8i無懼暗光環境,可用於各種場景,並為用戶提供無感式刷臉開鎖體驗。用戶到家後只需站在門前,3D刷臉門鎖便可秒級識別用戶信息並開鎖,用戶無需任何操作。
  • 洛馬琴科希望統一135磅輕量級後回歸130磅級
    WBA/WBO輕量級雙冠王瓦西裡·洛馬琴科(12-1-9KO)有充足的動力去做一件所有輕量級拳手沒有做過的事:統一135磅輕量級的四冠王。因此,這位烏克蘭拳王的眼光已經望向克羅拉的身後,他希望在未來迎戰IBF輕量級冠軍理察·科梅(28-2-25KO)。洛馬琴科曾經跟科梅商議在四月份打統一戰,但科梅訓練中受傷退賽,所以洛馬琴科只能先了結WBA強制挑戰賽的對手。對於未來的目標,洛馬琴科表現的讓人有點吃驚。
  • 華為提出高效輕量級網絡GhostNet, 性能超越MobileNetV3
    Ghost瓶頸被設計成stack Ghost modules,然後可以很容易地建立輕量級的GhostNet。 在基準上進行的實驗表明,所提出的Ghost模塊是基線模型中卷積層的一個令人印象深刻的替代方案,GhostNet可以獲得更高的識別性能(例如在ImageNetILSVRC-2012分類數據集上,與具有類似計算成本的MobileNetV3相比,準確率為75.7)。
  • 人類的開端:尋找「確定性」
    --古希臘哲學思緒起源,需要從人類開端說起序言:整個宇宙的演化;歷經非生命的粒子階段、前人類的生物階段、最後是人類階段;而人類一旦出現但並不是說人類要比動物高級,反而是人類是因為自身的不穩定和殘弱而不得不主動創造生產資料、創造更多的依存條件,甚至還要跟產生自身的自然進行對抗,去徵服自然才能實現求存;由此形成人類與動物的重大區別和越來越大的「差距」;由此可以說;人類文明的開端就是以
  • WBO迷你輕量級2月最新排名 拳王是菲律賓尼特斯
    搜狐體育訊 WBO2月份迷你輕量級最新拳手排名,拳王是來自菲律賓的尼特斯。迷你輕量級(MINI-FLYWEIGHT)105磅(lbs.) 47.63公斤
  • 一行代碼即可調用18款主流模型!PyTorch Hub輕鬆解決論文可復現性
    PyTorch官方提出三步走策略:瀏覽可用模型;加載模型;探索已加載的模型。瀏覽可用模型直接用torch.hub.list() API列出所有可用的入口點即可。=True)在此之外,我們還需要了解一些其它的相對比較複雜的事情,包括探索已加載的模型、復現別人成果的工作流,以及如何快速發布自己的模型。
  • 盡頭與開端
    筋疲力盡到盡頭,才有可能呈現開端  「藝術屬於世界的盡頭,」布朗肖說,「只能從再無藝術也無法產生藝術的地方開始。」這句話的要義,在於「盡頭」。如果你是個藝術家,你得先獨自走到那個過去的和現存的世界,獨自走到它的盡頭,然後才能找到你自己。
  • UFC輕量級冠軍麥格雷戈評價「飛鷹」卡哈比的比賽就是狗屎!
    『麥格雷戈評價「飛鷹」的比賽就是狗屎』在上周末結束的UFC 219期比賽上,俄羅斯不敗名將「飛鷹」卡哈比·努馬戈梅多夫一致判定完勝「巴西腿王」埃德森·巴博薩,「飛鷹」的職業生涯取得25戰全勝,他毫無爭議是目前輕量級的最強冠軍挑戰者。
  • 愛奇藝開源輕量級插件化方案 Neptune
    愛奇藝近日開源了其輕量級插件化方案 Neptune,項目地址:https://github.com/iqiyi/Neptune插件化框架可以在主程序不重新安裝的情況下,針對單個業務模塊進行動態加載達到模塊更新的目的
  • 現代宇宙學的開端
    …………○ 大爆炸模型的宇宙演化歷史雖然人類千百年來就一直思考著自身存在及宇宙的起源等等問題,但是,在1917年之前,這些思考一點都不成熟,對宇宙學的研究也一點都不現代·弗裡德曼在廣義相對論框架下均得出宇宙膨脹的結論,並在數學上解釋了哈勃定律,之後勒梅特又獨自將宇宙膨脹進行時間反演,這暗示著宇宙可能會有一個開端
  • PLA輕量級3D列印天線原型
    PLA輕量級3D列印天線原型
  • 大爆炸前宇宙是否永恆存在:開端之早無可估量
    「令我們驚訝的是,在宇宙各種可能的過去當中,大多數時空都不會一直持續到永遠,」維連金說,「暴漲必定有一個開端。」不過暴漲也只是逐鹿群雄之一,其它的宇宙圖景是不是也必定包含一個開端呢?2012年年初,維連金和他在塔夫斯大學的同事奧德麗 米薩尼合作,對另外兩種有代表性的宇宙學圖景進行了檢驗。
  • 「模型解讀」說說移動端基準模型MobileNets
    編輯 | 言有三1 概述Google開發的MobileNets【1】是用於嵌入式平臺計算機視覺應用的基準模型。MobileNets是流線型的架構,它使用depthwise sparable convolution(深度可分離卷積)來構建輕量級的深層神經網絡。通過引入兩個簡單的全局超參數,可實現在速度和準確度之間有效地進行平衡。