...加法的神經網絡:實習生領銜打造,效果不輸傳統CNN | CVPR 2020...

2021-01-11 澎湃新聞

關注前沿科技 量子位

曉查 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

沒有乘法的神經網絡,你敢想像嗎?無論是單個神經元的運算還是卷積運算,都不可避免地要使用乘法。

然而乘法對硬體資源的消耗遠大於加法。如果不用乘法,全部改用加法應該可以讓運算速度大大提升。

去年年底,來自北京大學、華為諾亞方舟實驗室、鵬城實驗室的研究人員將這一想法付諸實踐,他們提出了一種只用加法的神經網絡AdderNet(加法器網絡)。一作是華為諾亞方舟實習生,正在北大讀博三。

如今,這篇文章已經被CVPR 2020收錄(Oral),官方也在GitHub上開放了原始碼。有興趣的同學不妨前往一試究竟。

加法器網絡簡介

加法器網絡的核心在於:用L1距離代替歐氏距離。

L1距離是求兩點之間坐標差值的絕對值之和,因此全程不涉及乘法。

在這種新的定義下,反向傳播中用到的求偏導數運算也變成了求減法。梯度下降的優化過程也被叫做符號SGD(signSGD)。

在加法器網絡的新定義下,特徵向量的空間分布也和CNN有很大的不同。

那麼AdderNet的實際效果如何呢?

在CIFAR-10的圖像分類任務中,AdderNet相比當初Bengio等人提出的加法神經網絡BNN性能有大幅提升,並且已經接近了傳統CNN的結果。

開原始碼

官方的AdderNet基於Python3和PyTorch。

先按照PyTorch的官方文檔準備ImageNet數據集,運行程序評估它在驗證集上的效果:

python test.py —data_dir 'path/to/imagenet_root/'

AdderNet可以在ImageNet數據集上達到74.9%的Top-1準確度和91.7%的Top-5準確度。

或者將CIFAR-10數據集下載到本地,測試一下它在CIFAR-10上的效果

python test.py —dataset cifar10 —model_dir models/ResNet20-AdderNet.pth —data_dir 'path/to/cifar10_root/'

不過AdderNet仍需自己訓練,官方表示將很快發布預訓練模型。

現階段的AdderNet並非沒有缺陷,作者在項目主頁中說,由於AdderNet是用加法過濾器實現的,因此推理速度較慢,需要用CUDA編寫才能提高速度。

這與作者希望提高神經網絡運算速度的初衷還有一段距離。

但這篇論文的作者表示,今後還會繼續加法器神經網絡的研究,發表更多的成果,讓我們一起期待這項研究取得新的進展吧。

華為諾亞實驗室實習生領銜打造

AdderNet這篇文章的一作名叫陳漢亭,畢業於同濟大學數學系,現在在北京大學信息科學技術學院攻讀博士學位,同時在華為諾亞方舟實驗室實習。

在碩博連讀的前三年中,他已經以一作身份發表了5篇論文,其中一篇《Data-Free Learning of Student Networks》被ICCV 2019收錄,另外它參與多篇論文還被NeurIPS、IJCAI、ICML等頂會收錄。

傳送門

原始碼:

https://github.com/huawei-noah/AdderNet

論文地址:

https://arxiv.org/abs/1912.13200

作者系網易新聞·網易號「各有態度」籤約作者

— 完 —

北京時間3月21日早10:30,線上首次雲試乘無人車!急尋眾多監工們,跟隨輕舟智航L4級無人車應對矽谷晚高峰。此外更有兩位輕舟智航頂級技術專家、前Waymo核心工程師拆解其創新技術路徑以及大規模智能仿真系統的具體應用。

戳二維碼,備註「無人車」即可報名、加交流群與同好討論交流無人車進展~

高能直播 | 雲體驗無人車試乘+頂級技術專家拆解仿真系統

量子位 QbitAI · 頭條號籤約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態

喜歡就點「在看」吧 !

原標題:《華為開源只用加法的神經網絡:實習生領銜打造,效果不輸傳統CNN | CVPR 2020 Oral》

閱讀原文

相關焦點

  • 華為開源只用加法的神經網絡:實習生領銜打造,效果不輸傳統CNN
    如果不用乘法,全部改用加法應該可以讓運算速度大大提升。去年年底,來自北京大學、華為諾亞方舟實驗室、鵬城實驗室的研究人員將這一想法付諸實踐,他們提出了一種只用加法的神經網絡AdderNet(加法器網絡)。一作是華為諾亞方舟實習生,正在北大讀博三。
  • CVPR2020|深度學習不要乘法?北大,華為Oral論文提出加法神經網絡
    CVPR 2020 原定於 6 月 16 日至 20 日在華盛頓州西雅圖的華盛頓州會議中心舉行,但是當前全球疫情勢態嚴峻,越來越多的 AI 頂會開始轉向線上,CVPR 也不例外。雖然無法去現場交流,但這無法阻擋我們學習的熱情。為向讀者們分享更多 CVPR 優質內容,在 CVPR 2020 開幕之前,機器之心將策劃多期線上分享。
  • 阿里達摩院實習生立功!何愷明Mask R-CNN精度提升,一半輸入數據量...
    更難得可貴的是,如此成果出自同學少年——阿里達摩院實習生之手,已被CVPR 2020接收。  因此,總是要經過一個壓縮的過程,傳統圖像分析系統的基本框架如下。  他們提出在頻域,即離散餘弦變換域(DCT)中重塑高解析度圖像,而不是在空間域調整它們的大小,然後將重新形成的DCT係數提供給卷積神經網絡模型進行推理,從而解決了這些問題。  同時,這個方法幾乎不需要修改現有的卷積神經網絡模型,還是以RGB圖像作為輸入。達摩院的研究人員認為,它可以作為常規的數據預處理管道的替代品。
  • CVPR論文解讀:非常高效的物體檢測Mimic方法
    本文提出了一種學習feature map來實現Object Detection任務上mimic的方法。然而直接套用該方法在檢測任務中,效果很差,因此作者進行了進一步的探索。首先,對於常見的檢測網絡如Faster-RCNN、RFCN、SSD等進行分析,可以發現,它們主要包含兩部分,分別為feature extractor以及feature decoder。
  • 在多目標識別方面,maskr-cnn已經取得了一些進展
    maskr-cnn是業界首款實用的全卷積神經網絡模型,為計算機視覺中的多目標識別與自動對焦,開創性的成為計算機視覺發展的新方向。無論是基於計算機視覺的自動對焦系統、模式識別系統,還是圖像識別,maskr-cnn都是有標誌性意義的。它強調平滑準確的計算輸入、檢測框和定位點,訓練過程與特徵提取過程採用多級感受野融合技術進行自動優化提高目標解析度及精度,以及做出精度更高的語義推理判斷。
  • CNN vs RNN vs ANN——3種神經網絡分析模型,你pick誰?
    神經網路能夠提供給我們哪些傳統機器學習提供不了的功能呢?我還常常會見到另一個問題——神經網絡需要強大的計算能力,那麼當問題中只是存在一些細微差別時,使用神經網絡真的值得嗎?問題的答案很簡單——值得!深度學習中不同的神經網絡(如卷積神經網絡CNN、循環神經網絡RNN、人工神經網絡ANN)正在改變著我們與世界之間的交互方式。
  • 人工智慧之卷積神經網絡(CNN)
    ^_^本文引用地址:http://www.eepw.com.cn/article/201806/381807.htm  20世紀60年代,Hubel和Wiesel在研究貓腦皮層中用於局部敏感和方向選擇的神經元時發現其獨特的網絡結構可以有效地降低反饋神經網絡的複雜性,繼而提出了卷積神經網絡CNN(Convolutional Neural Networks)。
  • CVPR2020|結合業務場景,騰訊如何做不完美場景的神經網絡優化?
    CVPR 2020 原定於 6 月 16 日至 20 日在華盛頓州西雅圖的華盛頓州會議中心舉行,但是當前全球疫情勢態嚴峻,越來越多的國際 AI 頂會開始轉向線上,CVPR 也不例外。雖然無法去現場交流,但這無法阻擋我們學習的熱情。
  • 給卷積神經網絡動動刀:加法網絡探究
    其中AdderNet就是一種從新角度對模型進行加速的方法,以往的模型加速方法通過減少CNN的參數,AdderNet通過重新定義卷積計算,將卷積中的乘法替換為了加法。我們知道,乘法的計算代價要遠遠大於加法,AdderNet通過這種方式減少了計算量。
  • 理解神經網絡:從神經元到RNN、CNN、深度學習
    隨著時間的推移,證明了神經網絡在精度和速度方面,比其他的算法性能更好。並且形成了很多種類,像CNN(卷積神經網絡),RNN,自編碼,深度學習等等。神經網絡對於數據科學和或者機器學習從業者,就像線性回歸對於統計學家一樣。因此,對神經網絡是什麼有一個基本的理解是有必要的,比如,它是怎麼構成的,它能處理問題的範圍以及它的局限性是什麼。
  • 7 Papers|MIT學神開源微分太極;北大等提出沒有乘法的神經網絡
    在這一過程中需要很大規模的浮點乘法,因此很多研究都在考慮將乘法運算換成等價的加法運算。近日,北大、華為諾亞方舟實驗室等的研究者提出了一個名為 AdderNets 的網絡,用於將深度神經網絡中,特別是卷積神經網絡中的乘法,轉換為更簡單的加法運算,以便減少計算成本。在 AdderNets 中,研究者採用了 L1 正則距離,用於計算濾波器和輸入特徵之間的距離,並作為輸出的反饋。
  • PyTorch可視化理解卷積神經網絡
    造就機器能夠獲得在這些視覺方面取得優異性能可能是源於一種特定類型的神經網絡——卷積神經網絡(CNN)。如果你是一個深度學習愛好者,你可能早已聽說過這種神經網絡,並且可能已經使用一些深度學習框架比如caffe、TensorFlow、pytorch實現了一些圖像分類器。然而,這仍然存在一個問題:數據是如何在人工神經網絡傳送以及計算機是如何從中學習的。
  • 重磅| 世界首個光子神經網絡誕生:比傳統方法快1960倍
    原標題:重磅 | 世界首個光子神經網絡誕生:比傳統方法快1960倍 選自arXiv.org 機器之心編譯 參與:吳攀 以機器學習神經網絡為代表的人工智慧技術正在改變我們生活的許多方面,對支撐這些技術所需的數據處理能力的需求也越來越強。而針對神經網絡的結構開發出神經形態晶片(neuromorphic chip)有望能大幅提升神經網絡的性能。
  • CVPR 2019 神經網絡架構搜索進展綜述
    ——但是還為時過早。手動調參尋找神經網絡架構依然是個有趣的工作,尤其是對於那些帶了很多學生的導師而言(開玩笑啦~)。  神經網絡架構搜索(NAS)——前言那麼問題來了,神經網絡架構搜索(NAS)究竟是什麼?為什麼我們要了解NAS呢?(這一部分是為了去年完全沒有跟進領域內進展的人準備的)NAS的核心思想是使用搜索算法來發現用於解決我們的問題所需要的神經網絡結構。
  • 西電學子獲國際頂會CVPR2020 -VQA比賽亞軍
    西電學子獲國際頂會CVPR2020 -VQA比賽亞軍 2020-06-15 10:36 來源:澎湃新聞·澎湃號·政務
  • 騰訊優圖CVPR中標論文:不靠硬體靠算法,暗光拍照也清晰
    傳統夜景圖像增強算法大致可以分為幾個方面:直方圖均衡化(Histogram equalization),這種方法簡單的利用了圖像整體的統計性質,通常不能對複雜場景達到理想效果。基於Retinex理論的增強算法,通常只能用單通道進行光照優化,顏色無法很好地回復,在光照複雜的情況下還容易出現過曝的現象。
  • 用於英文字母識別的三種人工神經網絡的設計
    人工神經網絡已經被廣泛應用於模式識別、信號處理、專家系統、優化組合、智能控制等各個方面,其中採用人工神經網絡進行模式識別具有一些傳統技術所沒有的優點:良好的容錯能力[2j、分類能力、並行處理能力和自學習能力,並且其運行速度快,自適應性能好,具有較高的解析度。單層感知器、BP網絡和霍普菲爾德網絡均可以用於字符識別。
  • 基於英文字母識別的三種人工神經網絡的設計方案
    典型的前向網絡有單層感知器、BP網絡等,反饋網絡有霍普菲爾德網絡等[1]。 人工神經網絡已經被廣泛應用於模式識別、信號處理、專家系統、優化組合、智能控制等各個方面,其中採用人工神經網絡進行模式識別具有一些傳統技術所沒有的優點:良好的容錯能力[2j、分類能力、並行處理能力和自學習能力,並且其運行速度快,自適應性能好,具有較高的解析度。
  • Facebook這個神經網絡用自然語言表示數學式,秒解微分方程!
    他們訓練了一個神經網絡來執行必要的符號推理,首次實現了對數學表達式的微分和積分。這項成果是邁向更強大的數學推理的重要一步,也是利用神經網絡超越傳統模式識別任務的新方法。在模式識別任務(如面部和物體識別,某些自然語言處理,甚至是玩象棋、圍棋和太空侵略者這樣的遊戲)上,神經網絡已經取得了巨大的成就。
  • 到底能不能設計出為人工智慧打造的神經網絡晶片
    到底能不能設計出為人工智慧打造的神經網絡晶片 21IC 發表於 2020-06-13 10:33:28   大腦是人體最重要的器官之一,它支撐著人的視覺、聽覺、平衡