卷積層非常稀疏存在採樣誤差

2021-01-15 知書知禮撒

通常反向傳播最重要的類型有卷積網絡與循環網絡。卷積網絡在卷積層為常用。從一個張量的角度看,常用卷積層為梯度下降層的一個中間層。這是因為,在一般地,要實現多層卷積層,需要採用上一層的上一層的結果作為結果損失進行梯度下降的輸入,但卷積層非常稀疏,存在採樣誤差。

因此對於多層的卷積網絡來說,通常需要採用中間層的卷積,以放棄採樣誤差。循環神經網絡是現代很多神經網絡都基於神經元之間的依賴關係進行的組合傳播。卷積不能用,則採用循環網絡作為通道。其中循環層通常採用中間層的第一個循環節的低維表達。基於中間層的每一個循環節,將結果進行組合再輸出,因此可以加快網絡的訓練。它可以看作是更多層的網絡之間的映射。

到目前為止,大多數計算機視覺任務仍處於有監督的子任務。人工神經網絡通過提取規則或使用非線性函數進行學習,通常可以達到特定的水平或目標。大部分現代的深度神經網絡通過融合多個領域的數據,能夠達到準確率,但大部分網絡也無法達到人類視覺水平。中間層的每一個循環節都是通過一個特徵映射(但通常只使用一個映射)來與底層網絡結合,從而構成神經網絡的基礎。

然而,使用循環網絡在一些特定領域受到限制。例如,對於對光線條件非常敏感的領域來說,當網絡結構中出現光線的抖動時,效果可能會大打折扣。最近,已經有許多研究對這一問題提出了一些建議。其中較為常見的網絡結構是resnet,如resnetinception。儘管如此,這些網絡仍然面臨挑戰。首先,循環層中不能使用一個warp算子或softmax作為激活函數,因為激活函數會收到位置相反的映射,並在任意位置上產生輸出,導致網絡難以理解。其次,如果一個warp中的每一個,都不能收到線性的效果,那麼生成的神經網絡更像是一個數學模型,而不是真正的神經網絡。在gpu上,對大量數據進行分組是一個有挑戰性的問題。即使如此,這項工作仍被其他工作所影響。

在其他研究中,可以使用relu來減少累積的激活層的數量,這樣可以使網絡在學習時容易進行routing,從而避免逐層進行梯度的小的衰減,增強網絡的梯度傳播的速度。開篇所謂神經網絡本質就是一個普通的二階導數,這個東西有很多個激活函數去處理。那到底該使用什麼樣的激活函數?我們通常有兩種方法得到這個激活函數。一種是直接得到初始值,如sigmoid,tanh等,然後對所有的初始值做一個求導。

相關焦點

  • 深入卷積神經網絡:高級卷積層原理和計算的可視化
    這些層中的每一層都有不同於原始卷積層的機制,這使得每種類型的層都有一個特別特殊的功能。在進入這些高級的卷積層之前,讓我們先快速回顧一下原始的卷積層是如何工作的。原始卷積層在原始的卷積層中,我們有一個形狀為WxHxC的輸入,其中W和H是每個feature map的寬度和高度,C是channel的數量,基本上就是feature map的總數。卷積層會有一定數量的核,核會對這個輸入進行卷積操作。內核的數量將等於輸出feature map中所需通道的數量。
  • 華中大提出新型採樣與重建算法, 提升稀疏深度稠密補全任務性能
    例如,高質量的雷射雷達售價較為昂貴、採樣的點比較稀疏;結構光傳感器會受到陽光的影響僅限於室內使用,處理高亮反射表面也較為困難;雙目相機則需要複雜的標定過程和較長的基線才能獲得滿意的結果。  傳感器層面的限制讓人們逐漸將目光轉向了算法上,譬如稀疏的深度圖通常可以從低成本的雷射雷達或SLAM中獲取,如果有高性能的深度補全算法就能獲得令人滿意的結果。
  • 機器學習:二維卷積層及其參數的視覺和數學解釋
    介紹目前存在許多的深度學習庫和平臺(如Tensorflow、Keras、Pytorch、Caffe或Theano),在這篇文章中,我將嘗試列出所有這些參數,以了解它們對計算時間、訓練參數數量和卷積輸出通道大小的影響。
  • 港城大提出任意比例的上採樣方法, 實現自由三維點雲稠密重建
    針對需要上採樣的點雲,模型首先通過獲取現有點在切平面上的領域點,學習局域幾何信息獲取插值權重、生成分布在凸包區域內的鄰域點雲,隨後利用稀疏點雲的法向量通過數據驅動的方式來優化點雲結果,獲取最終上採樣後的點雲。  這種方式在一次訓練後可以應用於多個尺度的上採樣過程中,並能夠生成較為精細的幾何結構,具有更強的可解釋性和更好的內存效率。
  • 斯坦福ICLR 2018錄用論文:高效稀疏Winograd卷積神經網絡| ICLR 2018
    在稀疏卷積神經網絡上使用 Winograd 卷積算法會反而使計算量增大。針對上述問題,本文提出兩點改進。首先,我們將 ReLU 激活函數移至 Winograd 域,使得在乘法操作時神經元是稀疏的;其次,我們對 Winograd 變換之後的權重進行剪枝,使得在乘法操作時權重是稀疏的。
  • 形位誤差測量的誤差分析
    一、引言 作為形位誤差的主要測量手段,國內外現有的圓度儀以及在圓度儀基礎上開發的形位誤差測量儀器(如形狀誤差測量儀、形狀測量系統等)比傳統的測量儀器和測量方法能得到更準確的形位誤差測量結果。然而在這些儀器的使用中,由於存在調整不當或不恰當地擴大其使用範圍的情況,從而可能產生較大的測量誤差。
  • 機器不學習:CNN入門講解-卷積層是如何提取特徵的?
    上一期,我們得出了一個結構這個最簡單的卷積神經網絡說到底,終究是起到一個分類器的作用卷積層負責提取特徵,採樣層負責特徵選擇,全連接層負責分類『這位同學,你說的簡單,其實我對卷積層怎麼實現特徵提取完全不懂』
  • 教程| 無監督學習中的兩個非概率模型:稀疏編碼與自編碼器
    一、稀疏編碼(SparseCoding)1.稀疏編碼的概念稀疏編碼最早由Olshausen和Field於1996年提出,用於解釋大腦中的初期視覺處理(比如邊緣檢測)。目標:給定一組輸入數據向量{x1,x2,...
  • 神奇的採樣定理
    然而,在通信系統中,還真存在這樣的神奇的定理。 一個連續時間信號,等間隔採樣一些樣本,僅僅用這些樣本值,就可以完全恢復原來的信號波形。 它的牛逼之處在於,完全恢復幾個字上。 成名已久的最小二乘法,算是一種非常精妙的擬合方法了,但求得的數據與實際數據間仍然存在有誤差。 那麼,定理的具體內容是什麼呢?
  • 如何解決稀疏獎勵下的強化學習?
    人類在日常生活中其實每天能夠收穫的獎勵很少,但是也在持續的學習,改進自己的知識和能力,我們當然希望 agent 也能如此,也能夠在得到稀疏獎勵的情況下持續的進行有益的學習。本文重點探討的就是在存在稀疏獎勵的情況下引導 agent 繼續學習或探索的強化學習問題。
  • 高頻交流信號採樣電路設計
    該電路適合電壓採樣也適合電流採樣,圖中的變壓器,用於電壓採樣,則是變壓器,用於電流採樣,則是電流互感器,變壓器與互感器可以認為是相反使用的,比如變壓器一般用於降低電壓,匝數比50:1,而互感器,則降低電流,匝數比1:50,互感器輸出一般需要有閉合迴路的終端,比如一個小電阻,這個讀者自己調整
  • 模數轉換器高測量精度以及誤差分析
    在任何設計中,理解這些類型應用的總系統精度始終都是非常重要的,尤其是那些需要對波形中極小的靈敏度和變化進行量化的 系統。理想情況下,施加於信號鏈輸入端的每一個伏特都由ADC 以數字表示一個伏特的輸出。但是,事實並非如此。
  • 示波器的使用誤差分析
    討論又可以從以下幾方面來考慮:首先是實驗方法上,是不是存在缺陷,使得結果必然存在一個誤差,比如設計電路不夠合理,使輸出幅值不夠,或者相位超前或滯後;另外從實驗過程看,由於讀取數據、記錄數據等,可能造成的人為的或偶然誤差;還有就是示波器的本身可能存在一些跟蹤信號能力不夠精確,導致存在系統誤差等。
  • 當隨機採樣遇見插值,微軟亞研提出節省推理計算量的新範式
    我們稱這類採樣方法為確定性採樣(Deterministic Sampling),如 Fig. 2 (b) 左圖所示。然而,由於空間冗餘特性的存在,鄰近的位置得分往往接近,因此,在確定性採樣中,一片相鄰的區域經常同時被採樣到或者同時不被採樣到(如 Fig. 1 (b) 所示)。本文提出使用隨機採樣(Stochastic Sampling)與插值相結合的方法來節省計算量。
  • 雷達水位計測量誤差原因分析
    由於雷達波存在發散角,不適合用於坡度較緩、變幅較大的地方進行水位觀測;雷達水位計受風、降雨等影響造成較大的誤差,河道站洪水期間雷達水位計監測受雜草影響;太陽能直接給設備充電,電壓不穩,造成設備電流不穩定,會出現夜間或凌晨跳數嚴重的現象;數據採集終端設備故障率較高。 2、設備安裝條件因素。