土木工程與人工神經網絡(一)

2021-02-08 非解構

本文敘述以小編個人理解為主,只有極少必要的數學公式(大多數是初中數學知識),請大家放心閱讀。

本文是該系列的第一篇文章,主要先介紹人工神經網絡(Artificial Neural Network)的原理和發展歷程。


1.什麼是人工神經網絡

第一次看到人工神經網絡(ANN)的時候會覺得它是一個黑盒子,扔進去一堆數據會返回一些東西,但其實簡單的人工神經網絡可以看做一個帶有若干參數的擬合函數或模型(類似於多項式擬合),但不同於簡單地線性相加,它的結構很複雜,神經元之間不光可以像下圖一樣,從輸入層到輸出層單向連接(前饋型神經網絡),還可以有各種各樣的結構(遞歸神經網絡和反饋神經網絡),隱藏層中可以通過各種各樣的激活函數實現複雜的非線性變換。網絡中的所有的參數有一個初始值,通過已知結果的樣本(帶標籤的數據集,後文有解釋)使所有的參數向著預測更準確輸出值的方向迭代,直到可以準確預測新的數據。


簡單的人工神經網絡長這個樣:在這裡,假設我們要處理的問題有三個自變量x1,x2,x3 並且需要輸出一個目標值y(y是已知的目標值,而y』是神經網絡的預測值)

第二次高潮是Hopfield神經網絡和BP神經網絡出現的年代,BP算法直到現在還是神經網絡重要的架構因素。當時的算力不足,導致可訓練的神經網絡的隱藏層層數還被控制在一定範圍內,但淺層的神經網絡無法滿足對複雜特徵(以性別分類為例,通過看一張照片去判斷男女,最簡單的特徵包含是頭髮和五官等等,但如果這些簡單的特徵都無法區分,就需要挖掘更深層次的特徵了,對神經網絡來說,特徵越複雜就越需要在更高維度上去提取將不同種類分開的特徵。


以擬合一個函數f(x)為例的話,如果f(x)是一個非常複雜的函數,簡單對x的樣本點加權相加是沒法逼近這個函數的,需要多次非線性變換,提高維度來提高逼近的效果,但同時也要避免過擬合的問題,我們會在下面介紹)的提取,另一方面在反向傳播中,由於使用了多個導數的乘積,那麼當導數小於1時,神經網絡的層數越多,傳播到靠近輸入層的誤差衰減的就越厲害,這種梯度消失(vanishing gradient)的現象導致靠近離輸出層遠端的參數訓練幾乎無效,而當導數大於1時,累積到靠近輸出層的權值則會指數級增大,又會引發梯度爆炸(exploding gradient),類似這樣的問題讓早期的神經網絡的隱藏層數不能有效的增加,另外礙於算力的天花板,當時也無法訓練更多層的神經網絡,而淺層的神經網絡並沒有太大的優勢;另一個問題是訓練深層的神經網絡需要大量的樣本數據(比如說用神經網絡來識別動物我們需要很多很多已經被人為分類好的圖片,在訓練的時候告訴網絡這張圖片是貓,這張是狗,這樣的數據叫做有標籤的數據,而在深層神經網絡需要的數據量巨大,人為打標籤是極為耗時的),沒有足夠的訓練數據也是一大問題,所以在深度學習之前人工神經網絡的研究又一次跌入低谷。


深度學習可以逐層訓練網絡,這就解決了梯度彌散的問題,並可以在訓練完成後再利用誤差對網絡的參數進行調優,最重要的一點是在逐層訓練網絡的時候不光可以使用有標籤的數據,還可以在逐層訓練的時候使用無標籤的數據(無監督學習)。雖然後來大家發現很多新的激活函數,如Relu函數可以更好解決梯度衰減的問題,但深度學習與後來的卷積神經網絡(CNN)再一次的將人工神經網絡的發展推向高潮以至於我都知道了深度學習。CNN引入了卷積分的概念,在識別圖像的時候,假如一張三通道的圖片是1000x1000像素的,那麼把它對應的三維數組轉化為向量就是一個1000x1000x3維的向量,按照我們之前介紹的神經網絡結構,我們的輸入層就有1000x1000x3個節點,輸入層的每個節點都和隱藏層的每個節點相連,這樣全連接的網絡是逐個像素提取特徵的,而卷積神經網絡通過卷積核對圖片進行分塊特徵提取的處理,而且每一個卷積層都會提取到不同維度上的特徵。這其實也是在模擬人腦對圖像的處理。我們從看到一張圖片的像素,到看到不同物體的邊緣,再到更加複雜識別判別失誤也是逐層完成的。這一點是1981年諾貝爾醫學生理學獎得主David Hubel發現的,他證明人的大腦可視皮層是分級的,他認為人腦視覺功能是將非常具體形象的元素抽象出更有意義的概念,這些概念又會向上層迭代變成人可以感知到的更加抽象的概念,卷積神經網絡也是這樣的,卷積層提取到的特徵從像素,到邊緣,到物體的部分最後到物體形狀的特徵。


需要注意的一點是,當我們的網絡結構越複雜,對已有樣本的擬合效果一般會越好,但也容易發生過擬合的問題,過擬合會導致預測不準,可以採用的方法有正則化,dropout等方法。

在此之後,雖然無監督學習達不到有監督學習訓練的準確度,但由於找到海量帶標籤的訓練數據實在很困難,無監督學習被認為是深度學習的未來,大家耳熟能詳的生成對抗網絡GAN(Generative Adversarial Network)就基於無監督學習,GAN 包括兩個網絡:Generator 和Discriminator,第一個負責生成數據,而後者負責判斷生成的數據與真實數據的差距。 


人工神經網絡曾經歷過的寒冬很多行業也經歷過,總有一些人堅持自己堅信的東西,每次推向高潮都伴隨著更好的算法和更加偉大的學者。Hinton, Lecun和Bogio誰不是在最黑暗的時候依舊做著不被人看好的研究。


3.土木工程與人工神經網絡

土木領域現在已經用到很多深度學習與其他機器學習領域中的最新研究成果,如基礎設施從施工階段到後期運維健康監測階段就可以用到無人機巡查,點雲的語義分割,視頻識別,圖像處理等等高大上的技術。在設計領域,人工神經網絡也在很早之前就被用在結構優化中,由於有限元方法計算非線性問題(如非線性顯式後屈曲分析)很費時間,而優化過程中有需要計算大量的模型,以徑向基函數為激活函數的RBF神經網絡常常用來擬合複雜的動力學表達式並作為代理模型。代理模型法可以顯著提高優化的速度,而RBF神經網絡由於其只有一個隱藏層,訓練速度很快,理論和大量的實驗證明RBF模型在小樣本情況下具有較好的預測精度與魯棒性。小編在前一段時間主要在研究RBF神經網絡,也會在接下來的文章裡著重介紹RBF及其在結構設計中的實際應用。



參考文獻:

[1]Lee, H., Grosse, R., Ranganath, R., & Ng, A. Y. (2011). Unsupervised learning of hierarchical representations with convolutional deep belief networks. Communications of the ACM, 54(10), 95–103. https://doi.org/10.1145/2001269.2001295

[2]Park, J., & Sandberg, I. W. (1991). Universal Approximation Using Radial-Basis-Function Networks. Neural Computation, 3(2), 246–257. https://doi.org/10.1162/neco.1991.3.2.246

[3] Lecun, Y., Bottou, L., Bengio, Y., & Haffner, P. (1998). Gradient-Based Learning Applied to Document Recognition. http://ieeexplore.ieee.org/document/726791/#full-text-section

[4] Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... & Bengio, Y. (2014). Generative adversarial nets. In Advances in neural information processing systems (pp. 2672-2680).

[5]Deeplearning.ai

相關焦點

  • 人工神經網絡
    這跟我們的人腦的運行機制是非常類似的,例如我們學騎自行車這個事件,大腦對騎自行車這個行為本身帶來的各種感官數據進行解析,然後不斷自我學習,使大腦在學會騎自行車這一行為上精度越來越高,以實現學會騎自行車這個行為本身。而人腦能實現這一關鍵靠的就是1000多億個神經元,於是我們就從中受到啟發,提出了人工神經網絡的算法。
  • 初識人工神經網絡
    這也就是神經網絡的魅力所在。人工神經網絡(artificial neural networks) 是一種模仿生物神經網絡行為特徵,進行信息處理的算法數學模型。在人工神經網絡模型中使用單元節點模擬神經元,通過調整神經網絡內部大量節點(神經元)之間相互連接的權重來達到處理信息的目的。
  • 「人工神經網絡」人工神經網絡之BP算法
    人工神經網絡(Artificial Neural Network,ANN)是在受到了生物學的啟發後創建的,在某種程度上它是對生物大腦的一種模擬。人們仿照生物神經網絡的結構,使用簡單運算單元模擬神經元,並將大量運算單元按某種形式密集連接,便構成了人工神經網絡。結構如圖:人工神經網絡(ANN)模型帶有權重值(w1,w2,...
  • 人工神經網絡簡介
    來源:機器人2025一、人工神經網絡的概念 人工神經網絡(Artificial Neural Network,ANN)簡稱神經網絡(NN),是基於生物學中神經網絡的基本原理,在理解和抽象了人腦結構和外界刺激響應機制後,以網絡拓撲知識為理論基礎,模擬人腦的神經系統對複雜信息的處理機制的一種數學模型
  • 什麼是人工神經網絡(ANN)?
    這就是為什麼該領域從人類心靈的形體和功能派生出其大部分術語(包括「人工智慧」一詞)的原因。人工神經網絡的靈感來自其生物學對應物。大腦的許多功能仍然是個謎,但是我們知道的是,生物神經網絡使大腦能夠以複雜的方式處理大量信息。大腦的生物神經網絡由大約1000億個神經元組成,這是大腦的基本處理單元。
  • 獨家 | 一文讀懂人工神經網絡
    本文通過使用淺顯易懂的語言和介紹youtube上的實驗方式帶讀者認識人工神經網絡。人工神經網絡(ANN)是一種用於機器學習的計算模型,它的工作方式和生物的神經元類似。 當信息到達神經元,它們(神經元)通過調整網絡去感知和獲取這些信息得出一個理想的結果。通過神經元傳輸儘量多的數據會有助於得到更精準的結果。這就是神經網絡中的「訓練」。 在使用神經網絡之前,我們需要訓練和調試,以得到理想的決策結果。
  • 人工神經網絡的原理與訓練
    有一些困難的東西,一是因為有些問題是無法避免,比如解釋一個CDO的結構,這確實需要思考;還一個原因是,在現在一個快餐網絡知識的時代,真正願意花時間仔細讀的人也不是多數。這次寫的這篇因為有一些數學上的東西,所以會難以避免的涉及一些麻煩的東西。但其實只要有線性代數的一定基礎,都是很容易理解的。
  • 深度|人工神經網絡深入分析
    文章從神經網絡談到了人工神經網絡,並對此進行詳細的介紹。最近「神經網絡」非常火,特別是AlphaGo與韓國選手李世石的比賽落幕後,各種關於神經網絡的文章滿天飛,但可能對於非專業領域出身的人來說接觸這些文章就會雲裡霧裡了。究其原因主要是缺少適合大部分人理解的神經網絡的科普文章,其實吳軍老師的《數學之美》在科普神經網絡這方面做的就比較通俗易懂,感興趣的朋友可以去讀一下吳老師的書。
  • 人工神經網絡初學:是什麼以及為什麼?
    [來自IT168]  【IT168 技術】談及人工智慧,就會涉及到人工神經網絡。人工神經網絡是現代人工智慧的重要分支,它是一個為人工智慧提供動力,可以模仿動物神經網絡行為特徵,進行分布式並行信息處理的系統。
  • 獨家 | 一文讀懂人工神經網絡學習原理
    本文對人工神經網絡是如何學習的進行了簡單介紹,使讀者可以對神經網絡的運行機制有更進一步的認識。在之前的博客中,我們談到了關於人工神經網絡(ANN)的一些非常有趣的主題。其中介紹了人工神經網絡的基本結構以及一些最常用的激活函數。然而,我們並未提及人工神經網絡最重要的方面 ---- 學習。
  • 科學家用DNA造出人工神經網絡
    來自加州理工學院生物工程系、計算機科學系、計算與神經系統學系及電子工程系的研究人員首次在試管中用DNA構造出了人工神經網絡,這一人工神經網絡可以像大腦一樣根據不完整的信息回想起相關的記憶
  • 人工神經網絡算法及其簡易R實現
    人工神經網絡(Artificial Neural Network)簡單而言是一種分類算法。作為機器學習的一個龐大分支,人工神經網絡目前大約有幾百種算法,其中包括一些著名的ANN算法:感知器神經網絡(Perceptron Neural Network), 反向傳遞(Back Propagation), Hopfield網絡和自組織映射(Self-Organizing Map, SOM)等等,這篇文章我們只介紹最基本的人工神經網絡算法原理及其簡易的R語言實現方式。
  • 人工神經網絡算法介紹及其參數講解
    每兩個節點間的連接都代表一個對於通過該連接信號的加權值,稱之為權重,這相當於人工神經網絡的記憶。網絡的輸出則依網絡的連接方式,權重值和激勵函數的不同而不同。而網絡自身通常都是對自然界某種算法或者函數的逼近,也可能是對一種邏輯策略的表達。人工神經網絡模型主要考慮網絡連接的拓撲結構、神經元的特徵、學習規則等。
  • 算法的算法:人工神經網絡
    在上周的人工神經網絡課程中介紹了機器學習中的支持向量機(SVM:Support Vector Machine)與前饋網絡RBF的之間的聯繫,而對於由傳遞函數為線性函數組成的單層網絡的代表自適應線性單元(ADLINE:Adaptive  Linear Element)更是和傳統信號處理中的自適應濾波器相類似。
  • 用於英文字母識別的三種人工神經網絡的設計
    本文引用地址:http://www.eepw.com.cn/article/198994.htm1引言人工神經網絡是在人類對其大腦神經網絡認識理解的基礎上人工構造的能夠實現某種功能的神經網絡。代寫論文 它是理論化的人腦神經網絡的數學模型,是基於模仿大腦神經網絡結構和功能而建立的一種信息處理系統。
  • 機器學習:人工神經網絡ANN
    神經網絡是從生物領域自然的鬼斧神工中學習智慧的一種應用。
  • 人工神經網絡的驅動者:激活函數是什麼?
    圖源:unsplash激活函數是人工神經網絡的驅動因素,其位於神經元之上,並管理著神經元行為,比如是否需要處理某個輸入數據,若需要,又以何種程度處理等等。從技術上來講,某個節點的激活函數將其在神經網絡中前一個節點的數據輸入,並輸出一個確定值,這個值繼而指導後續節點如何發動來響應特定輸入信號。本文剖析由激活函數組成的神經網絡,以及神經網絡的生物類似物,並簡要介紹幾種常用的激活函數。神經網絡的結構作為一名數據科學愛好者,你一定見過上面的這張圖片或者與之相似的圖片。這張圖片是對雙層神經網絡工作流程的經典描述。
  • 基於英文字母識別的三種人工神經網絡的設計方案
    是在人類對其大腦神經網絡認識理解的基礎上人工構造的能夠實現某種功能的神經網絡。代寫論文 它是理論化的人腦神經網絡的數學模型,是基於模仿大腦神經網絡結構和功能而建立的一種信息處理系統。因其自組織、自學習能力以及具有信息的分布式存儲和並行處理,信息存儲與處理的合一等特點得到了廣泛的關注,已經發展了上百種人工神經網絡。 一般來說,人工神經網絡從結構上可分為兩種:前向網絡和反饋網絡。
  • 【神經網絡】神經網絡簡介
    [1]FFNN,Feedforward Neural Network信息傳播:朝著一個方向(反向傳播和這個不是同一個概念)前饋神經網絡是我們接觸到論文中最常用的一種神經網絡,簡稱前饋網絡。是實際應用中最常見的神經網絡結構,是人工神經網絡的一種,前饋描述的是網絡的結構,指的是網絡的信息流是單向的,不會構成環路。
  • 如何用這幾款人工神經網絡晶片打造機械姬
    人工神經元的研究起源於腦神經元學說。早期的研究工作可以追溯至上世紀40年代。1943年,心理學家W·Mcculloch和數理邏輯學家W·Pitts在分析、總結神經元基本特性的基礎上首先提出神經元的數學模型。此模型沿用至今,並且直接影響著這一領域研究的進展。