多變量多因子的非線性模型|BP神經網絡模型

2020-12-06 量化研究方法QRM

二戰女飛行員

一、神經網絡模型

神經網絡模型的靈感來源於生物體內的神經網絡,大量的神經元(可以理解為變量)之間相互聯繫,共同協作處理問題。在模型中,同樣存在諸多神經元,他們之間相互聯繫,共同決定了輸出的結果。通過不斷調整輸入神經元的權重,達到目標結果,這也就是訓練的過程

二、BP神經網絡

BP的全稱是Backpropagation,譯為反向傳播,是目前應用最為廣泛的神經網絡模型之一。神經網絡的訓練目的是為了獲得一組權重,使得輸入量帶入模型得出的輸出量與目標變量誤差最小,若誤差值不符合條件,則返回將權重增加或減小,再次帶入模型驗證,這樣的一個反向修改帶入模型的過程就是BP神經網絡的訓練過程

如果輸入神經元與輸出神經元是線性關係,可以直接進行線性回歸,若非線性關係,就可以利用BP神經網絡。BP神經網絡特別適用於存在眾多變量的多層非線性網絡,給出的結果既可以是定性的(如男/女)也可以是定量的(如3/5/7)

三、過程

神經網絡結構圖舉例:

該結構包括1個隱含層,輸入層,隱含層和輸出層分別包含3個,2個和2個神經元

神經網絡結構圖

首先確定隱含層數量和隱含層神經元個數分別選擇輸入層至隱含層,隱含層至輸出層的傳遞函數確定初始權重,包括輸入層神經元和隱含層神經元的權重運行模型,得到輸出值,計算輸出值與目標輸出的誤差,如誤差大於預先設定的參數,則返回修改權重,直到誤差降到可以接受的範圍

Note 1:

隱含層太多和層中神經元太多,會產生過度擬合,即模型對於訓練集內的數據測試效果極好,誤差極小,但訓練集外的數據,效果極差,誤差極大

隱含層太少和層中神經元太少,則會在訓練時就產生較大誤差

當前並沒有標準的確定方法,但同常會設定一個隱含層,而隱含層神經元的數量隨著輸入神經元的個數變大變小

隱含層個數和層中神經元個數的確定缺乏理論依據是BP神經網絡的缺點之一,很多時候改變這些就會改變模型的輸出結果,這時候就顯得這個聲名赫赫的模型不靠譜

Note 2:

傳遞函數的存在使得BP神經網絡可以處理非線性問題,他們將上一層神經元的加權和投射到下一層的神經元上。可微分的函數都可以作為傳遞函數,常用的有兩種,一是Sigmoid函數,1/(1+e^(-x)),結果在0到1之間,二是Hyperbolic tangent函數,[(e^x-e^(-x))/[ e^x +e^(-x)] ,結果在-1到1之間

Note 3:

計量輸出值與目標值的偏差時,一般選用均方誤差,即輸出值與目標值差值平方的均值

Note 4:

以流程的訓練過程舉個慄子:輸入層神經元A|B|C → 隱含層神經元J|F → 輸出層M為例,其中w1,w2和w3為輸入層至隱含層神經元J的權重,w4和w5為隱含層至輸出層神經元M的權重,設定初始權重後,兩次的傳遞函數都選擇Sigmoid函數f(x)= 1/(1+e^(-x)),流程大致是

首先計算輸入層神經元加權和:j = w1×A + w2×B + w3× C接著動用傳遞函數,將輸入層的值徹底傳遞到隱含層神經元J: J = f(j) = 1/[(1+e^(-j)]然後計算隱含層神經元加權和:m = w4×J + w5×K繼續動用傳遞函數,將隱含層的值徹底傳遞到輸出層神經元M: M = f(m) = 1/[(1+e^(-m))]計算總誤差:[(M』 – M)^2 + (N』 – N)^2]/2若總誤差可接受,則w1,w2,w3,w4和w5就是所求的權重,帶入模型即可以用於檢驗和預測,如不可接受則更新這5個權重,重新跑流程

相關焦點

  • BP神經網絡
    神經網絡的訓練過程,由特定的算法構成,提供了理想的學習樣本,訓練後,輸入和輸出足夠數量的例子,知道達到收斂。直至使神經網絡的輸出和理想輸出之間的誤差達到極小的狀態。就可以將經過訓練的模型用於解決相同類型的問題了。人工神經網絡各層結構之間的關係是非線性的映射。非線性等的分類問題也可以通過神經網絡來解決。人工神經網絡有著優秀的自學習能力,可以任意精度逼近我們所設定的非線性函數關係。
  • 多因子模型簡述
    本文目的是給投資者介紹更多樣的分析模型,讓投資者在行情的隨機變化中可以有更豐富的選擇和判斷空間。Report 報告多因子模型簡介多因子模型目前已成為投資實踐的主流方法,並且在衡量與控制風險方面擁有優越性能。在投資中,因子指不同資產收益間的共同特徵。多因子模型被廣大投資者使用,以便進行資產組合的構建、組合管理、風險管理以及歸因分析。
  • 基於改進神經網絡的非線性系統觀測器設計
    近年來,鑑於神經網絡的特性和發展潛力,神經網絡成為研究的熱點之一。伴隨著控制對象複雜性的提高,系統存在的不確定因素和難以確切描述的非線性特性也隨之增多,神經網絡的研究和發展顯得尤為重要。
  • 神經網絡的基礎是MP模型?南大周志華組提出新型神經元模型FT
    據論文介紹,這項研究為神經網絡提供了一種新的基本構造單元,展示了開發具有神經元可塑性的人工神經網絡的可行性。當前的神經網絡大多基於 MP 模型,即按照生物神經元的結構和工作原理構造出來的抽象和簡化模型。此類模型通常將神經元形式化為一個「激活函數複合上輸入信號加權和」的形式。
  • 一種基於BP網絡非線性耦合作用識別的全局敏感性分析方法及其在...
    報告題目:一種基於BP網絡非線性耦合作用識別的全局敏感性分析方法及其在水文學中的實踐覆蓋學科:機器學習、應用數學、水文學主講人:李鴻雁 新能源與環境學院時間:2020年11月13日(周五)下午兩點地點:吉林大學前衛北區理化樓一階主辦單位:吉林大學研究生工作部
  • 神經網絡模型預測值 論文_bp神經網絡預測模型建模步驟 - CSDN
    在深度學習十分火熱的今天,不時會湧現出各種新型的人工神經網絡,想要實時了解這些新型神經網絡的架構還真是不容易。光是知道各式各樣的神經網絡模型縮寫(如:DCIGN、BiLSTM、DCGAN……還有哪些?),就已經讓人招架不住了。因此,這裡整理出一份清單來梳理所有這些架構。
  • 量化選股策略——多因子模型(圖)
    如果跑贏,則可以做多該組合,同時做空期指,賺取正向阿爾法收益;如果是跑輸,則可以做多期指,融券做空該組合,賺取反向阿爾法收益。多因子模型的關鍵是找到因子與收益率之間的關聯性 ]  基本概念  多因子模型是應用最廣泛的一種選股模型,基本原理是採用一系列的因子作為選股標準,滿足這些因子的股票則被買入,不滿足的則賣出。
  • 【深度】機器學習進化史:從線性模型到神經網絡
    Google實現了分布神經網絡,也得到了更多回報,如今,每個人都希望他們也能像Google一樣獲得成功,但是好事兒不會發生兩次。為什麼一個支持向量機或邏輯回歸比神經網絡更容易實現分布?首先,評估一個支持向量機要簡單得多。當你學習了一個支持向量機模型或邏輯回歸模型(或者任何一個線性模型)之後,實際評估就會非常快。
  • 自動化所提出基於腦功能影像時間序列的多尺度卷積循環神經網絡模型
    自動化所提出基於腦功能影像時間序列的多尺度卷積循環神經網絡模型 2019-10-28 自動化研究所 【字體:大 中 小】
  • 深度神經決策樹:深度神經網絡和樹模型結合的新模型
    深度神經決策樹:深度神經網絡和樹模型結合的新模型 工程師郭婷 發表於 2018-08-19 09:14:44 近日,來自愛丁堡大學的研究人員提出了一種結合深度神經網絡和樹模型的新型模型
  • 深度學習之卷積神經網絡經典模型
    DropoutAlexNet模型提出了一個有效的模型組合方式,相比於單模型,只需要多花費一倍的時間,這種方式就做Dropout。在整個神經網絡中,隨機選取一半的神經元將它們的輸出變成0。這種方式使得網絡關閉了部分神經元,減少了過擬合現象。同時訓練的迭代次數也得以增加。
  • 利用LS-SVM回歸算法辨識模型參數實現傳感器非線性校正的研究
    近些年來,隨著神經網絡的發展,又有不少學者利用神經網絡的非線性回歸能力,擬合傳感器輸出與輸入的非線性關係,建立傳感器傳輸特性的逆模型,從而使傳感器亦即神經網絡構成的系統線性化。但是,該方法也存在一定的局限性,主要表現在:1)神經網絡存在局部極小和過學習問題,易影響網絡的泛化能力,因此,對樣本的數量和質量依賴強;2)網絡訓練結果與網絡初值、樣本次序等有關,所建逆模型不具備唯一性;3)一般不能給出非線性校正環節(逆模型)的數學解析表達式。
  • 盤點| 機器學習入門算法:從線性模型到神經網絡
    原標題:盤點 | 機器學習入門算法:從線性模型到神經網絡 選自Dataconomy 機器之心編譯 參與:王宇欣、吳攀、蔣思源預測是一種基於輸入變量來估計輸出變量的過程。比如,如果我們輸入特定房子的特徵,則可以預測售價。
  • 基於深度神經網絡的脫硫系統預測模型及應用
    但上述改進仍未考慮脫硫系統大慣性的特點,FU J 等使的用 LSTM 網絡,就能實現信息在時序上傳遞。不過因其設計的網絡只使用了 LSTM 一種結構,神經網絡在結構設計上還有改進空間。基於上述分析,本文採用多種網絡結構和數據處理技術設計深度神經網絡模型,模型預測誤差水平和訓練代價顯著下降。
  • 數據建模中分類與預測模型
    由於對於新入學者而言,掌握人工神經網絡、貝葉斯網絡、支持向量機三種模型所要求的數理統計算法難度較高,牽扯到的數理知識也較為複雜,因此本文後面在介紹分類模型時主要介紹回歸分析與決策樹。決策樹決策樹採用自頂向下的遞歸方式,在內部節點進行屬性值的比較,並根據不同的屬性值從該節點向下分支,最終得到的葉節點是學習劃分的類人工神經網絡人工神經網絡是一種模擬大腦神經網絡結構和功能而建立的信息處理系統,表示神經網絡的輸入與輸出變量之間關係的模型。貝葉斯網絡貝葉斯網絡又稱信度網絡,是Bayes方法的擴展,是目前不確定知識表達和推理領域最有效的理論模型之一。
  • 一種基於能量模型的神經網絡架構受限玻爾茲曼機
    一種基於能量模型的神經網絡架構受限玻爾茲曼機 李倩 發表於 2018-07-26 10:09:24 受限玻爾茲曼機是一種基於能量模型的神經網絡架構,雖然不像通常的卷積神經網絡一樣被人熟知
  • 臨床預測模型:模型的建立
    開發臨床預測模型是一項複雜的系統工程,涉及研究問題、數據集、變量、模型以及結果報告諸多環節,儘管有眾多文獻討論過其中的方法學問題[1-5],《個體預後與診斷的多變量預測模型透明報告》(TRIPOD)研究組也給出了報告規範[6],但仍有很多臨床預測模型在方法學上存在缺陷。在本系列文章開篇文章的基礎上[7],本文將臨床預測模型建立的全過程歸納總結為8個步驟,並將其中的概念及重要原則做一系統介紹。
  • 常見概率模型在金融市場中的應用
    而另一 方面,深度學習在圖像識別、語音識別方面取得較大突破,其原因之一是大數據為較復 雜的模型架構提供了支持。如果把這兩者的優勢結合,則有可能在少量數據的基礎上構 造出較為複雜的模型,例如貝葉斯神經網絡。  本報告將簡單介紹概率模型的構造流程,常見概率模型的類型,最後給出貝葉斯線 性回歸模型和貝葉斯神經網絡在期貨預測中的應用例子。
  • AutoML : 更有效地設計神經網絡模型
    在本文中,我們將介紹AutoML的以下內容:關於AutoKeras的一個簡短介紹通過AutoKeras這個神經架構搜索算法,我們可以找到最好的神經網絡架構,比如層中神經元的數量,架構的層數,加入哪些層,層的特定參數,比如Dropout中的濾波器大小或掉落神經元的百分比等等。
  • 多變量預測模型研究的報告指南:TRIPOD聲明
    在風險評估時,很少基於單個預測變量去估計患者的風險,臨床醫生通常會根據患者的臨床特徵、檢驗結果等多項指標來做出預測,因此預測的本質通常是基於多變量的。預測模型研究預測模型研究大致分為模型開發研究、模型驗證研究或兩者都有的研究(圖3)。模型開發研究是通過篩選相關的預測變量,並將這些預測變量進行統計分析,最後推導出一個多變量預測模型。