金融領域裡的機器學習算法介紹:人工神經網絡

2021-01-17 邊際實驗室

人工智慧的發展在很大程度上是由神經網絡、深度學習和強化學習推動的。這些複雜的算法可以解決高度複雜的機器學習任務,如圖像分類、人臉識別、語音識別和自然語言處理等。這些複雜任務一般是非線性的,同時包含著大量的特徵輸入。我們下面我們將分幾天的時間對這些算法及其在金融領域的應用進行闡述。

神經網絡

神經網絡(又稱人工神經網絡,英文為artificial neural networks,簡稱ANNs)是一種高度靈活的機器學習算法,它已被成功地應用於具有大量特徵的非線性複雜交互任務。神經網絡通常用於分類和回歸,但在強化學習中(可以是無監督的)也很重要。

下表顯示了多元回歸和神經網絡之間的聯繫。A表示4個輸入特徵(x1到x4)和1個輸出目標(y)的回歸。B展示了一個基本神經網絡的示意,它由節點(圓圈)和連結(連接節點之間的箭頭)組成。神經網絡有三種類型的層:輸入層(包含4個特徵的節點);隱藏層(對訓練數據進行處理與學習);和輸出層(由目標變量y的單個節點組成)。除了網絡結構不同之外,多元回歸和神經網絡的另一個重要區別是,神經網絡隱藏層的節點將輸入以非線性的方式轉換成新的值,然後將這些值重新組合成目標值。例如, 我們使用流行的修正線性單元函數(ReLU),f(x)=max(0, x),y等於β1乘以z1,其中z1是(x1 + x2 + x3)與0之間的最大值,加上β2乘以z2,其中z2是(x2+x4)與0之間的最大值,再加上β3乘以z3,其中z3是(x2+x3+x4)與0之間的最大值,再加上一個誤差項。

在神經網絡模型中,由於特徵數據的單位可能不同,輸入特徵將被標準化處理。例如,如果輸入是正數,我們可以按其最大值對所有輸入進行縮放,使得輸入特徵值均位於0和1之間。

下圖展示了一個更複雜的神經網絡,它的輸入層由四個節點(特徵)組成,隱藏層由五個隱藏節點組成,及一個輸出層。這三個數字:4、5和1對於神經網絡來講是決定神經網絡結構的超參數。

現在我們考慮輸入層右側的節點。這些節點有時被稱為「神經元」,它們用來處理接收到的信息。我們以最上面的隱藏節點為例。有四個連結通過輸入層連接到該節點,因此該節點獲得了由連結傳輸過來的四個值。根據概念,每個節點都有兩個函數:求和運算函數和激活函數。一旦節點接收到四個輸入值,求和運算函數將每個值都乘以一個權重,並將加權後的值相加,形成總的淨輸入值。然後,將總淨輸入值傳遞給激活函數,激活函數將該輸入值轉換為節點的最終輸出值。

我們打個比方,激活函數就像一個電燈開關,以減少或增加輸入的強度。激活函數是非線性的,如S形(sigmoid)函數(輸出範圍為0到1)。非線性的特點意味著對於輸入值的變化,輸出值的變化百分比是不一樣的。

S形(sigmoid)激活函數如下圖所示。在左圖中,S形函數將負的總淨輸入值轉換為接近於0的輸出值。當輸出值很低的話,意味著該節點沒有被「觸發」,因此沒有任何內容傳遞給下一個節點。相反,在右邊的圖中,正的總淨輸入值被轉換為接近於1的輸出值,因此該節點被觸發。然後將該激活函數的輸出值傳輸到下一組節點(若存在第二個隱含層,則為下一個隱含層的節點;在本例中,則傳輸到輸出層的節點)。以上傳播過程被稱為正向傳播。

一開始,求和運算函數中所用到的輸入值權重是隨機賦予的。在有監督學習環境下,訓練神經網絡是一個迭代過程,在這個過程中,預測值將與實際的有標籤數據值進行比較,並使用特定的性能度量方法(如均方誤差)進行評估。然後,根據結果調整權重以減少神經網絡模型的總誤差。該調整過程一般是從後往前進行(輸出層至隱藏層至輸入層),這個過程稱為反向傳播。神經網絡的學習是通過調整權重進行的,這一步驟可以用以下公式表示:

新權重=(舊權重)-(學習率)×(總誤差對舊權重的偏導數)

其中,「偏導數」是指「總誤差相對於舊權重變化的變化率」,也被稱作「梯度」。學習率是一個影響調整幅度的參數。當學習完成時,所有的權重都將被賦值。

在神經網絡的結構中,所有的特徵都與非線性的激活函數相聯繫,這使得神經網絡能夠揭示和特徵之間複雜的非線性關係。一般來說,當隱含層與節點更多的時候,神經網絡處理複雜任務的能力也會增加(但過擬合的風險也會增加)。

在金融領域,資產定價是涉及複雜且不穩定的隨機過程,這對建模提出了挑戰。因此,金融分析師想知道,機器學習能否提高我們對市場運作方式的理解。有的研究比較了傳統統計方法和機器學習方法解釋和預測股票價格表現的能力,結果顯示神經網絡模型產生的單個股票和投資組合的回報表現優於傳統統計方法建立的模型,因為神經網絡模型能夠捕獲動態和相互作用的變量。這表明,基於機器學習的模型(如神經網絡)更有效地處理證券價格中固有的非線性關係。但是,在使用這些模型之前,我們需要權衡這些模型是否缺乏可解釋性,以及我們的數據量能否滿足這些模型的需求。

本文由「邊際實驗室」原創,轉載請務必註明出處。

如果喜歡本文,請點讚讓更多人看到。

原創不易,感謝您的支持!

相關焦點

  • 機器學習算法盤點:人工神經網絡、深度學習
    機器學習算法盤點:人工神經網絡、深度學習 佚名 發表於 2016-08-01 16:26:33   機器學習無疑是當前數據分析領域的一個熱點內容。很多人在平時的工作中都或多或少會用到機器學習的算法。
  • 機器學習算法匯總:人工神經網絡、深度學習及其它
    【編者按】機器學習的算法很多。很多時候困惑人們都是,很多算法是一類算法,而有些算法又是從其他算法中延伸出來的。這裡,我們從兩個方面來給大家介紹,第一個方面是學習的方式,第二個方面是算法的類似性。本文來自IT經理網。
  • 盤點| 機器學習入門算法:從線性模型到神經網絡
    原標題:盤點 | 機器學習入門算法:從線性模型到神經網絡 選自Dataconomy 機器之心編譯 參與:王宇欣、吳攀、蔣思源幾十年來,機器學習實際上已經變成了一門獨立的領域。由於現代計算能力的進步,我們最近才能夠真正大規模地利用機器學習。而實際上機器學習是如何工作的呢?答案很簡單:算法(algorithm)。 機器學習是人工智慧(artificial intelligence)的一種,其本質上講,就是計算機可以在無需編程的情況下自己學習概念(concept)。
  • 機器學習與人工智慧之六:人工神經網絡
    觀眾老爺這期講機器學習的神經網絡算法,本來小編想先介紹基於我們人類知識和規則的機器學習的,但想著打鐵要趁熱,上期我們將人類的視覺系統進行了建模,今天咱們了解一下機器學習的人工神經網絡算法,這樣能比對出機器與人的差異,也能深入理解人工智慧算法具體的實現和原理。
  • 什麼是人工神經網絡(ANN)?
    每天使用神經網絡的應用程式有很多,例如Google的翻譯服務,Apple的Face ID iPhone鎖和Amazon的Alexa AI驅動的助手。神經網絡也在其他領域的一些重要人工智慧突破背後,例如診斷皮膚和乳腺癌,讓目光投向自動駕駛汽車。人工神經網絡背後的概念和科學已經存在了數十年。
  • 極簡機器學習課程:使用Python構建和訓練一個完整的人工神經網絡
    而本文介紹的系列視頻,將帶領大家使用Python構建和訓練一個完整的人工神經網絡。1.數據+架構要想使用一種機器學習的方法,我們首先需要數據。機器學習中有大量的模型,本文訓練的是當前特別火的人工神經網絡。Ps:把數據放進模型之前,我們需要考慮數據單位間的差異。2.正向傳播上一節我們建立了神經網絡,這次我們將用Python程式語言來實現它。
  • 重建腦科學與AI之間的橋梁,人工神經網絡比機器學習更優嗎?
    1943 年,美國神經科學家麥卡洛克(Warren McCulloch)和邏輯學家皮茨(Water Pitts)在 「A Logical Calculus of Ideas Immanent in Nervous Activity」 一文中提出了神經元的數學模型,受人體大腦神經元的啟發,機器學習領域早期的重要算法 —— 人工神經網絡(Artificial
  • 摩根大通報告12個亮點總結:金融領域的機器學習工具有哪些?
    近日,摩根大通發布了一份題為《大數據與人工智慧戰略:機器學習和其它投資數據分析方法(Big Data and AI Strategies: Machine Learning and Alternative Data Approach to Investing)》的報告,對機器學習和大數據對金融領域的影響進行了全面的闡述。
  • 科技:人工神經網絡的進步
    這些重大新故事中的一些與人工神經網絡有關,人工智慧研究中的一個相對較新的現象正在推動從娛樂到醫學等許多領域的各種進步。人工神經網絡依賴於這樣的思想:技術可以使用對應於個體人類神經元和神經元組的小單元來模擬人類大腦的生物學工作,以基於輸入產生輸出。
  • 神經網絡算法原理_神經網絡算法的應用_神經網絡算法實例說明
    神經網絡的用途非常廣泛,在系統辨識、模式識別、智能控制等領域都能一展身手。而現在最吸引IT巨頭們關注的就是神經網絡在智能控制領域中的自動學習功能,特別適合在需要代入一定條件,並且信息本身是不確定和模糊的情況下,進行相關問題的處理,例如語音識別。
  • 3D 列印造出人工神經網絡,UCLA團隊實現全光學機器學習
    研究團隊首先提出了一種全光學的深度學習框架——衍射深度神經網絡(Diffractive Deep Neural Network,D2NN),該架構採用基於深度學習算法的無源衍射層(passive diffractive layers)設計,經誤差反向傳播法(error back-propagation method)訓練後,能夠以接近光速的高速處理能力,實現多種機器學習的複雜功能
  • 高清圖解:神經網絡、機器學習、數據科學一網打盡|附PDF
    這份備忘單涵蓋了上述領域幾乎全部的知識點,並使用信息圖、腦圖等多種可視化方式呈現,設計精美,實用性強。  今天,新智元要為大家推薦一個超實用、顏值超高的神經網絡+機器學習+數據科學和Python的完全圖解,文末附有高清PDF版連結,支持下載、列印,推薦大家可以做成滑鼠墊、桌布,或者印成手冊等隨手攜帶,隨時翻看。
  • 人工智慧、機器學習、神經網絡和深度學習之間是什麼樣的關係?
    但是大家在關注或研究人工智慧領域的時候,總是會遇到這樣的幾個關鍵詞:深度學習、機器學習、神經網絡。那他們之間到底是什麼樣的關係呢?本文引用地址:http://www.eepw.com.cn/article/201806/381185.htm  先說人工智慧,人工智慧是在1956年一個叫達特茅斯會議上提出的。
  • 流行的機器學習算法總結,幫助你開啟機器學習算法學習之旅
    機器學習算法概述「機器智能是人類永遠需要的一項發明。」— Nick Bostrom.如果您可以回顧幾年前的AI並將其與現在的AI進行比較,您會驚訝地發現AI的發展速度隨著時間的增長呈指數級增長。它已擴展到各種領域,例如ML,Expert Systems,NLP等數十個領域。
  • 盤點金融領域裡常用的深度學習模型
    卷積神經網絡由一個或多個卷積層和頂端的全連通層(對應經典的神經網絡)組成,同時也包括關聯權重和池化層(pooling layer)。這一結構使得卷積神經網絡能夠利用輸入數據的二維結構。與其他深度學習結構相比,卷積神經網絡在圖像和語音識別方面能夠給出更好的結果。這一模型也可以使用反向傳播算法進行訓練。
  • 模式識別與機器學習(教學大綱)|向量|貝葉斯|算法|神經網絡_網易訂閱
    ISBN:978-7-302-55892-7  孫仕亮 趙靜 編著  定價:69.5元  內容簡介  本書系統介紹了模式識別與機器學習的基礎理論、模型與算法,兼顧前沿知識的融入。
  • 深度學習進入晶片領域,揭秘寒武紀神經網絡處理器
    陳雲霽(左)和陳天石(右)兄弟寒武紀神經網絡處理器廬山真面目目前,寒武紀系列已包含三種原型處理器結構:寒武紀1號(英文名DianNao,面向神經網絡的原型處理器結構);寒武紀2號(英文名DaDianNao,面向大規模神經網絡);寒武紀3號(英文名PuDianNao,面向多種機器學習算法)。
  • 五分鐘了解機器學習十大算法
    本文為有志於成為數據科學家或對此感興趣的讀者們介紹最流行的機器學習算法。機器學習是該行業的一個創新且重要的領域。我們為機器學習程序選擇的算法類型,取決於我們想要實現的目標。現在,機器學習有很多算法。因此,如此多的算法,可能對於初學者來說,是相當不堪重負的。
  • 深度學習:神經網絡算法的昨天、今天和明天
    而這些應用背後的核心算法就是深度學習(Deep Learning),也是機器學習(Machine Learning)領域最火熱的一個分支。和其他機器學習算法有很大不同,深度學習依賴大量數據的迭代訓練,進而發現數據中內在的特徵(Feature),然後給出結果。這些特徵中,有很多已經超越了人為定義的特徵的表達能力,因此得以讓深度學習在很多任務的表現上大大超越了其他機器學習算法,甚至超越了人類自己。
  • 推薦| 九本不容錯過的深度學習和神經網絡書籍
    選自aioptify機器之心編譯參與:微胖、李亞洲、蔣思源針對 30 多本深度學習和神經網絡書籍,我們(AI Optify 數據團隊)使用不同指標(比如,在線評價、打分、所涉主題、作者影響力、出版年份、社交媒體是否提及等)訓練機器學習算法,為每本書打分、排名。讀者可能會喜歡我們的推薦,因為這份榜單基於數據並且客觀。排名靠前的九本書如下。1.