基於神經網絡算法 羊毛_基於pso算法和bp算法訓練神經網絡 - CSDN

2020-11-22 CSDN技術社區

作者 | 劉忠雨
來源 | AI 前線(ID:ai-front)

圖神經網絡(GNN,Graph Neural Networks)是 2019 年 AI 領域最熱門的話題之一。圖神經網絡是用於圖結構數據的深度學習架構,將端到端學習與歸納推理相結合,業界普遍認為其有望解決深度學習無法處理的因果推理、可解釋性等一系列瓶頸問題,是未來 3 到 5 年的重點方向。2019 年圖神經網絡有哪些研究成果值得關注?2020 年它又將朝什麼方向發展?讓我們一起來一探究竟。

1 GNN:從嘗鮮進入快速爆發期

2019年以來,圖神經網絡技術(Graph Neural Network, GNN)得到了學術界極大的關注與響應。各大學術會議紛紛推出 GNN 相關的 workshop,在投中的論文中,以 Graph Network 為關鍵詞的論文數量也呈現井噴之勢,下圖給出了近三年,上述關鍵詞在各學術會議上的增長趨勢:

GNN 在經歷過 2017-2018 年兩年的孕育期與嘗試期之後,在 2018 年末至今的一年多時間裡,迎來了快速爆發期。從理論研究到應用實踐,可謂是遍地開花,讓人應接不暇。在理論研究上,GNN 的原理解釋、變體模型以及對各種圖數據的拓展適配等工作成為了主流。而在應用實踐上,GNN 更是展現出了前所未有的滲透性,從視覺推理到開放性的閱讀理解問題,從藥物分子的研發到 5G 晶片的設計,從交通流量預測到 3D 點雲數據的學習,我們看到了 GNN 極其廣闊的應用前景。本文將對近一年各大頂級會議(如 ICML、NIPS、CVPR、ACL、KDD 等)上的 GNN 相關論文進行梳理,重點從理論研究和應用實踐兩方面解讀過去一年 GNN 的進展。由於時間和篇幅有限,本文並沒有對每一個方向都進行全面的總結與概括,感興趣的讀者可以根據文中給出的論文連結自行查漏補缺。

2 GNN 的原理、變體及拓展

GNN 作為一個新興的技術方向,其原理解讀以及各類變體與拓展構成了理論研究的熱點,這些論文很好地回答了 GNN 的優缺點以及相關的適應性改造問題。

2.1 GNN 原理解讀

當前 GNN 研究的第一個熱點在於其相關能力的理論化研究。在 「How Powerful are Graph Neural Networks?」 和 「On the equivalence between graph isomorphism testing and function approximation with GNNs」 中,都對 GNN 在圖同構問題上的表現進行了探討。圖同構問題是辨別給定的兩個圖是否一致,同構圖如下圖所示。這個問題考驗了算法對圖數據結構的辨別能力,這兩篇文章都證明了 GNN 模型具有出色的結構學習能力。圖中天然包含了關係,因此許多 GNN 相關的工作就建立在對給定系統進行推理學習的研究上,在這些研究中,「Can graph neural networks help logic reasoning? 」 和 「The Logical Expressiveness of Graph Neural Networks」 論證了 GNN 在邏輯推理上的優秀表現。「All We Have is Low-Pass Filters 」 從低通濾波的層面解釋了 GNN 的有效性。這些原理解讀,有助於我們對 GNN 的特色專長建立一種更加清晰的認識。

2.2 GNN 的各類變體

GNN 模型的相關變體研究是領域內的另一個熱點,這些變體在一些方面提升了 GNN 的能力表現。我們知道 GCN 模型來源於圖信號上的傅立葉變換,「Graph Wavelet Neural Network」 引入了圖信號上的小波變換來改造 GCN 模型,將卷積計算變換到空域局部鄰域內。將數據表徵從歐式空間轉化到雙曲空間,不僅能獲得更好地層次化表示,同時能大大節約空間維度,「Hyperbolic Graph Convolutional Neural Networks」和 「Hyperbolic Attention Networks」 同時將 GNN 拓展到了雙曲空間上去。

在 「MixHop: Higher-Order Graph Convolutional Architectures via Sparsified Neighborhood Mixing」 和 「Diffusion Improves Graph Learning」中,同時將原始 GCN 中的鄰居定義由一階拓展到高階,強化了模型低通濾波的特性。

2.3 GNN 在各類圖數據及任務上的拓展

圖數據是一個種類繁多的數據家族,模型對這些不同類型的數據如何適配,是 GNN 發展的另一重要方向。下表給出了相應的概括:

在圖數據相關的任務上,圖的分類是一個重要而又未完全解決好的問題,其難處在於如何在圖數據上實現層次化的池化操作從而獲得圖的全局表示,「Graph Convolutional Networks with EigenPooling」中給出了一種新的操作思路。

3 GNN 相關應用

近幾年,以深度學習為代表的人工智慧技術給產業界帶來了新的變革。該技術在視覺、語音、文本三大領域取得了極大的應用成果,這種成功,離不開深度學習技術對這三類數據定製化的模型設計工作。脫離於這三類數據之外,圖數據是一種更加廣泛的數據表示方式,誇張地說,沒有任何一個場景中的數據彼此之間是孤立存在的,這些數據之間的關係都可以以圖的形式進行表達。下圖給出了一些圖數據的使用場景:

如何將圖數據的學習與深度學習技術進行深度結合成為了一個迫切且緊要的需求。在這樣的背景之下,圖神經網絡技術的興起恰似一股東風,第一次使得我們看到了深度學習應用到圖數據之上的曙光。實際上,在最近一年,GNN 的應用場景不斷延伸,覆蓋了計算機視覺、3D 視覺、自然語言處理、科研、知識圖譜、推薦、反欺詐等場景,下面我們將逐項概括。

3.1 計算機視覺

在前幾年跨越了視覺識別的大門之後,推理相關的視覺任務已經成為了了各大 CV 頂會的主要關注點,如:視覺問答、視覺推理、語義圖合成、human-object interaction 等,甚至如視覺的基礎任務,目標檢測也需要用到推理來提升性能。在這些任務中,已經大量出現應用 GNN 的相關工作。下面我們以最常見的視覺問答任務舉例說明,在「Relation-Aware Graph Attention Network for Visual Question Answering」一文中,給出了將 GNN 與視覺模型結合的示意圖:

在上圖中,視覺模型的作用是提取給定圖像中的語義區域,這些語義區域與問題一併當做圖中的節點,送到一個 GNN 模型中進行推理學習,這樣的一種建模方式,可以更加有效地在視覺問答中對問題進行自適應地推理。

另外一個有意思的場景是少樣本或零樣本學習,由於這類場景下樣本十分缺乏,如何充分挖掘樣本之間的潛在關聯信息(比如標籤語義關聯、潛層表達關聯)就成為了一個至關重要的考量因素,引入 GNN 成為了一個非常自然的動作,相關工作有「Rethinking Knowledge Graph Propagation for Zero-Shot Learning」、「Edge-labeling Graph Neural Network for Few-shot Learning」。

3.2 3D 視覺

3D 視覺是計算機視覺的又一重要發展方向,世界是 3D 的,如何讓計算機理解 3D 世界,具有極其重要的現實價值。3D 視覺中,點雲數據是一種十分常見的數據表示方法。

點雲數據通常由一組坐標點(x,y,z)表示,這種數據由於映射了現實世界中物體的特徵,因此存在一種內在的表徵物體語義的流行結構,這種結構的學習也是 GNN 所擅長的。需要說明一點的是,在 3D 視覺中流行的是幾何學習 Geometry Learning,當下,幾何學習與 GNN 在一些場景如點雲分割、點雲識別等正在深度融合,相關論文有 「Graph Attention Convolution for Point Cloud Segmentation」、「Semantic Graph Convolutional Networks for 3D Human Pose Regression」。

3.3 自然語言處理

GNN 與 NLP 的結合,關鍵點也在於 GNN 優秀的推理能力。GNN 在一些場景如:閱讀理解、實體識別與關係抽取、依存句法分析中都有應用。下面我們以多跳閱讀(Multi-hop reading)為例,多跳閱讀是說在閱讀理解的過程中,往往需要在多篇文檔之間進行多級跳躍式的關聯與推理,才能找到正確答案,相比較以前的單文檔問答數據集,這是一個更具有開放性與挑戰性的推理任務。下圖給出了多跳閱讀的樣例:

在「Cognitive Graph for Multi-Hop Reading Comprehension at Scale」一文中,作者基於 BERT 和 GNN 的實現可有效處理 HotPotQA 數據集中有關多跳閱讀問題的數百萬份文檔,在排行榜上的聯合 F1 得分為 34.9,而第二名的得分只有 23.6。

3.4 科研場景

如果我們把原子看做圖中的節點、化學鍵看做邊,那麼分子就可以表徵為一張圖。這種以圖來表示分子的方法,可以將 GNN 結合到很多實際的科研場景中,如蛋白質相互作用點預測、化學反應產物預測等,這些場景有利於將深度學習的快速擬合能力帶入進藥物研發、材料研發等行業中去,提升研發效率。

在「Circuit-GNN: Graph Neural Networks for Distributed Circuit Design」一文中,作者將 GNN 結合進高頻電路設計(如 5G 晶片等)場景,大大提升了電路電磁特性仿真計算的效率。下圖給出了系統示意圖:

3.5 知識圖譜

由於知識圖譜本身就是一種圖數據,因此知識圖譜 +GNN 的組合自然就成了解決各類知識圖譜問題的新手段。關係補全或預測問題是知識圖譜的一大基礎任務,通過關係的推理補全可以大大提升知識圖譜的應用質量,下圖給出了關係補全的一個實例:

在論文「Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs」中,作者選擇用 GNN 對知識圖譜進行建模,相比之前基於單獨三元組關係的推理,基於 GNN 的方法可以更好地捕捉三元組鄰域複雜而隱含的模式信息,這種優勢對完成關係補全任務具有十分重要的作用。

實體對齊是知識圖譜的另一類任務,給定多個知識圖譜,需要首先確定各自圖譜中的哪些實體描述的是同一個對象,完成這項工作才能正確地將它們合成一個大的知識圖譜。論文「Multi-Channel Graph Neural Network for Entity Alignment」提出了一種基於 GNN 的實體對齊方案,實驗表明,在多個數據集上,該方案均取得了最好的效果。

近幾年,知識圖譜在工業界聲勢日隆,在這種語境下,我們也稱知識圖譜為業務圖譜,在論文「Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks」中,作者成功運用 GNN 技術對電影業務圖譜進行建模,在電影流行度預測上效果表現十分出色。

另外,知識圖譜與推薦系統結合也成了近期一個比較熱門的方向,這部分可參考下一節推薦系統中的講解。

3.6 推薦系統

推薦是各大網際網路公司十分重要的營收手段,因此一直以來備受工業界與學術界雙重關注。過去這幾年,推薦系統由早期的協同過濾算法發展到 MF 模型、再到之後的 Wide&Deep,以及基於 Network Embedding 的方法,可以明顯地看到基於神經網絡的方法正在逐漸佔據主要位置,而 GNN 的出現,又一次大大加速了這個技術趨勢。

以電商平臺的推薦為例,推薦系統的核心數據在於用戶 - 商品交互的二部圖,而基於神經網絡的多數方法將二部圖中的實體映射到一個合適的向量空間中去,使得在圖上距離越近的兩個實體在向量空間中的距離也越近,如下圖所示:

GNN 本身是一種深度模型,與推薦系統結合之後,多層 GNN 模型可以更好地捕捉用戶與商品之間的高階協同關係,論文「Neural Graph Collaborative Filtering」中,作者論證了多層 GNN 所帶來的「Deep」與「High order」效益對推薦質量的有效提升。

除了推薦系統算法模型本身的研究,另一種思路在於如何使推薦系統有效融合進額外的信息,如用戶端社交網絡的信息、商品端商品知識圖譜的信息。這類信息中通常也蘊含了極強的關係,因此可以非常自然地與用戶 - 商品二部圖合在一起構成一個更大的異構圖。下圖給出了與電影知識圖譜的結合示意圖:

有了這樣的圖數據抽象之後,引進 GNN 進行推薦建模也就成了一種自然的選擇,相關論文有 KGAT:「 Knowledge Graph Attention Network for Recommendation」、「Metapath-guided Heterogeneous Graph Neural Network for Intent Recommendation」、「Session-based Social Recommendation via Dynamic Graph Attention Networks」等。

另外一個十分重要的、也與推薦系統息息相關相關的業務場景是廣告點擊率(CTR)預測。該場景下的樣本通常是由多領域的特徵數據構成,比如用戶域、設備域、廣告域等等,如何建模這些數據域之間的特徵交互,成為了該任務的核心。最近基於神經網絡的方法都是直接將各個域之間的特徵拼接起來然後送到上層的網絡模型中,以期得到這些域之間的高階交互,這種簡單的非結構化的拼接方式,會大大限制模型的學習能力。在「Fi-GNN: Modeling Feature Interactions via Graph Neural Networks for CTR Prediction」一文中,作者將各個域之間以圖的形式連接起來(下圖中的 Feature graph),然後用 GNN 建模各個特徵域之間高階複雜的交互關係,相比之前的模型取得了最好效果。

3.7 反欺詐

反欺詐業務是各大公司保證運營業務與營銷業務正常開展的前提,通常我們所面臨的欺詐問題包括:垃圾評論、排名欺詐、交易欺詐、薅羊毛、帳戶盜用等。這些欺詐現象的背後往往是黑產團夥協同作案,大大提高了反欺詐業務的打擊成本。

關係數據的挖掘是絕大部分反欺詐業務開展最重要的技術視角,不論是基於欺詐風險傳播的關聯分析還是基於黑產團夥模式的結構化挖掘,圖都是反欺詐業務人員的首選工具。在這樣的背景下,GNN 也變得極有發揮空間。例如,論文「Heterogeneous Graph Neural Networks for Malicious Account Detection」中運用 GNN 對支付寶欺詐用戶進行識別檢測,「Spam Review Detection with Graph Convolutional Networks」中運用 GNN 對鹹魚上的評論進行欺詐識別。

4 GNN 開源項目總結

在 2019 年,圖領域出現了不少新的開源項目,一些已有的開源項目也有較大的改善。

1 月,阿里媽媽開源了國內首個支持工業級圖深度學習的框架 Euler,內置很多實用的圖算法。

3 月,德國多特蒙德工業大學的學者們提出了 Pytorch Geometric ,實現了諸多 GNN 的變體模型,上線之後獲得了大佬 Yann LeCun 的推薦。

5 月,著名圖學習框架 DGL 發布 v0.3 版本(目前已經更新至 0.4.1 版本,也補齊了很多 GNN 的變體模型),0.3 版本在性能上有了非常顯著的提升,相比 0.2 版本訓練速度提高了 19 倍,同時支持億級規模的圖神經網絡訓練。

12 月,史丹福大學的 Jure Leskovec 教授在 NeurlPS 2019 大會演講中宣布開源 Open Graph Benchmark,通過這一數據集可以更好地評估模型性能等方面的指標。

同月,清華大學知識工程研究室(KEG)推出了大規模圖表示學習工具包 CogDL,可以讓研究者和開發者更加方便地訓練和對比用於節點分類、鏈路預測以及其他圖任務的基準或定製模型。

5 展望

展望來年,最可以確定的一點是 GNN 依然會保持如今快速發展的態勢。從理論研究上看,不斷解構 GNN 相關的原理、特色與不足,進而提出相應地改進與拓展,是非常值得我們關注的部分。另外,關於一直以來研究 GNN 所用的標準數據集,如 Cora、PubMed,這些數據集場景單一、異構性不足,難以對複雜的 GNN 模型進行準確評價,針對這一問題,近期史丹福大學等開源的 OGB 標準數據集有望大大改善這個現狀,在新的評價體系下,哪些工作能夠脫穎而出,且讓我們拭目以待。

在應用場景上,相信 GNN 能夠帶給我們更加亮眼的工作,除了在視覺推理、點雲學習、關係推理、科研、知識圖譜、推薦、反欺詐等領域有廣泛應用外,在其他的一些場景,如交通流量預測、醫療影像、組合優化等,也出現了一些 GNN 相關的工作。大體上看,如何準確有效地將圖數據與 GNN 二者有機結合到相關場景,是應用上需要著重考慮的事情,相信來年,會出現更多這樣的工作來拓展 GNN 的應用邊界。

相關焦點

  • 神經網絡算法原理_神經網絡算法的應用_神經網絡算法實例說明
    神經網絡是一種模擬人腦結構的算法模型。其原理就在於將信息分布式存儲和並行協同處理。雖然每個單元的功能非常簡單,但大量單元構成的網絡系統就能實現非常複雜的數據計算,並且還是一個高度複雜的非線性動力學習系統。   神經網絡的結構更接近於人腦,具有大規模並行、分布式存儲和處理、自組織、自適應和自學能力。
  • 訓練神經網絡的五大算法
    訓練神經網絡的五大算法 Alberto Quesada 發表於 2017-11-16 15:30:54   神經網絡模型的每一類學習過程通常被歸納為一種訓練算法。
  • 機器學習算法盤點:人工神經網絡、深度學習
    在建立預測模型的時候,監督式學習建立一個學習過程,將預測結果與「訓練數據」的實際結果進行比較,不斷的調整預測模型,直到模型的預測結果達到一個預期的準確率。監督式學習的常見應用場景如分類問題和回歸問題。常見算法有邏輯回歸(Logistic Regression)和反向傳遞神經網絡(Back Propagation Neural Network)   非監督式學習:
  • 算法之「算法」:所有機器學習算法都可以表示為神經網絡
    我們可以說,神經網絡是對機器學習的普遍概括,而不是僅僅一次嘗試。與其說神經網絡是簡單的算法,不如說是框架和概念,這是顯而易見的,因為在構建神經網絡時有很大的自由度——比如對於隱藏層&節點個數、激活函數、優化器、損失函數、網絡類型(卷積神經網絡、循環神經網絡等)以及特殊層(批歸一化、隨機失活等)。
  • 機器學習算法匯總:人工神經網絡、深度學習及其它
    在建立預測模型的時候,監督式學習建立一個學習過程,將預測結果與「訓練數據」的實際結果進行比較,不斷的調整預測模型,直到模型的預測結果達到一個預期的準確率。監督式學習的常見應用場景如分類問題和回歸問題。 算法類似性根據算法的功能和形式的類似性,我們可以把算法分類,比如說基於樹的算法,基於神經網絡的算法等等。當然,機器學習的範圍非常龐大,有些算法很難明確歸類到某一類。而對於有些分類來說,同一分類的算法可以針對不同類型的問題。這裡,我們儘量把常用的算法按照最容易理解的方式進行分類。
  • AI從入門到放棄:BP神經網絡算法推導及代碼實現筆記
    導數符號不變,讓神經網絡訓練容易收斂。這裡只說我們用到的激活函數:求一下它的導數把,因為後面講bp算法會直接套用它:先祭出大殺器,高中數學之複合函數求導法則:它的導數圖像:▌五. 沙漠中心的風暴:BP(Back Propagation)算法1.
  • 深度學習:神經網絡算法的昨天、今天和明天
    而這些應用背後的核心算法就是深度學習(Deep Learning),也是機器學習(Machine Learning)領域最火熱的一個分支。和其他機器學習算法有很大不同,深度學習依賴大量數據的迭代訓練,進而發現數據中內在的特徵(Feature),然後給出結果。這些特徵中,有很多已經超越了人為定義的特徵的表達能力,因此得以讓深度學習在很多任務的表現上大大超越了其他機器學習算法,甚至超越了人類自己。
  • 前沿| 利用遺傳算法優化神經網絡:Uber提出深度學習訓練新方式
    許多人認為,SGD 算法有效計算梯度的能力對於這種訓練能力而言至關重要。但是,Uber 近日發布的五篇論文表明,神經進化(neuroevolution)這種利用遺傳算法的神經網絡優化策略,也是訓練深度神經網絡解決強化學習(RL)問題的有效方法。
  • NAS-DIP: 基於神經架構搜索的自監督圖像補全算法
    From: Arxiv;編譯: T.R  與先前使用大規模監督數據進行訓練的算法不同,Deep Image Prior(DIP)利用隨機初始化的神經網絡模型和退化後的圖像進行自監督迭代,在無需大規模數據進行訓練的情況下,就能有效實現圖像去噪、超分辨和補全等任務。
  • BP神經網絡
    神經網絡的訓練過程,由特定的算法構成,提供了理想的學習樣本,訓練後,輸入和輸出足夠數量的例子,知道達到收斂。直至使神經網絡的輸出和理想輸出之間的誤差達到極小的狀態。就可以將經過訓練的模型用於解決相同類型的問題了。人工神經網絡各層結構之間的關係是非線性的映射。非線性等的分類問題也可以通過神經網絡來解決。人工神經網絡有著優秀的自學習能力,可以任意精度逼近我們所設定的非線性函數關係。
  • 從梯度下降到擬牛頓法:詳解訓練神經網絡的五大學習算法
    選自 Neuraldesigner作者:Alberto Quesada機器之心編譯參與:蔣思源在神經網絡中,系統的學習過程一般是由訓練算法所主導。而現如今有許多不同的學習算法,它們每一個都有不同的特徵和表現。因此本文力圖描述清楚五大學習算法的基本概念及優缺點,給讀者們闡明最優化在神經網絡中的應用。
  • 盤點| 機器學習入門算法:從線性模型到神經網絡
    原標題:盤點 | 機器學習入門算法:從線性模型到神經網絡 選自Dataconomy 機器之心編譯 參與:王宇欣、吳攀、蔣思源預測是一種基於輸入變量來估計輸出變量的過程。比如,如果我們輸入特定房子的特徵,則可以預測售價。
  • 基於卷積神經網絡的目標檢測算法簡介
    在卷積神經網絡中,輸入圖像通過多個卷積層和池化層進行特徵提取,逐步由底層特徵變為高層特徵;高層特徵再經過全連接層和輸出層進行特徵分類,產生一維向量,表示當前輸入圖像的類別。根據每層的功能,卷積神經網絡可劃分為兩個部分:由輸入層、卷積層和池化層構成特徵提取器,以及由全連接層和輸入層構成分類器。
  • 一文詳解神經網絡 BP 算法原理及 Python 實現
    所謂的鏈式求導法則,就是求複合函數的導數: 鏈式求導法則 放個例題,會更加明白一點: 鏈式求導的例子 神經網絡的結構 神經網絡由三部分組成,分別是最左邊的輸入層,隱藏層(實際應用中遠遠不止一層)和最右邊的輸出層。
  • 74KB圖片也高清,谷歌用神經網絡打造圖像壓縮新算法
    最新的好消息是,谷歌團隊採用了一種GANs與基於神經網絡的壓縮算法相結合的圖像壓縮方式HiFiC,在碼率高度壓縮的情況下,仍能對圖像高保真還原。GAN(Generative Adversarial Networks,生成式對抗網絡)顧名思義,系統讓兩個神經網絡相互「磨鍊」,一個神經網絡負責生成接近真實的數據,另一個神經網絡負責區分真實數據與生成的數據。
  • 基於PVANet卷積神經網絡模型的交通標誌識別算法
    結果表明, 所構建的卷積神經網絡具有優秀的小目標物體檢測能力, 相應的交通標誌檢測算法可以實現較高的準確率。 計算機目標檢測是指計算機根據視頻、圖像信息對目標物體的類別與位置的檢測, 是計算機視覺研究領域的基本內容。隨著硬體和軟體技術的發展, 尤其是基於卷積神經網絡目標檢測算法的普及應用, 計算機目標檢測的準確率及速度都有了很大提高[1]。
  • 神經網絡算法在我國核領域中的應用綜述
    從 1956 年在達特蒙斯學院(Dartmouth)暑期論壇上首次提出[1],已經經過了 60 多年的發展和積澱,近十幾年來,隨著網際網路、雲計算、大數據、超級計算等新技術的發展,推動了 以基於深度學習的神經網絡(簡稱深度學習)為代表的人工智慧技術飛速發展,廣泛應用於圖像分類、語音 識別、知識問答、人機對弈、無人駕駛等領域,迎來爆發式增長的新高潮,正引發可產生鏈式反應的科 學突破,加速新一輪的科技革命和產業變革
  • AutoML新進展:用進化算法發現神經網絡架構
    除了基於學習的方法(例如強化學習)之外,我們想知道是否可以使用我們的計算資源以前所未有的規模進行圖像分類器的編程演化。我們能否以最少的專家參與達成解決方案,今天的人工進化神經網絡能有多好的表現呢?我們通過兩篇論文來解決這些問題。  在ICML 2017上發表的「圖像分類器的大規模演化」中,我們用簡單的構建模塊和初始條件建立了一個演化過程。
  • 金融領域裡的機器學習算法介紹:人工神經網絡
    人工智慧的發展在很大程度上是由神經網絡、深度學習和強化學習推動的。這些複雜的算法可以解決高度複雜的機器學習任務,如圖像分類、人臉識別、語音識別和自然語言處理等。這些複雜任務一般是非線性的,同時包含著大量的特徵輸入。我們下面我們將分幾天的時間對這些算法及其在金融領域的應用進行闡述。
  • 人工智慧算法:訓練神經網絡中的批量歸一化(附代碼)
    更具體地說,它包括60,000個訓練示例和10,000個測試示例,它們都是尺寸為28 x 28的灰度圖像,分為十類。數據集的準備工作包括通過將每個像素值除以255.0來歸一化訓練圖像和測試圖像。這會將像素值置於0到1的範圍內。在此階段,還將創建數據集的驗證部分。在訓練期間利用該組數據集來評估網絡在各種迭代中的性能。