Connecting the Dots: 基於圖神經網絡的多元時間序列預測

2020-09-27 人工智慧學術前沿

Connecting the Dots: 基於圖神經網絡的多元時間序列預測

題目:

Connecting the Dots: Multivariate Time Series Forecasting with Graph Neural Networks

作者:

Zonghan Wu, Shirui Pan, Guodong Long, Jing Jiang, Xiaojun Chang, Chengqi Zhang

來源:

Machine Learning

Accepted by KDD 2020

Submitted on 24 May 2020


關注 人工智慧學術前沿 回復 :ts01

5秒免費 獲取論文pdf文檔,及項目源碼


摘要

多元時間序列建模一直是一個熱門主題,吸引了來自不同領域的研究人員,包括經濟、金融和交通。多元時間序列預測背後的一個基本假設是,其變量相互依賴,但仔細觀察,可以說現有方法無法完全利用變量對之間的潛在空間依賴性。同時,近年來,圖神經網絡(GNN)在處理關係依賴方面表現出了很高的能力。GNN需要用於信息傳播的定義明確的圖結構,這意味著它們無法直接應用於事先不知道相關性的多元時間序列。在本文中,我們提出了一個專門為多元時間序列數據設計的通用圖神經網絡框架。我們的方法通過圖形學習模塊自動提取變量之間的單向關係,可以輕鬆地將諸如變量屬性之類的外部知識整合到其中。進一步提出了一種新穎的混合跳躍傳播層和一個擴張的起始層來捕獲時間序列內的空間和時間依賴性。在端到端框架中共同學習圖學習,圖卷積和時間卷積模塊。實驗結果表明,我們提出的模型在4個基準數據集中的3個方面優於最新的基線方法,並在提供額外結構信息的兩個交通數據集上與其他方法相比具有同等的性能。


英文原文

Modeling multivariate time series has long been a subject that has attracted researchers from a diverse range of fields including economics, finance, and traffic. A basic assumption behind multivariate time series forecasting is that its variables depend on one another but, upon looking closely, it is fair to say that existing methods fail to fully exploit latent spatial dependencies between pairs of variables. In recent years, meanwhile, graph neural networks (GNNs) have shown high capability in handling relational dependencies. GNNs require well-defined graph structures for information propagation which means they cannot be applied directly for multivariate time series where the dependencies are not known in advance. In this paper, we propose a general graph neural network framework designed specifically for multivariate time series data. Our approach automatically extracts the uni-directed relations among variables through a graph learning module, into which external knowledge like variable attributes can be easily integrated. A novel mix-hop propagation layer and a dilated inception layer are further proposed to capture the spatial and temporal dependencies within the time series. The graph learning, graph convolution, and temporal convolution modules are jointly learned in an end-to-end framework. Experimental results show that our proposed model outperforms the state-of-the-art baseline methods on 3 of 4 benchmark datasets and achieves on-par performance with other approaches on two traffic datasets which provide extra structural information.


基於圖神經網絡的多變量時間序列建模


引言

圖是描述不同實體之間關係的數據的一種特殊形式。近年來,圖神經網絡由於其置換不變性、局部連通性和組合性,在處理圖數據方面取得了很大的成功。通過通過結構傳播信息,圖神經網絡允許圖中的每個節點都知道它的鄰域


多元時間序列預測可以很自然地從圖的角度來看待。多元時間序列中的變量可以看作是圖中的節點,它們通過隱藏的依賴關係相互連接。因此,利用圖神經網絡對多變量時間序列數據進行建模是一種很有前途的方法,可以在充分利用時間序列之間的相關性的同時,保留多變量時間序列的時間軌跡。


最適合用於多變量時間序列的圖神經網絡類型是時空圖神經網絡。時空圖神經網絡以多元時間序列和外部圖結構作為輸入,預測多元時間序列的未來值或標籤。與不利用結構信息的方法相比,時空圖神經網絡已經取得了顯著的改進。


但是,由於存在以下問題,這些方法在建模多元時間序列時仍有不足之處:

挑戰1:未知的圖形結構。現有的GNN方法很大程度上依賴於預先雕花的圖結構來進行時間序列預測。在大多數情況下,多元時間序列沒有明確的圖結構。變量之間的關係必須從數據中發現,而不是作為基本真理知識提供。

挑戰2:圖形學習與處理GNN學習。雖然有圖結構,但大多數GNN方法只關注消息傳遞(GNN學習),忽略了圖結構不是最優的,需要在訓練時進行更新。接下來的問題是如何在端到端框架中同時學習時間序列的圖結構和GNN。


本文工作總結

在本文中,我們提出了一種新的方法來克服這些挑戰。如圖1所示,我們的框架由三個核心組件組成:圖學習層、圖卷積模塊和時序卷積模塊。


如圖2所示,MTGNN的最高層由圖學習層、m個圖卷積模塊、m個時序卷積模塊和一個輸出模塊組成。為了發現節點之間隱藏的關聯,圖學習層計算一個圖鄰接矩陣,這個鄰接矩陣後來被用作所有圖卷積模塊的輸入。圖形卷積模塊與時間卷積模塊相互交錯,分別捕獲空間和時間相關性。

本文主要貢獻如下:


1.據我們所知,這是第一次使用圖形神經網絡從基於圖形的角度對多變量時間序列數據進行研究。


2.我們提出了一個新的圖學習模塊來學習變量之間隱藏的空間依賴關係。該方法為GNN模型在處理數據時不需要明確的圖結構打開了一扇新的大門。


3.我們提出了一個建模多元時間序列數據和學習圖結構的聯合框架。我們的框架比任何現有的時空圖神經網絡更通用,因為它可以處理多變量時間序列,無論是否使用預先修改過的圖結構。


4.實驗結果表明,我們的方法在4個基準數據集中的3個數據集上的性能優於現有的方法,並在兩個提供額外結構信息的trafc數據集上達到與其他GNNs相同的性能。


實驗結果


數據集

在表1中,我們總結了基準數據集的統計信息。

  1. Electricity。UCI電力負荷圖數據集包含370個客戶的每小時總用電量,如[41]所示。根據[15],我們使用過去一周的數據(即168小時)來預測第二天(即24小時)的消耗量。
  2. Traffic。2015年至2016年舊金山海灣地區高速公路862個傳感器測量的道路佔用率。UCI PEM-SF交通數據集描述了[41]中440條舊金山灣區高速公路的佔用率(yt為[0,1])。根據電力數據集,它也按小時級別匯總,具有相同的後退窗口和預測範圍。
  3. Solar-Energy:國家可再生能源實驗室的太陽能數據集包含了2007年阿拉巴馬州137個光伏電站收集的太陽能輸出
  4. Exchange-Rate:匯率數據集包含了從1990年到2016年澳大利亞、英國、加拿大、瑞士、中國、日本、紐西蘭和新加坡等八個國家的每日匯率


模型

單步預測模型1.AR"自回歸模型。2.VAR-MLP:多層感知的混合模型(MLP)和自回歸模型(VAR)[25]。3.GP:高斯過程時間序列模型[6,16]。4.RNN-GRU:具有完全連接的遞歸神經網絡GRU的單位。5.LSTNet:深度神經網絡,結合卷積神經網絡和循環神經網絡[12]。6.TPA-LSTM:注意力循環神經網絡[19]。多步預測模型。1.DCRNN:一種擴散卷積遞歸神經網絡,它結合了擴散圖卷積和遞歸神經網絡[13]。2.STGCN:一個時空圖卷積網絡,包含圖卷積和一維卷積[23]。3.Graph WaveNet:一種時空圖卷積網絡,將擴散圖卷積與一維擴張卷積[21]融合在一起。。4.ST-MetaNet:一個序列到序列的架構,使用元網絡生成參數[15]。5.GMAN:一個具有空間和時間注意的圖形多注意網絡。


實驗結果分析

表2:多元時間序列單步預測的基線比較。


表3時空圖神經網絡多步預測的基線比較。


表5 不同圖神經網絡學習方法對比


結論

在本文中,我們介紹了用於多元時間序列預測的新穎框架。據我們所知,我們是第一個通過基於圖的深度學習方法來解決多元時間序列預測問題的人。我們提出了一種有效的方法來利用多個時間序列之間的固有依賴關係。我們的方法在各種多元時間序列預測任務中展示了出色的性能,並為使用GNN處理各種非結構化數據打開了新的大門。


關注人工智慧學術前沿 回復 :ts01

5秒免費 獲取論文pdf文檔,及項目源碼

相關焦點

  • 基於圖卷積神經網絡GCN的時間序列預測
    時間序列預測任務可以按照不同的方法執行。最經典的是基於統計和自回歸的方法。更準確的是基於增強和集成的算法,我們必須使用滾動周期生成大量有用的手工特性。另一方面,我們可以使用在開發過程中提供更多自由的神經網絡模型,提供對順序建模的可定製的特性。循環和卷積結構在時間序列預測中取得了巨大的成功。
  • 兩篇時序預測 |多元時間序列預測的低階自回歸張量補全
    現代從傳感器網絡(如能源消耗和交通流)收集的時間序列往往是大規模和不完整的,存在大量的破壞和缺失值,很難進行準確的預測。在本文中,我們提出了一個低秩自回歸張量補全(LATC)框架來建模多變量時間序列數據。
  • 關注進化:深度圖進化學習的時間序列預測
    實際時間序列的應用需要考慮兩個因素來實現有效的預測:多變量之間的動態依賴建模和調整模型的內在參數。文獻中存在的一個缺口是,統計和集成學習方法系統地呈現出比深度學習方法更低的預測性能。現有的應用方法通常忽略了數據序列方面與用多個時間序列表示的多變量數據之間的糾纏。
  • NeuralProphet:基於神經網絡的時間序列建模庫
    NeuralProphet是一個python庫,用於基於神經網絡對時間序列數據進行建模。它建立在PyTorch之上,並受到Facebook Prophet和AR-Net庫的極大啟發。
  • 兩篇圖神經網絡交通預測 |用於交通預測的注意力時間圖卷積網絡
    然而,考慮到交通流之間複雜的空間和時間依賴性,這仍然具有挑戰性。在空間維度上,由於路網的連通性,相連道路之間的交通流密切相關。在時間因素方面,雖然相鄰時間點之間一般存在趨勢,但由於交通流也受到外部因素的影響,遙遠的過去點的重要性不一定小於最近的過去點。在本研究中,提出了一種注意力時間圖卷積網絡(A3T-GCN)交通預測方法,以同時捕獲全局的時間動態和空間相關性。
  • 基於ARIMA與Elman神經網絡的風速組合預測模型
    風速預測的準確性直接關係到風電場對電力系統的影響,同時也為風電機組的控制提供了重要依據。因此提高風速預測的準確性,對於增加電網的可靠性、提高經濟效益有很重要的意義。在現實中,大多數時間序列都是非平穩的,因此仿真建模前需對實際數據進行差分處理,雖然差分後可將數據看作是是平穩序列,然而經驗證可知,其中仍含有非平穩部分,這就造成了ARIMA預測非平穩時間序列的誤差增大。
  • 教程 | 如何使用 DeepAR 進行時間序列預測?
    舉例理解,使用歷史的銷售量預測未來1天的銷售量為一元時間序列預測,使用歷史的進店人數、銷售量、退貨量預測未來1天的進店人數、銷售量、退貨量(預測目標有三個)為多元時間序列預測,使用歷史的紅燒牛肉麵、酸菜牛肉麵、海鮮面的銷售量預測未來1天的紅燒牛肉麵、酸菜牛肉麵、海鮮面的銷售量(預測目標有三種)為多重時間序列預測
  • 性能超越最新序列推薦模型,華為諾亞方舟提出記憶增強的圖神經網絡
    特別地,本文使用圖神經網絡對短期的商品語境信息建模,並使用共享的記憶網絡來捕捉商品之間的長期依賴。另外,本文使用雙線性函數以捕捉相關商品的共現模式。在模型評估上,本文在五個真實場景的數據集上進行了評測,並使用一系列評估指標和多個當前效果最優的模型進行了對比。試驗結果顯示,本文模型在Top-K序列推薦中效果極佳。
  • 時間序列預測的常見方法及思考
    二、時間序列預測比較常見的工具方法通常來說,時間序列預測工具方法可以歸結為三大類:一類是基於業務場景理解的因子預測模型,一類是傳統時間序列預測模型,比如均值回歸、ARIMA、指數平滑預測法(比如Holt-Winters)等,還有一類是
  • 基於Holt的趨勢時間序列預測模型
    今天小編為大家帶來「基於Holt的趨勢時間序列預測模型」,一起來看看吧!基於Holt的趨勢時間序列預測模型01:08來自LearningYard學苑 多圖預警!它與一般的指數平滑模型不同的是它對趨勢數據直接進行平滑並對原時間序列進行預測,需要考慮的是兩個平滑參數以及初值的選取問題,也被成為Holt雙參數線性指數平滑模型。
  • 從圖網絡表示到圖神經網絡
    如果數字和數字之間是單向的連接, 而且這個箭頭有著單一的指向,那麼這個數據類型就是時間序列。而在更一般的情況下, 數字和數字之間,是一個互相聯繫的複雜網絡, 這時候我們用節點和連接它們的邊來描述這種數據類型, 這就是我們說的圖網絡結構。對於圖像CNN是目前深度學習的集大成者, 對於時間序列RNN, transformer是集大成者, 那麼對於圖結構呢?
  • 基於圖神經網絡的知識圖譜研究進展
    知識圖譜本身是一種圖結構數據,採用圖構建知識和數據之間的關聯,應用圖神經網絡技術,有望結合知識和數據,實現更好的可解釋和可信人工智慧技術。本文將介紹基於圖神經網絡的知識圖譜學習與計算以及基於圖神經網絡融合知識圖譜信息的應用的研究進展。
  • 基於圖神經網絡的知識圖譜研究進展
    知識圖譜本身是一種圖結構數據,採用圖構建知識和數據之間的關聯,應用圖神經網絡技術,有望結合知識和數據,實現更好的可解釋和可信人工智慧技術。本文將介紹基於圖神經網絡的知識圖譜學習與計算以及基於圖神經網絡融合知識圖譜信息的應用的研究進展。
  • 基於深度神經網絡的脫硫系統預測模型及應用
    蘇向鵬等採用了基於徑向基函數(Radical Basis Function,RBF)的改進模型,改善了 BP 網絡易陷入局部最小值的缺陷;李軍紅等利用的廣義回歸神經網絡(Generalized Regression Neural Network,GRNN)是基於 RBF 網絡改進的神經網絡模型,針對樣本較少的情況,預測效果有所改善。
  • 乾貨|時間序列預測類問題下的建模方案探索實踐
    圖8 部分區域XGBoost模型預測結果3.3.神經網絡模型LSTM除了統計學模型和機器學習模型以外,深度學習的神經網絡模型在時間序列預測類問題上也有比較好的表現,其中LSTM模型應用最為廣泛。LSTM模型全名長短期記憶人工神經網絡,是一種時間遞歸神經網絡(RNN),可以很好地解決長時依賴問題。使用LSTM模型建模流程如圖所示。 圖9 LSTM模型建模流程圖神經網絡類模型在做數據預處理時,往往需要對數據進行歸一化處理,將每組數據都變為-1到1之間的數,這樣可以加快網絡的訓練速度。
  • 教程| 如何解決LSTM循環神經網絡中的超長序列問題
    作者:Jason Brownlee機器之心編譯參與:李澤南在 LSTM 循環神經網絡面臨長序列輸入時,我們應該怎樣應對?Jason Brownlee 給了我們 6 種解決方案。長短期記憶(LSTM)循環神經網絡可以學習和記憶長段序列的輸入。如果你的問題對於每個輸入都有一個輸出(如時間序列預測和文本翻譯任務),那麼 LSTM 可以運行得很好。
  • 基於CNN-LightGBM模型的高速公路交通量預測
    準確的交通量預測是當今智慧交通的重要基礎,是交通狀況判別的重要基石之一。人們從上個世紀開始就在交通流預測領域做了很多交通預測研究,截止目前為止常見的交通量預測方法主要包括基於統計的預測方法、基於時間序列的交通量預測方法、基於神經網絡的交通量預測方法以及基於機器學習的交通量預測方法幾種。
  • 時間卷積網絡TCN:時間序列處理的新模型
    這篇文章回顧了基於TCN的解決方案的最新創新。我們首先介紹了一個運動檢測的案例研究,並簡要回顧了TCN架構及其相對於傳統方法的優勢,如卷積神經網絡(CNN)和遞歸神經網絡(RNN)。然後,我們介紹了一些使用TCN的應用,包括改進交通預測,聲音事件定位和檢測,以及概率預測。
  • 時間卷積網絡:時間序列的下一場革命?
    :時間卷積網絡:時間序列的下一場革命?翻譯:雷鋒字幕組(君思)這篇文章回顧了幾個最新的基於TCN的解決方案。我們首先介紹運動檢測的案例研究,並簡要回顧一下TCN架構及其相對於傳統方法(如卷積神經網絡(CNN)和遞歸神經網絡(RNN))的優勢。然後介紹了TCN的幾個新穎應用,包括改善交通預測,聲音事件定位和檢測以及概率預測。
  • 時間卷積網絡:時間序列的下一場革命?
    TCN是指時間卷積網絡,一種新型的可以用來解決時間序列預測的算法。該算法於2016年由Lea等人首先提出,當時他們在做視頻動作分割的研究,一般而言此常規過程包括兩個步驟:首先,使用(通常)對時空信息進行編碼的CNN來計算低級特徵,其次,將這些低級特徵輸入到使用(通常是)捕獲高級時域信息的分類器中)RNN。這種方法的主要缺點是需要兩個單獨的模型。