[Submitted on 18 Jun 2020]
摘要:
時間序列預測是一個長期的研究課題,在許多領域都有重要的應用。現代從傳感器網絡(如能源消耗和交通流)收集的時間序列往往是大規模和不完整的,存在大量的破壞和缺失值,很難進行準確的預測。在本文中,我們提出了一個低秩自回歸張量補全(LATC)框架來建模多變量時間序列數據。LATC的關鍵是通過引入額外的時間維度,將原始的多元時間序列矩陣(如傳感器時間點)轉換為三階張量結構(如傳感器一天一天的時間),它允許我們將時間序列的固有節奏和季節性建模為全局模式。利用該張量結構,我們可以將時間序列預測和缺失數據填充問題轉化為一個通用的低秩張量補全問題。除了最小化張量秩之外,我們還在原始矩陣表示上集成了一個新的自回歸範數到目標函數中。這兩個組件扮演不同的角色。低級別的結構允許我們有效地捕獲所有三個維度(即:,傳感器之間的相似性,不同天數的相似性,當前時間vs .歷史天數的相同時間)。自回歸模能較好地模擬局部時間趨勢。在三個真實數據集上的數值實驗表明,在缺失數據填充和滾動預測任務中,全局趨勢和局部趨勢的整合具有優越性。
在本文中,我們提出了一個低秩自回歸張量補全(LATC)框架來建模具有缺失值的大尺度多元時間序列。LATC,最初的多元時間序列矩陣轉化為一個三階張量是基於最重要的季節性,因此缺少的數據歸責和未來價值預測問題可以自然地轉換成一個普遍的張量完成問題(參見圖1)。為了達到更好的預測能力,我們使用張量核核範數最小化範數最小化和截斷保持長期/全球趨勢。然後我們在原始矩陣表示上定義了一個新的自回歸範數來描述短期/局部趨勢。
用這種方法,所有觀察到的數據在張量X將有助於最終的預測(即。我們在三個真實數據集上評估了LATC,用於缺失數據填充和滾動預測任務,並將其與幾種最先進的方法進行比較。我們的數值實驗表明,LATC的性能令人鼓舞,表明該模型可以有效地捕獲時間序列數據的全局和局部趨勢。
關注人工智慧學術前沿 回復 :ts09
5秒免費獲取論文pdf文檔,及項目源碼
[Submitted on 13 Jun 2020]
摘要:
時間序列預測和時空克裡格法是時空數據分析中最重要的兩項任務。最近關於圖形神經網絡的研究在時間序列預測方面取得了長足的進展,但很少關注克裡格問題——為未採樣位置/傳感器恢復信號。大多數現有的可伸縮克裡格法(例如,矩陣/張量補全)都是可轉換的,因此當我們有一個新的傳感器來插值時,就需要完全的再訓練。在本文中,我們開發了一個歸納圖神經網絡克裡格(IGNNK)模型來恢復網絡/圖結構上的未採樣傳感器的數據。為了推廣距離和可達性的影響,我們生成隨機子圖作為樣本,並重構每個樣本對應的鄰接矩陣。通過重構每個樣本子圖上的所有信號,IGNNK可以有效地學習空間信息傳遞機制。在幾個真實時空數據集上的實證結果證明了我們的模型的有效性。此外,我們還發現,學習的模型可以成功地轉移到不可見數據集上的相同類型的克裡格任務。
結果表明:
1)GNN是一種有效的空間克裡格工具;
2)使用動態鄰接矩陣訓練歸納性GNN;
3)經過訓練的模型可以轉換成新的圖結構。
我們開發了一個歸納圖神經網絡克裡格(IGNNK)模型來解決動態網絡結構上的實時時空克裡格問題。與某些類型控制下的推薦系統中的圖不同,我們的空間圖實際上包含了有價值的位置信息,它允許我們量化跳以外的精確成對距離。特別是對於有向網絡,如公路網,距離矩陣將是不對稱的,它實際上捕獲了從一個傳感器到另一個傳感器的可達程度[14,15]。為了更好地利用距離信息,IGNNK訓練一個GNN的目標是重構隨機子圖結構上的信息(見圖1)。
我們首先從所有可用傳感器中隨機選擇一個節點子集,並創建一個相應的子圖。我們首先從所有可用的傳感器中隨機選擇一個節點子集,並創建相應的子圖。我們將其中一些掩蔽為缺失,並訓練GNN重構子圖(圖1(a))上所有節點(包括觀測節點和掩蔽節點)的完整信號。
該訓練方案允許GNN有效地學習消息傳遞機制,並進一步推廣到不可見節點/圖。接下來,給定觀察到的信號來自相同甚至完全新的網絡結構,訓練後的模型可以通過重構進行kriging(圖1(b))。
圖2給出了一個簡單的3層DGCN的IGNNK的整個圖神經網絡結構。
表1顯示了IGNNK和其他基線模型在四個數據集上的kriging性能。可以看到,所提出的方法始終優於其他基線模型,在所有數據集上提供最低的RMSE和MAE。
關注人工智慧學術前沿 回復 :ts10
5秒免費獲取論文pdf文檔,及項目源碼