時間序列的LSTM模型預測——基於Keras

2021-02-21 早起Statistics

一、問題背景

現實生活中，在一系列時間點上觀測數據是司空見慣的活動，在農業、商業、氣象軍事和醫療等研究領域都包含大量的時間序列數據。時間序列的預測指的是基於序列的歷史數據，以及可能對結果產生影響的其他相關序列，對序列未來的可能取值做出預測。現實生活中的時間序列數據預測問題有很多，包括語音分析、噪聲消除以及股票期貨市場的分析等，其本質主要是根據前Ｔ個時刻的觀測數據推算出Ｔ＋１時刻的時間序列的值。

那麼面對時間序列的預測問題，我們可以用傳統的ARIMA模型，也可以用基於時間序列分解的STL模型或者Facebook開源的Prophet模型。在機器學習或者人工智慧大熱的現在，深度學習等機器學習方法也可以用於時間序列的預測。今天介紹的就是如何基於Keras和Python，實現時間序列的LSTM模型預測。

二、LSTM模型介紹

長短時記憶網絡（Long Short Term Memory，簡稱LSTM）模型，本質上是一種特定形式的循環神經網絡（Recurrent Neural Network，簡稱RNN)。LSTM模型在RNN模型的基礎上通過增加門限（Gates）來解決RNN短期記憶的問題，使得循環神經網絡能夠真正有效地利用長距離的時序信息。LSTM在RNN的基礎結構上增加了輸入門限（Input Gate）、輸出門限（Output Gate）、遺忘門限（Forget Gate）３個邏輯控制單元，且各自連接到了一個乘法元件上（見圖１），通過設定神經網絡的記憶單元與其他部分連接的邊緣處的權值控制信息流的輸入、輸出以及細胞單元（Memory cell）的狀態。其具體結構如下圖所示。

圖1：LSTM概念圖

上圖中相關部件的描述如下：

Input Gate：控制信息是否流入Memory cell中，記為

Forget Gate：控制上一時刻Memory cell中的信息是否積累到當前時刻Memory cell中，記為

Output Gate：控制當前時刻Memory cell中的信息是否流入當前隱藏狀態

cell：記憶單元，表示神經元狀態的記憶，使得LSTM單元有保存、讀取、重置和更新長距離歷史信息的能力，記為

在t時刻，LSTM神經網絡定義的公式如下：

除了前文提及的

隱藏層cell結構圖如圖2所示。在LSTM神經網絡的訓練過程中，首先將ｔ時刻的數據特徵輸入至輸入層，經過激勵函數輸出結果。將輸出結果、ｔ-1時刻的隱藏層輸出和ｔ-1時刻cell單元存儲的信息輸入LSTM結構的節點中，通過Input Gate，Output Gate，Forget Gate和cell單元的處理，輸出數據到下一隱藏層或輸出層，輸出LSTM結構節點的結果到輸出層神經元，計算反向傳播誤差，更新各個權值。

圖2：LSTM細節圖三、LSTM模型準備3.1 加載需要的包

from math import sqrt
from numpy import concatenate
from matplotlib import pyplot
from pandas import read_csv
from pandas import DataFrame
from pandas import concat
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import mean_squared_error
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
import pandas as pd
import numpy as np
3.2 定義將時間序列預測問題轉化為監督學習問題的函數    前文已經提及，時間序列預測的本質主要是根據前Ｔ個時刻的觀測數據推算出Ｔ＋１時刻的時間序列的值。這就轉化為機器學習中的監督學習問題，輸入值為歷史值，輸出值為預測值。因此，利用LSTM模型進行時間序列預測的第一步便是將數據集整理成監督學習中常見的數據類型，一行為一個樣本，行數為樣本數，列數為變量總數。這裡利用的是pandas庫中dataframe的shift函數。
def series_to_supervised(data, n_in=1, n_out=1, dropnan=True):
    n_vars = 1 if type(data) is list else data.shape[1]
    df = DataFrame(data)
    cols, names = [], []
    #i: n_in, n_in-1, ..., 1，為滯後期數
    #分別代表t-n_in, ... ,t-1期
    for i in range(n_in, 0, -1):
        cols.append(df.shift(i))
        names += [('var%d(t-%d)' % (j+1, i)) for j in range(n_vars)]
    #i: 0, 1, ..., n_out-1，為超前預測的期數
    #分別代表t，t+1， ... ,t+n_out-1期
    for i in range(0, n_out):
        cols.append(df.shift(-i))
        if i == 0:
            names += [('var%d(t)' % (j+1)) for j in range(n_vars)]
        else:
            names += [('var%d(t+%d)' % (j+1, i)) for j in range(n_vars)]
    agg = concat(cols, axis=1)
    agg.columns = names
    if dropnan:
        agg.dropna(inplace=True)
    return agg
3.3 定義準備數據的函數def prepare_data(filepath, n_in, n_out=30, n_vars=4, train_proportion=0.8):
    #讀取數據集
    dataset = read_csv(filepath, encoding='utf-8')
    #設置時間戳索引
    dataset['日期'] = pd.to_datetime(dataset['日期'])
    dataset.set_index("日期", inplace=True)
    values = dataset.values
    #保證所有數據都是float32類型
    values = values.astype('float32')
    #變量歸一化
    scaler = MinMaxScaler(feature_range=(0, 1))
    scaled = scaler.fit_transform(values)
    #將時間序列問題轉化為監督學習問題
    reframed = series_to_supervised(scaled, n_in, n_out)
    #取出保留的變量
    contain_vars = []
    for i in range(1, n_in+1):
        contain_vars += [('var%d(t-%d)' % (j, i)) for j in range(1,n_vars+1)]  
    data = reframed [ contain_vars + ['var1(t)'] + [('var1(t+%d)' % (j)) for j in range(1,n_out)]]
    #修改列名
    col_names = ['Y', 'X1', 'X2', 'X3']
    contain_vars = []
    for i in range(n_vars):
        contain_vars += [('%s(t-%d)' % (col_names[i], j)) for j in range(1,n_in+1)]  
    data.columns = contain_vars +  ['Y(t)'] + [('Y(t+%d)' % (j)) for j in range(1,n_out)]
    #分隔數據集，分為訓練集和測試集
    values = data.values
    n_train = round(data.shape[0]*train_proportion)
    train = values[:n_train, :]
    test = values[n_train:, :]
    #分隔輸入X和輸出y
    train_X, train_y = train[:, :n_in*n_vars], train[:, n_in*n_vars:]
    test_X, test_y = test[:, :n_in*n_vars], test[:, n_in*n_vars:]
    #將輸入X改造為LSTM的輸入格式，即[samples,timesteps,features]
    train_X = train_X.reshape((train_X.shape[0], n_in, n_vars))
    test_X = test_X.reshape((test_X.shape[0], n_in, n_vars))
    return scaler, data, train_X, train_y, test_X, test_y, dataset
3.4 定義擬合LSTM模型的函數def fit_lstm(data_prepare, n_neurons=50, n_batch=72, n_epoch=100, loss='mae', optimizer='adam', repeats=1):
    train_X = data_prepare[2]
    train_y = data_prepare[3]
    test_X = data_prepare[4]
    test_y = data_prepare[5]
    model_list = []
    for i in range(repeats):
        #設計神經網絡
        model = Sequential()
        model.add(LSTM(n_neurons, input_shape=(train_X.shape[1], train_X.shape[2])))
        model.add(Dense(train_y.shape[1]))
        model.compile(loss=loss, optimizer=optimizer)
        #擬合神經網絡
        history = model.fit(train_X, train_y, epochs=n_epoch, batch_size=n_batch, validation_data=(test_X, test_y), verbose=0, shuffle=False)
        #畫出學習過程
        p1 = pyplot.plot(history.history['loss'], color='blue', label='train')
        p2 = pyplot.plot(history.history['val_loss'], color='yellow',label='test')
        #保存model
        model_list.append(model)
    pyplot.legend(["train","test"])
    pyplot.show()
    return model_list
3.5 定義預測的函數def lstm_predict(model, data_prepare):
    scaler = data_prepare[0]
    test_X = data_prepare[4]
    test_y = data_prepare[5]
    #做出預測
    yhat = model.predict(test_X)
    #將測試集上的預測值還原為原來的數據維度
    scale_new = MinMaxScaler()
    scale_new.min_, scale_new.scale_ = scaler.min_[0], scaler.scale_[0]
    inv_yhat = scale_new.inverse_transform(yhat)
    #將測試集上的實際值還原為原來的數據維度
    inv_y = scale_new.inverse_transform(test_y)
    return inv_yhat, inv_y
3.6 定義預測評價的函數（RMSE）# 計算每一步預測的RMSE
def evaluate_forecasts(test, forecasts, n_out):
    rmse_dic = {}
    for i in range(n_out):
        actual = [float(row[i]) for row in test]
        predicted = [float(forecast[i]) for forecast in forecasts]
        rmse = sqrt(mean_squared_error(actual, predicted))
        rmse_dic['t+' + str(i+1) + ' RMSE'] = rmse
    return rmse_dic
3.7 定義將預測可視化的函數#以原始數據為背景畫出預測數據
def plot_forecasts(series, forecasts):
    #用藍色畫出原始數據集
    pyplot.plot(series.values)
    n_seq = len(forecasts[0])
    #用紅色畫出預測值
    for i in range(1,len(forecasts)+1):
        xaxis = [x for x in range(i, i+n_seq+1)]
        yaxis = [float(series.iloc[i-1,0])] + list(forecasts[i-1])
        pyplot.plot(xaxis, yaxis, color='red')
    #展示圖像
    pyplot.show()
四、建立LSTM模型4.1 建立模型（n_in = 15，n_neuron = 5，n_batch = 16，n_epoch = 200）    為了減少隨機性，重複建立五次模型，取五次結果的平均作為最後的預測。
#定義需要的變量
filepath = r'C:\Users\87689\Desktop\國貿實習\Premium\導出文件.csv'
n_in = 15
n_out = 30
n_vars = 4
n_neuron = 5
n_batch = 16
n_epoch = 200
repeats = 5
inv_yhat_list = []
inv_y_list = []

data_prepare = prepare_data(filepath,n_in, n_out)
scaler, data, train_X, train_y, test_X, test_y, dataset = data_prepare
model_list = fit_lstm(data_prepare, n_neuron, n_batch, n_epoch,repeats=repeats)
for i in range(len(model_list)):
    model = model_list[i]
    inv_yhat = lstm_predict(model, data_prepare)[0]
    inv_y = lstm_predict(model, data_prepare)[1]
    inv_yhat_list.append(inv_yhat)
    inv_y_list.append(inv_y)
圖3：模型訓練結果    求出平均預測結果。
inv_yhat_ave = np.zeros(inv_y.shape)
for i in range(repeats):
    inv_yhat_ave += inv_yhat_list[i]
    
inv_yhat_ave = inv_yhat_ave/repeats
4.2 模型評價    求出五次預測結果inv_yhat及最終平均預測結果inv_yhat_ave的每步預測RMSE。
rmse_dic_list = []
for i in range(len(model_list)):
    inv_yhat = inv_yhat_list[i]
    inv_y = inv_y_list[i]
    rmse_dic = evaluate_forecasts(inv_y, inv_yhat, n_out)
    rmse_dic_list.append(rmse_dic)

rmse_dic_list.append(evaluate_forecasts(inv_y, inv_yhat_ave, n_out))

df_dic = {}
for i in range(len(rmse_dic_list) - 1):
    df_dic['第' + str(i+1) + '次'] = pd.Series(rmse_dic_list[i])
    
df_dic['平均'] = pd.Series(rmse_dic_list[i+1])
rmse_df = DataFrame(df_dic)
rmse_df
表1：預測RMSE結果表
第1次第2次第3次第4次第5次平均t+1 RMSE6.0543185.9108276.5747575.5145245.9307695.608112t+2 RMSE6.7994965.9197177.1290665.9304666.3461876.065158t+3 RMSE6.9616426.4106867.2754626.5465406.8572336.618044t+4 RMSE7.7073836.7251697.9629167.1797707.3644817.175948t+5 RMSE8.5438217.3594778.9979177.5911118.0048357.831434t+6 RMSE8.8269448.7900499.1580188.3901608.5011178.547602t+7 RMSE9.3726538.8428089.8472408.8188478.9955969.000587t+8 RMSE9.8691729.20604310.7902989.3891839.6211959.657852t+9 RMSE10.22425610.11305611.2754159.92536210.32055510.177834t+10 RMSE10.73077910.61361911.73824110.54761510.85877010.750603t+11 RMSE11.21775111.15395412.50241211.13573111.69241211.458523t+12 RMSE11.97513512.11744513.38291511.58118812.53766712.201281t+13 RMSE12.43117412.64819914.09045412.09239712.35182212.579149t+14 RMSE13.06056013.14183114.25513012.45249413.27909913.074444t+15 RMSE13.87969213.77503615.34608813.13801913.79322713.845060t+16 RMSE14.67038914.49160516.11888713.42294614.14339414.421311t+17 RMSE15.23715315.50395616.67925813.89641914.10853414.909649t+18 RMSE15.39074215.05465516.01025314.28002815.03754115.060793t+19 RMSE16.03055715.65719116.44121814.51806615.14583815.417519t+20 RMSE15.67140915.54752216.15003614.70449515.15035515.359049t+21 RMSE15.75766015.78719016.89879514.75176515.15252715.546924t+22 RMSE15.20824017.00995916.37656314.85250115.56722715.670801t+23 RMSE15.16289816.25472716.88818315.51384215.52698615.738396t+24 RMSE15.51640816.28285416.76268315.10926815.23226815.642263t+25 RMSE15.33843216.41777816.45023515.21852315.87939215.764465t+26 RMSE15.21558116.71416016.68730215.70489015.65085115.860303t+27 RMSE15.41098116.71145517.26401015.83897715.80137416.052185t+28 RMSE15.96936616.45353216.56486515.87669616.07854216.110161t+29 RMSE16.29147416.44735016.77165615.87012416.27667216.236876t+30 RMSE16.12211116.57874916.64377916.26035216.01370716.189853    下面求最終平均預測結果inv_yhat_ave的每步預測錯誤率的平均，平均來看，預測結果會比真實結果偏高。
s = inv_yhat_ave[0].shape
erro_rate = np.zeros(s)
for i in range(len(inv_y)):
    erro_rate += inv_yhat_ave[i]/inv_y[i]-1

erro_rate_ave = erro_rate/len(inv_y)
err_df = DataFrame(pd.Series(erro_rate_ave))
err_df.columns = ['平均預測錯誤率']
err_df.index = ['超前%d步預測' % (i+1) for i in range(n_out)]
err_df
表2：按步平均預測錯誤率結果表
平均預測錯誤率超前1步預測0.046550超前2步預測0.047578超前3步預測0.050722超前4步預測0.052867超前5步預測0.059091超前6步預測0.063377超前7步預測0.064786超前8步預測0.064920超前9步預測0.065614超前10步預測0.066760超前11步預測0.074791超前12步預測0.077122超前13步預測0.076288超前14步預測0.076228超前15步預測0.085402超前16步預測0.089160超前17步預測0.090592超前18步預測0.096903超前19步預測0.099449超前20步預測0.096841超前21步預測0.099562超前22步預測0.100283超前23步預測0.093786超前24步預測0.091290超前25步預測0.091107超前26步預測0.086526超前27步預測0.086098超前28步預測0.085978超前29步預測0.085980超前30步預測0.0778374.3 預測結果可視化    測試集的前十個樣本
dataset = data_prepare[6]
test_X = data_prepare[4]
n_real = len(dataset)-len(test_X)-len(inv_yhat_ave[0])
#多畫一個
y_real = DataFrame(dataset['Y'][n_real:n_real+10+30])
plot_forecasts(y_real, inv_yhat_ave[0:10])
圖4：預測結果可視化1    整個測試集
n_real = len(dataset)-len(test_X)-len(inv_yhat[0])
#多畫一個
y_real = DataFrame(dataset['Y'][n_real:])
plot_forecasts(y_real, inv_yhat_ave)
圖4：預測結果可視化24.4 結果導出    Yhat
pre_df = DataFrame(inv_yhat_ave)
#時間戳處理，讓它只顯示到日
date_index = dataset.index[n_in-1+len(train_X)-1:n_in-1+len(train_X)+len(test_X)-1]
pydate_array = date_index.to_pydatetime()
date_only_array = np.vectorize(lambda s: s.strftime('%Y-%m-%d'))(pydate_array )
date_only_series = pd.Series(date_only_array)
pre_df = pre_df.set_index(date_only_series)
names_columns = ['未來%d期' % (i+1) for i in range(n_out)]
pre_df.columns = names_columns
pre_df = pre_df.round(decimals=2)#小數點
    Y
actual_df = DataFrame(inv_y)
names_columns = ['未來%d期' % (i+1) for i in range(n_out)]
actual_df.columns = names_columns
actual_df = actual_df.set_index(date_only_series)
actual_df = actual_df.round(decimals=2)
    導出xlsx
writer = pd.ExcelWriter('Y-結果導出.xlsx')
pre_df.to_excel(writer,"Yhat")
actual_df.to_excel(writer,"Y")
writer.save()
溫馨提示：點擊文末閱讀原文可跳轉到小陸的github獲取notebook文件哦！
參考資料：https://machinelearningmastery.com/multivariate-time-series-forecasting-lstms-keras/
https://machinelearningmastery.com/multi-step-time-series-forecasting-long-short-term-memory-networks-python/
https://blog.csdn.net/qq_28031525/article/details/79046718
https://cloud.tencent.com/developer/article/1645547
https://machinelearningmastery.com/update-lstm-networks-training-time-series-forecasting/

時間序列的LSTM模型預測——基於Keras

相關焦點

通過Keras 構建基於 LSTM 模型的故事生成器

使用LSTM深度學習模型進行溫度的時間序列單步和多步預測

利用深度學習進行時間序列預測

時間序列深度學習:狀態 LSTM 模型預測太陽黑子(上)

基於圖卷積神經網絡GCN的時間序列預測

手把手教你用 Keras 實現 LSTM 預測英語單詞發音

Keras官方中文版文檔正式發布了

如何優雅地用TensorFlow預測時間序列:TFTS庫詳細教程

如何使用LSTM在Keras中快速實現情感分析任務

PyTorch:Bi-LSTM的文本生成

基於機動LSTM的周圍車輛多模態軌跡預測

語音識別第一課:基於Tensorflow的端到端語音識別技術

如何使用XGBoost模型進行時間序列預測

評測| CNTK在Keras上表現如何?能實現比TensorFlow更好的深度學習嗎?

SAS時間序列模型預測未來航班數量

R語言ARIMA集成模型預測時間序列分析

AI 教你投資:用深度學習預測虛擬貨幣價格

手把手:教你如何用深度學習模型預測加密貨幣價格

自動化所提出基於腦功能影像時間序列的多尺度卷積循環神經網絡模型

MXNet 宣布支持 Keras 2,可更加方便快捷地實現 CNN 及 RNN 分布式...