前面介紹了一次移動平均和二次移動平均,其實,不管是一次還是二次,都是可以算是加權移動平均的特殊情況。
加權移動平均(WeightedMoving Average),取前N期的加權平均值作為預測值,而且前N期的權重不一定相等。
加權移動平均的計算公式如下:
其中為權重係數,其總和應該為1。
由公式可知,一次移動平均其實是加權移動平均的特殊情況。
加權移動平均有兩個重要的問題考慮:
1) 如何選擇合適的期數N。這個選擇原則與一次移動平均相同,在此不再贅述。
2) 如何確定各期最合適的權重係數。一般情況下,遵循時間越近權重越大的原則。
和一次移動平均一樣,也只能夠預測下一期的序列值,適用於變化不大的序列,實現修勻(或平滑)原有序列,以便找到序列的長期趨勢。
在加權移動平均中,期數N的選擇和權重係數的選擇都很重要。
在實際應用中,可以採用規劃求解來找到最優的權重係數,以使得MAPE或SSE最小。
如下,某公司收集了每年的煤炭產量,現要預測一下2008年的煤炭產量。
操作步驟如下:
1) 假定間隔為N=3,以及各期權重a,b,c的初始值,且權重和為1(即在G2輸入「=Sum(D2:F2)」)。
2) 計算加權移動平均。在C7單元格輸入公式」=$D$2*B4+$E$2*B5+$F$2*B6」,注意平滑係數要採用絕對引用,然後公式向下拉。
3) 計算誤差平方。在D7單元格輸入公式「=(C7-B7)^2」,公式向下拉。
4) 計算APE和MAPE。在E7單元格輸入「=ABS(C7-B7)/B7」,公式向下拉;在G9單元格輸入「=AVERAGE(E7:E51)」,得到MAPE。
圖8加權移動平均計算
5) 下面採用規劃求解得到權重係數的最優值(見以下規劃求解圖)。
圖9規劃求解求最佳權重係數
得到在N=3時的規劃求解得到最優權重係數:
仔細觀察權重系統,發現係數a=0,說明前第3期的數據對於預測幾乎沒有價值,因此考慮優化,改取N=2即可。
6) 取N=2,重新如上計算,規劃求解,得到最優的加權移動平均結果。
7) 評估預測值的準確度MAPE為3.99%,滿足要求。
8) 進行預測。公式向下拉到C52單元格,得到2008年的煤炭產量的預測值。
圖10加權移動平均計算(優化後)
▽ 戳此看往期文章
時間序列:
01 時間序列分析方法索引
02 時間序列的因素分析法
03 時間序列之一次移動平均
04 時間序列之二次移動平均
大數據的哲學觀 事物發展都是有規律的
如何讓數據「說話」 數據解讀能力培養
大數據的核心價值是什麼?探索事物規律和特徵
一切不以應用為導向的大數據都是在耍流氓
大數據建模五步法 選擇-訓練-評估-優化-應用
教你如何優化出好模型!好模型是優化出來的
大數據職位體系 系統類+應用類
大數據職位發展通道 大數據職位的發展通道
大數據變革之工具變革 探索客觀事物的工具
大數據變革之思維變革 認知事物的新思維
大數據變革之文化變革 尊重事實的數據文化
●文章作者簡介
傅一航,大數據專家。專注於大數據分析、大數據挖掘等應用技術,及大數據系統解決方案。致力於將大數據技術應用於政府、通信、金融、航空、電商、網際網路等領域。聯繫作者: 2509626286@qq.com。