遇到突發事件時運用ARMA與多元回歸模型能夠更好地把握價格走勢
本文包含兩個計量模型——ARMA預測模型和多元回歸模型。建立ARMA預測模型的目的在於確定模型的係數之後,根據相對較少的數據集對COMEX
黃金期貨價格走勢進行預測,但ARMA預測模型的缺點也同樣明顯,那就是未考慮其他相關變量的影響。在市場經濟活動中,黃
金價格的變化往往受多種因素的影響,一個因變量和一個或幾個自變量有存在依存關係的情況,而且有時幾個影響因素主次難以區分,通常採用多元回歸模型進行分析。
模型一:ARMA
ARMA模型是一類常用的隨機時間序列模型,是研究時間序列的重要方法之一,其基本思想是:某些時間序列是依賴於時間t的隨機變量,構成該時間序列的單個序列值雖然具有不確定性,但整個序列的變化卻有一定的規律性,可以用相應的數學公式近似描述。ARMA模型表達式為:Yt=β0+β1Yt-1+β2Yt-2+……+βpXt-p+εt+a1εt-1+a2εt-2+……+aqεt-q。
變量選擇
數據選取上,以COMEX
黃金期貨月度收盤價為研究標的,並選擇2012年1月至2018年10月一共82個數據。
平穩性判斷
首先對樣本序列預處理,判斷該序列是否為平穩非純隨機序列。若為非平穩序列,需要對該序列處理使其符合ARMA模型建模的條件,即處理後的序列是平穩序列。
從上圖可以看出,該序列呈下降趨勢,直觀顯著非平穩,需要進一步平穩性檢測。
序列的相關分析結果顯示,自相關係數波動較大,COMEX黃金
期貨價格緩慢遞減趨於零,並隨著時間的推移,在0附近波動並呈發散趨勢,初步判定該時間序列非平穩。
為驗證這組數據是非平穩的初步判斷,需對其進行單位根檢驗,也稱ADF檢驗。ADF檢驗是為了檢驗序列中是否存在單位根,因為如果存在單位根,過程就不平穩,序列也就是非平穩時間序列,會使回歸分析中存在偽回歸。
ADF檢驗顯示,t統計量為-2.118141,大於10%置信水平下的t值,可以確定COMEX黃金期貨價格的時間序列是非平穩序列,需要差分。
數據平穩化
對數據一階差分後再次進行ADF檢驗,結果如下:
ADF檢驗的t統計量為-8.908062,比1%的置信水平下的t值小,且P值小於0.05。可以確定,經過一階差分的COMEX黃金期貨價格的時間序列是平穩序列。
模型構建
ARMA模型的識別與定階可以通過樣本的自相關與偏自相關函數的觀察獲得。例如:AR(p)模型自相關函數拖尾,偏自相關函數p步截尾;MA(q)模型自相關函數q步截尾,偏自相關函數拖尾;而ARMA模型的自相關函數與偏自相關函數均具有拖尾性。
下圖所示AC與PAC都基本控制在兩個標準差範圍之內,可認為該序列在零軸附近波動,具有短期相關性,樣本的自相關和偏自相關都呈現一定的拖尾特徵。
綜合上圖可大致考慮ARMA(3,1)模型和ARMA(2,1)模型(見下圖)。通過比較R2,最終選定ARMA(2,1)模型並導出。
輸出模型為:yt=0.987870yt-1+ut+0.982829ut-1。
適應性檢驗
參數估計後,應對擬合模型的適應性進行檢驗,實質是對模型殘差序列進行白噪聲檢驗。若殘差序列不是白噪聲,說明還有一些重要信息沒被提取,應重新設定模型。同樣的,用ADF檢驗來對殘差進行單位根檢驗,結果如下:
t統計量小於1%、5%和10%三個顯著性水平的臨界值,可判斷該模型的殘差序列不存在單位根,模型檢驗通過。
總結
通過對比ARMA模型預測結果與實際價格,我們發現兩者差值較小,模型較為有效,模型的輸出結果對實際預測COMEX黃金期貨價格走勢有較強指導意義。
模型二:多元回歸
多元回歸分析法是指通過對兩個或兩個以上的自變量與一個因變量的相關分析,建立模型進行的方法。當自變量與因變量之間存在線性關係時,稱為多元線性回歸分析。多元線性回歸方程應該為:Y=β0+β1X1+β2X2+β3X3+……+βnXn+ε。
變量選擇
影響黃金價格變動的因素較多,根據經驗和因素分析選取美聯儲銀行總負債、
美國核心CPI(環比)、美國5年期國債實際收益率、美國1至3年企業債利差和美元指數收盤價作為自變量,COMEX黃金期貨價格作為因變量,原因如下:
一是與眾多中央銀行一樣,美聯儲也需要保持資本的儲備,用以支撐美國的債務。這些儲備或資產以外幣或黃金等形式存在,記錄在美聯儲資產負債表上,並且每周在美聯儲的網站上公布。黃金儲備可用於外藉以獲取盈利,或被用於解決國際事務。然而美聯儲儲備這些黃金的初衷,與利用黃金分散風險的長線投資者的目的大同小異。黃金作為一種資產,可以增加人們對貨幣供應的信心或在必要時調控貨幣政策。
二是核心CPI即核心消費價格指數,是指將受氣候和季節因素影響較大的產品價格剔除之後的居民消費物價指數。我國對核心CPI尚未明確界定,而美國是將食品和能源價格剔除後的居民消費物價指數作為核心CPI。一般認為,核心CPI能更真實地反映宏觀經濟運
行情況。如果美國核心CPI數據較市場預期更加強勁,美元有望展開強勁反彈;反之,黃金或迎來新助攻。
三是美債是美國聯邦政府財政支出主要手段之一。目前美債水平已經接近20.07萬億美元的規模。擁有固定利率的美債,因為強大的美國GDP保障,以及良好的信用評級,一直是國際資金追捧的對象。2018年10年期美債收益率不斷逼近3%,引發了國際社會的擔憂,加上美國對外實施貿易戰和美聯儲漸進式
加息,美元指數不斷上漲,導致了美債的拋售潮和黃金的下跌。
四是信用利差為信用債收益率中高於無風險利率的收益,用來補償信用債的違約風險。決定信用利差的因素主要有兩個,即違約風險以及流動性。其中違約風險主要來自於發行人的信用風險,受宏觀經濟形勢和貨幣市場環境影響。大環境好,企業運行順利,信用風險小,信用利差小;大環境不好,企業運轉不暢,信用風險較大,信用利差大。
五是美元指數是綜合反映美元在國際外匯市場的匯率情況的指標,用來衡量美元對一籃子貨幣的匯率變化程度。它通過計算美元和對選定的一籃子貨幣的綜合的變化率,來衡量美元的強弱程度,從而間接反映美國的出口競爭能力和進口成本的變動情況。美元指數上漲,說明美元與其他貨幣的比價上漲也就是說美元升值,那麼國際上主要的商品都是以美元計價,所對應的商品價格應該下跌,黃金也具有商品屬性,亦遵循此規律。
建模
開始選擇的是逐步法,逐步法是「向前」和「向後」的結合體,最先進入「線性回歸模型」的是「美聯儲銀行總負債」建立了模型1,緊隨其後的是「美國5年期國債實際收益率」建立了模型2,再其次是「美國1至3年企業債利差」建立了模型3,最後進入的是「美國核心CPI(環比)」。
模型中用此方法有個概率值,當小於等於0.05時,進入「線性回歸模型」,最先進入模型的,相關性最強,關係最為密切。當大於等0.1時,從「線性模型中」剔除。
可以看出,根據所給出的自變量,一共建立有四個模型(1、2、3、4),從模型R2和調整R2的擬合度考慮,明顯模型4要更好一些(0.843>0.832>0.823>0.806)。
「模型4」中的回歸平方和為2194693.361,殘差平方和為386443.035。總平方和=回歸平方和+殘差平方和,其中殘差平方和指隨即誤差或不可解釋的誤差,由於回歸平方和佔總平方和的85%,所以,此線性回歸模型只解釋了總平方和的大部分,需要進一步分析。
根據後面的「F統計量」的概率值為0.00,由於0.00<0.01,隨著「自變量」的引入,其顯著性概率值均遠小於0.01,所以可以顯著地拒絕總體回歸係數為0的原假設,通過ANOVA方差分析可以看出COMEX黃金期貨價格與美聯儲銀行總負債、美國5年期國債實際收益率、美國1至3年企業債利差以及美國核心CPI(環比)之間存在著線性關係,至於線性關係的強弱,需要進一步進行分析。從係數a中可得:多元線性回歸方程為Y=2270.3-0.00022378098967720453×X1-71.434×X2-96.853×X3+132.679×X4,Y=COMEX黃金期貨價格;X1=美聯儲銀行總負債;X2=美國5年期國債實際收益率;X3=美國1至3年企業債利差;X4=美國核心CPI環比。
「共線性統計量」VIF(Variance Inflation Factors)檢驗法是通過檢查指定的解釋變量能夠被回歸方程中其他全部解釋變量所解釋的程度來檢測多重共線性。方程中每個解釋變量有一個VIF,該VIF是關於多重共線性使相應的係數估計值的方差增大了多少的一個估計值。高VIF表明多重共線性增大了。「共線性統計量」顯示:美聯儲銀行總負債、美國5年期國債實際收益率、美國1至3年企業債利差、美國核心CPI(環比)的VIF分別為3.622、3.383、1.573和1.013,且均小於5,所以每個自變量之間沒有出現共線性。
共線性診斷
共線性診斷採用的是「特徵值」的方式,特徵值主要用來刻畫自變量的方差。診斷自變量間是否存在較強多重共線性的方法是利用主成分分析法,基本思想是:如果自變量間確實存在較強的相關關係,那麼它們之間必然存在信息重疊,於是就可以從這些自變量中提取出既能反應自變量信息(方差),而且有相互獨立的因素(成分)來,從自變量間的相關係數矩陣出發,計算相關係數矩陣的特徵值,得到相應的若干成分。
「共線性診斷」顯示:從自變量相關係數矩陣出發,計算得到了5個特徵值(模型4中),最大特徵值為3.682,最小特徵值為0.003。條件索引=最大特徵值/相對特徵值,再進行開方,(即特徵值3的條件索引為3.682/0.350,再開方=3.243),每一個特徵值都能夠刻畫某自變量的一定比例,所有的特徵值能將刻畫某自變量信息的全部,結論如下:
X1在方差標準化後,第一個特徵值解釋了其方差的0.00, 第二個特徵值解釋了0.00,第三個特徵值解釋了0.00,第四個特徵值解釋了0.03,第五個特徵值解釋了0.97;X2在方差標準化後,第一個特徵值解釋了其方差的0.00, 第二個特徵值解釋了0.27,第三個特徵值解釋了0.00,第四個特徵值解釋了0.25,第五個特徵值解釋了0.48;X3在方差標準化後,第一個特徵值解釋了其方差的0.00, 第二個特徵值解釋了0.00,第三個特徵值解釋了0.01,第四個特徵值解釋了0.79,第五個特徵值解釋了0.20;X4在方差標準化後,第一個特徵值解釋了其方差的0.02, 第二個特徵值解釋了0.00,第三個特徵值解釋了0.97,第四個特徵值解釋了0.01,第五個特徵值解釋了0.00。
可以看出,沒有一個特徵值能同時解釋所有自變量,自變量之間存在較弱的共線性關係。
上圖顯示,自變量的殘差總體符合正太分布,但呈現尖峰厚尾的特徵。
總結
綜合T、R2、VIF、特徵值以及殘差等檢驗,模型相對有效。COMEX黃金期貨價格走勢與美聯儲銀行總負債、美國核心CPI(環比)、美國5年期國債實際收益率以及美國1至3年企業債利差呈現顯著的相關性。
模型一、二對比
為驗證上述兩組模型的擬合度,需對兩組模型回測比對。結果顯示,以中美貿易摩擦期間的COMEX黃金期貨價格為樣本,ARMA模型對於COMEX黃金期貨價格的預測效果較多元回歸模型擬合度更優。
COMEX黃金期貨價格走勢與美聯儲銀行總負債、美國核心CPI(環比)、美國5年期國債實際收益率以及美國1至3年企業債利差呈現顯著的相關性。
在多元回歸模型中,美元指數被剔除,但並非表示美元指數對COMEX黃金期貨價格走勢沒有影響,相反,美元指數與COMEX黃金期貨價格相關性為-0.9,意味著美元指數與COMEX黃金期貨價格有非常高的負相關性,只是在其他變量中已經涵蓋了美元指數的影響因素,因此被剔除。
中美貿易摩擦期間,樣本內ARMA模型對於COMEX黃金期貨價格的預測效果較多元回歸模型擬合度更優。
回測中美貿易摩擦這一突發事件的數據發現,模型並沒有偏離實際價格走勢,反而擬合度更高。中美貿易摩擦屬於突發事件,常識和經驗上在模型中應該表現為發散或者更大的無規律波動,但是回測結果卻是顯示為更加擬合實際價格,模型的預測效果更優,這不得不引起我們的極大興趣,對此進一步拓展研究。
拓展研究
基於結論可以發現,在遇到金融危機、局部軍事衝突或地緣政治等突發事件時,模型的擬合度優於常態。
由此,選取2003年美伊戰爭以及2008年金融危機前後的COMEX黃金期貨價格作為樣本,運用同樣的方法進行建模分析,結果輸出如下:
2003年3月20日,美國以伊拉克藏有大規模殺傷性武器並暗中支持恐怖分子為由,繞開聯合國安理會,單方面對伊拉克實施軍事打擊。戰爭爆發大約三個星期之後,美軍順利進入巴格達市區。戰爭爆發38天後,「沙漠軍刀計劃」實行。這段時間內,無論是ARMA模型還是多元回歸模型,擬合度均優於其他時間段。
2008年3月,美元兌歐元刷新歷史新低。9月,雷曼兄弟申請破產保護,
巴克萊銀行以2.5億美元低價收購了雷曼兄弟北美市場的投資銀行及資本市場業務。美國
保險巨頭AIG陷入困境,美林證券被美國銀行以503億美元的價格收購。這段時間內,無論是ARMA模型還是多元回歸模型,擬合度均優於其他時間段。
通過以上拓展研究,並且綜合上文中結論的回測,證實了我們的分析:在遇到金融危機、局部軍事衝突或地緣政治等突發事件時,運用ARMA模型和多元回歸模型能夠有效地幫助我們更好地分析和預測COMEX黃金期貨價格走勢。
(責任編輯:方鳳嬌 HF055)