基於預測模型的COMEX黃金期價實證分析

2020-12-05 和訊黃金

  遇到突發事件時運用ARMA與多元回歸模型能夠更好地把握價格走勢

  本文包含兩個計量模型——ARMA預測模型和多元回歸模型。建立ARMA預測模型的目的在於確定模型的係數之後,根據相對較少的數據集對COMEX

黃金期貨

價格走勢進行預測,但ARMA預測模型的缺點也同樣明顯,那就是未考慮其他相關變量的影響。在市場經濟活動中,黃

金價

格的變化往往受多種因素的影響,一個因變量和一個或幾個自變量有存在依存關係的情況,而且有時幾個影響因素主次難以區分,通常採用多元回歸模型進行分析。


  模型一:ARMA


  ARMA模型是一類常用的隨機時間序列模型,是研究時間序列的重要方法之一,其基本思想是:某些時間序列是依賴於時間t的隨機變量,構成該時間序列的單個序列值雖然具有不確定性,但整個序列的變化卻有一定的規律性,可以用相應的數學公式近似描述。ARMA模型表達式為:Yt=β0+β1Yt-1+β2Yt-2+……+βpXt-p+εt+a1εt-1+a2εt-2+……+aqεt-q。


  變量選擇

  數據選取上,以COMEX

黃金

期貨月度收盤價為研究標的,並選擇2012年1月至2018年10月一共82個數據。


  平穩性判斷


  首先對樣本序列預處理,判斷該序列是否為平穩非純隨機序列。若為非平穩序列,需要對該序列處理使其符合ARMA模型建模的條件,即處理後的序列是平穩序列。


  從上圖可以看出,該序列呈下降趨勢,直觀顯著非平穩,需要進一步平穩性檢測。

  序列的相關分析結果顯示,自相關係數波動較大,COMEX黃金

期貨

價格緩慢遞減趨於零,並隨著時間的推移,在0附近波動並呈發散趨勢,初步判定該時間序列非平穩。


  為驗證這組數據是非平穩的初步判斷,需對其進行單位根檢驗,也稱ADF檢驗。ADF檢驗是為了檢驗序列中是否存在單位根,因為如果存在單位根,過程就不平穩,序列也就是非平穩時間序列,會使回歸分析中存在偽回歸。


  ADF檢驗顯示,t統計量為-2.118141,大於10%置信水平下的t值,可以確定COMEX黃金期貨價格的時間序列是非平穩序列,需要差分。


  數據平穩化


  對數據一階差分後再次進行ADF檢驗,結果如下:


  ADF檢驗的t統計量為-8.908062,比1%的置信水平下的t值小,且P值小於0.05。可以確定,經過一階差分的COMEX黃金期貨價格的時間序列是平穩序列。


  模型構建


  ARMA模型的識別與定階可以通過樣本的自相關與偏自相關函數的觀察獲得。例如:AR(p)模型自相關函數拖尾,偏自相關函數p步截尾;MA(q)模型自相關函數q步截尾,偏自相關函數拖尾;而ARMA模型的自相關函數與偏自相關函數均具有拖尾性。


  下圖所示AC與PAC都基本控制在兩個標準差範圍之內,可認為該序列在零軸附近波動,具有短期相關性,樣本的自相關和偏自相關都呈現一定的拖尾特徵。


  綜合上圖可大致考慮ARMA(3,1)模型和ARMA(2,1)模型(見下圖)。通過比較R2,最終選定ARMA(2,1)模型並導出。


  輸出模型為:yt=0.987870yt-1+ut+0.982829ut-1。


  適應性檢驗


  參數估計後,應對擬合模型的適應性進行檢驗,實質是對模型殘差序列進行白噪聲檢驗。若殘差序列不是白噪聲,說明還有一些重要信息沒被提取,應重新設定模型。同樣的,用ADF檢驗來對殘差進行單位根檢驗,結果如下:


  t統計量小於1%、5%和10%三個顯著性水平的臨界值,可判斷該模型的殘差序列不存在單位根,模型檢驗通過。


  總結


  通過對比ARMA模型預測結果與實際價格,我們發現兩者差值較小,模型較為有效,模型的輸出結果對實際預測COMEX黃金期貨價格走勢有較強指導意義。


  模型二:多元回歸


  多元回歸分析法是指通過對兩個或兩個以上的自變量與一個因變量的相關分析,建立模型進行的方法。當自變量與因變量之間存在線性關係時,稱為多元線性回歸分析。多元線性回歸方程應該為:Y=β0+β1X1+β2X2+β3X3+……+βnXn+ε。


  變量選擇

  影響黃金價格變動的因素較多,根據經驗和因素分析選取美聯儲銀行總負債、

美國

核心CPI(環比)、美國5年期國債實際收益率、美國1至3年企業債利差和美元指數收盤價作為自變量,COMEX黃金期貨價格作為因變量,原因如下:


  一是與眾多中央銀行一樣,美聯儲也需要保持資本的儲備,用以支撐美國的債務。這些儲備或資產以外幣或黃金等形式存在,記錄在美聯儲資產負債表上,並且每周在美聯儲的網站上公布。黃金儲備可用於外藉以獲取盈利,或被用於解決國際事務。然而美聯儲儲備這些黃金的初衷,與利用黃金分散風險的長線投資者的目的大同小異。黃金作為一種資產,可以增加人們對貨幣供應的信心或在必要時調控貨幣政策。

  二是核心CPI即核心消費價格指數,是指將受氣候和季節因素影響較大的產品價格剔除之後的居民消費物價指數。我國對核心CPI尚未明確界定,而美國是將食品和能源價格剔除後的居民消費物價指數作為核心CPI。一般認為,核心CPI能更真實地反映宏觀經濟運

行情

況。如果美國核心CPI數據較市場預期更加強勁,美元有望展開強勁反彈;反之,黃金或迎來新助攻。

  三是美債是美國聯邦政府財政支出主要手段之一。目前美債水平已經接近20.07萬億美元的規模。擁有固定利率的美債,因為強大的美國GDP保障,以及良好的信用評級,一直是國際資金追捧的對象。2018年10年期美債收益率不斷逼近3%,引發了國際社會的擔憂,加上美國對外實施貿易戰和美聯儲漸進式

加息

,美元指數不斷上漲,導致了美債的拋售潮和黃金的下跌。


  四是信用利差為信用債收益率中高於無風險利率的收益,用來補償信用債的違約風險。決定信用利差的因素主要有兩個,即違約風險以及流動性。其中違約風險主要來自於發行人的信用風險,受宏觀經濟形勢和貨幣市場環境影響。大環境好,企業運行順利,信用風險小,信用利差小;大環境不好,企業運轉不暢,信用風險較大,信用利差大。


  五是美元指數是綜合反映美元在國際外匯市場的匯率情況的指標,用來衡量美元對一籃子貨幣的匯率變化程度。它通過計算美元和對選定的一籃子貨幣的綜合的變化率,來衡量美元的強弱程度,從而間接反映美國的出口競爭能力和進口成本的變動情況。美元指數上漲,說明美元與其他貨幣的比價上漲也就是說美元升值,那麼國際上主要的商品都是以美元計價,所對應的商品價格應該下跌,黃金也具有商品屬性,亦遵循此規律。


  建模


  開始選擇的是逐步法,逐步法是「向前」和「向後」的結合體,最先進入「線性回歸模型」的是「美聯儲銀行總負債」建立了模型1,緊隨其後的是「美國5年期國債實際收益率」建立了模型2,再其次是「美國1至3年企業債利差」建立了模型3,最後進入的是「美國核心CPI(環比)」。


  模型中用此方法有個概率值,當小於等於0.05時,進入「線性回歸模型」,最先進入模型的,相關性最強,關係最為密切。當大於等0.1時,從「線性模型中」剔除。


  可以看出,根據所給出的自變量,一共建立有四個模型(1、2、3、4),從模型R2和調整R2的擬合度考慮,明顯模型4要更好一些(0.843>0.832>0.823>0.806)。


  「模型4」中的回歸平方和為2194693.361,殘差平方和為386443.035。總平方和=回歸平方和+殘差平方和,其中殘差平方和指隨即誤差或不可解釋的誤差,由於回歸平方和佔總平方和的85%,所以,此線性回歸模型只解釋了總平方和的大部分,需要進一步分析。


  根據後面的「F統計量」的概率值為0.00,由於0.00<0.01,隨著「自變量」的引入,其顯著性概率值均遠小於0.01,所以可以顯著地拒絕總體回歸係數為0的原假設,通過ANOVA方差分析可以看出COMEX黃金期貨價格與美聯儲銀行總負債、美國5年期國債實際收益率、美國1至3年企業債利差以及美國核心CPI(環比)之間存在著線性關係,至於線性關係的強弱,需要進一步進行分析。從係數a中可得:多元線性回歸方程為Y=2270.3-0.00022378098967720453×X1-71.434×X2-96.853×X3+132.679×X4,Y=COMEX黃金期貨價格;X1=美聯儲銀行總負債;X2=美國5年期國債實際收益率;X3=美國1至3年企業債利差;X4=美國核心CPI環比。


  「共線性統計量」VIF(Variance Inflation Factors)檢驗法是通過檢查指定的解釋變量能夠被回歸方程中其他全部解釋變量所解釋的程度來檢測多重共線性。方程中每個解釋變量有一個VIF,該VIF是關於多重共線性使相應的係數估計值的方差增大了多少的一個估計值。高VIF表明多重共線性增大了。「共線性統計量」顯示:美聯儲銀行總負債、美國5年期國債實際收益率、美國1至3年企業債利差、美國核心CPI(環比)的VIF分別為3.622、3.383、1.573和1.013,且均小於5,所以每個自變量之間沒有出現共線性。


  共線性診斷


  共線性診斷採用的是「特徵值」的方式,特徵值主要用來刻畫自變量的方差。診斷自變量間是否存在較強多重共線性的方法是利用主成分分析法,基本思想是:如果自變量間確實存在較強的相關關係,那麼它們之間必然存在信息重疊,於是就可以從這些自變量中提取出既能反應自變量信息(方差),而且有相互獨立的因素(成分)來,從自變量間的相關係數矩陣出發,計算相關係數矩陣的特徵值,得到相應的若干成分。


  「共線性診斷」顯示:從自變量相關係數矩陣出發,計算得到了5個特徵值(模型4中),最大特徵值為3.682,最小特徵值為0.003。條件索引=最大特徵值/相對特徵值,再進行開方,(即特徵值3的條件索引為3.682/0.350,再開方=3.243),每一個特徵值都能夠刻畫某自變量的一定比例,所有的特徵值能將刻畫某自變量信息的全部,結論如下:


  X1在方差標準化後,第一個特徵值解釋了其方差的0.00, 第二個特徵值解釋了0.00,第三個特徵值解釋了0.00,第四個特徵值解釋了0.03,第五個特徵值解釋了0.97;X2在方差標準化後,第一個特徵值解釋了其方差的0.00, 第二個特徵值解釋了0.27,第三個特徵值解釋了0.00,第四個特徵值解釋了0.25,第五個特徵值解釋了0.48;X3在方差標準化後,第一個特徵值解釋了其方差的0.00, 第二個特徵值解釋了0.00,第三個特徵值解釋了0.01,第四個特徵值解釋了0.79,第五個特徵值解釋了0.20;X4在方差標準化後,第一個特徵值解釋了其方差的0.02, 第二個特徵值解釋了0.00,第三個特徵值解釋了0.97,第四個特徵值解釋了0.01,第五個特徵值解釋了0.00。


  可以看出,沒有一個特徵值能同時解釋所有自變量,自變量之間存在較弱的共線性關係。


  上圖顯示,自變量的殘差總體符合正太分布,但呈現尖峰厚尾的特徵。


  總結


  綜合T、R2、VIF、特徵值以及殘差等檢驗,模型相對有效。COMEX黃金期貨價格走勢與美聯儲銀行總負債、美國核心CPI(環比)、美國5年期國債實際收益率以及美國1至3年企業債利差呈現顯著的相關性。


  模型一、二對比


  為驗證上述兩組模型的擬合度,需對兩組模型回測比對。結果顯示,以中美貿易摩擦期間的COMEX黃金期貨價格為樣本,ARMA模型對於COMEX黃金期貨價格的預測效果較多元回歸模型擬合度更優。


  COMEX黃金期貨價格走勢與美聯儲銀行總負債、美國核心CPI(環比)、美國5年期國債實際收益率以及美國1至3年企業債利差呈現顯著的相關性。


  在多元回歸模型中,美元指數被剔除,但並非表示美元指數對COMEX黃金期貨價格走勢沒有影響,相反,美元指數與COMEX黃金期貨價格相關性為-0.9,意味著美元指數與COMEX黃金期貨價格有非常高的負相關性,只是在其他變量中已經涵蓋了美元指數的影響因素,因此被剔除。


  中美貿易摩擦期間,樣本內ARMA模型對於COMEX黃金期貨價格的預測效果較多元回歸模型擬合度更優。


  回測中美貿易摩擦這一突發事件的數據發現,模型並沒有偏離實際價格走勢,反而擬合度更高。中美貿易摩擦屬於突發事件,常識和經驗上在模型中應該表現為發散或者更大的無規律波動,但是回測結果卻是顯示為更加擬合實際價格,模型的預測效果更優,這不得不引起我們的極大興趣,對此進一步拓展研究。


  拓展研究


  基於結論可以發現,在遇到金融危機、局部軍事衝突或地緣政治等突發事件時,模型的擬合度優於常態。


  由此,選取2003年美伊戰爭以及2008年金融危機前後的COMEX黃金期貨價格作為樣本,運用同樣的方法進行建模分析,結果輸出如下:


  2003年3月20日,美國以伊拉克藏有大規模殺傷性武器並暗中支持恐怖分子為由,繞開聯合國安理會,單方面對伊拉克實施軍事打擊。戰爭爆發大約三個星期之後,美軍順利進入巴格達市區。戰爭爆發38天後,「沙漠軍刀計劃」實行。這段時間內,無論是ARMA模型還是多元回歸模型,擬合度均優於其他時間段。

  2008年3月,美元兌歐元刷新歷史新低。9月,雷曼兄弟申請破產保護,

巴克萊銀行

以2.5億美元低價收購了雷曼兄弟北美市場的投資銀行及資本市場業務。美國

保險

巨頭AIG陷入困境,美林證券被美國銀行以503億美元的價格收購。這段時間內,無論是ARMA模型還是多元回歸模型,擬合度均優於其他時間段。


  通過以上拓展研究,並且綜合上文中結論的回測,證實了我們的分析:在遇到金融危機、局部軍事衝突或地緣政治等突發事件時,運用ARMA模型和多元回歸模型能夠有效地幫助我們更好地分析和預測COMEX黃金期貨價格走勢。

(責任編輯:方鳳嬌 HF055)

相關焦點

  • 財務風險預警模型構建實證分析
    【摘要】財務風險預警模型可以從定量角度客觀準確判斷企業的財務危機程度,網絡的普及對此頗具影響。本文採用實證方法,選取了5個財務指標作為模型變量,構建了一個基於極值原理的Fisher線性判別模型,並對該模型進行了實證檢驗。結果表明,該模型具有較好的對企業財務狀況和風險狀況進行評價預警的能力。
  • 基於因子分析的套利定價模型及實證研究
    本文利用因子分析的方法對11個因素進行篩選,確定四個能夠很好地反映所有因素包含的信息但又互不相關的公共因子變量,並建立套利定價模型,實證檢驗說明,通過該方法進行因素篩選建立的套利定價模型具有較好的定價效果。
  • 基於傅立葉變換的黃金價格周期性實證研究
    同時,我們也發現長期來看,黃金和白銀的走勢基本相同,其本身存在明顯的周期,均為約長達10年的上漲期(期間經歷一個大波峰),長達20年的下降期。周期理論分析的局限性周期理論是諸多學者基於歷史經濟數據統計分析,再結合人類社會經濟發展的一般規律總結而出的一套分析理論。
  • 農地碳排放影響因素空間差異性研究——基於STIRPAT和GWR模型的實證分析
    基於碳排放核算研究、碳排放的情景分析、因素分解等研究也逐漸展開,其中自然條件普遍被看作外生因素,而社會經濟因素對農地碳排放的驅動效應成了各研究重點考察的對象。然而,值得注意的是,不同地區的影響因素對農地碳排放存在不同的作用效果,其空間差異性需要考慮。此外,人口、富裕度、技術水平等社會經濟因素對農地碳排放的影響情況如何?其中又存在什麼樣的空間差異特徵?
  • 這個模型告訴你哪些才是預測黃金價格的關鍵因素
    該機構已經能夠建立一個包含四個關鍵解釋變量的的基本模型。基於這些基礎變量的方向,金價的預測可以是正面的、負面的,也可以是中性的。要注意的是,該模型將黃金描述為貨幣資產,而非大宗商品。WisdomTree的黃金模型展現了以下幾個因素對以美元計算的黃金價格的影響(括號內為影響方向):* 美元籃子的變化(-)* CPI通脹率(+)* 10年期美國國債名義收益率的變化(-)* 投資情緒(以期貨市場投機倉位衡量)(+)下圖顯示的是使用1996年4月至2017年4月數據校準該模型時的價格預測。
  • 基於VAR模型的人民幣匯率的超調分析
    摘 要:通過建立VAR模型,運用脈衝響應函數和預測方差分解的方法對人民幣匯率的超調效應進行實證分析。結果表明,1990年以來,我國實際匯率與經濟增長GDP之間存在一種單向的因果關係,並且方差分解結果表明來自上期價格的衝擊對實際匯率的變化貢獻率較大。最後,對匯率超調模型在我國的適用性進行了分析。
  • 金融科技與商業銀行效率——基於DEA-Malmquist模型的實證研究
    編者按:《金融科技與商業銀行效率——基於DEA-Malmquist模型的實證研究》使用DEA-Malmquist模型測算我國145家商業銀行2013—2018年的全要素生產率,構建金融科技發展指數,通過靜態面板和動態面板廣義矩估計(GMM)研究金融科技對我國銀行業效率的影響。
  • 基於票房預測模型分析影響我國電影經濟成功的因素
    通過對已知的國產高票房影響的數據統計和分析,如:發行公司、導演等可以在模型各個項目中,獲得經濟成功的影片的決策傾向,從而對票房預測或市場評估領域產生意義。一、Barry.Lit man 票房預測模型本文在西方票房預測模型發展的基礎上,建立了我國電影經濟成功的影響因素模型。
  • 基於深度神經網絡的脫硫系統預測模型及應用
    蘇向鵬等採用了基於徑向基函數(Radical Basis Function,RBF)的改進模型,改善了 BP 網絡易陷入局部最小值的缺陷;李軍紅等利用的廣義回歸神經網絡(Generalized Regression Neural Network,GRNN)是基於 RBF 網絡改進的神經網絡模型,針對樣本較少的情況,預測效果有所改善。
  • 風險模型方法研究——基於A股市場的應用
    來源:中證指數在數據存儲與分析技術快速發展的今天,數量化方法對投資領域的滲透超越歷史任何時期。大量的創新性方法被提出並得到應用,以數據和模型為核心的現代投資方法體系已見雛形。在組合風險預測領域,線性風險模型方法不斷在理論框架內升級完善,成為組合管理者所採用的風險預測主流方法。
  • ...基於SEIR模型的北京市新冠肺炎疫情建模與復工影響預測」課題
    「工程經濟學」在線課程開始之後,通過向同學們介紹疫情發生後的疾病預測建模、政府出臺不同防控政策效應分析等熱點研究問題,我鼓勵選課同學建立在線研究小組來進行學習與研討。同學們的學習能力和熱情都很高,短短半個月的時間內閱讀了傳染病模型論文,收集公開數據,建立模型並結合實證分析,得出了一些初步的結果。
  • 基於GWO-BP-CNN-ec的風電功率短期預測模型*
    通過仿真分析得出,基於GWO-BP-CNN-ec的組合模型預測效果優於單一CNN,GWO-CNN及GWO-BP-CNN,然後對比了基於BP、Elman、小波神經網絡的淺層網絡預測模型與基於CNN的深層網絡組合預測模型的預測效果,驗證出了深層CNN網絡在預測方面的精度優勢,在高風速段時尤為明顯。證明深層卷積神經網絡組合模型對風電短期功率預測精度的提升有顯著作用。
  • 衍生品量化擇時跟蹤之螺紋:模型堅定看多 淨值再創新高
    ★主要內容我們在今年10月份發布的《衍生品量化擇時系列專題之二:螺紋鋼指標篩選與大類因子合成研究》報告中,我們分別基於IVX的預測回歸方法進行螺紋單因子篩選與基於3PRF降維模型進行因子動態賦權合成兩套方法論體系採用基本面與宏觀數據信息對螺紋期價進行預測建模。
  • 中國大陸基于震源物理模型的長期地震預測及其展望
    報告題目:中國大陸基于震源物理模型的長期地震預測及其展望報 告 人:邵志剛 研究員報告時間:2020年12月4日(周五)上午9:00-11:30報告地點:地質宮519報告摘要:以中國大陸活動地塊理論為指導,長期地點預測重點關注活動地塊邊界帶,綜合強震破裂空段、斷層運動閉鎖段
  • 規範會計研究與實證會計研究比較分析
    理論實證過程包括(1)三個基本要素——有關會計問題的基本假設、一套邏輯嚴密的系統化的推理機制和方法以及最終的理論結論;(2)提出理論假設、建立分析模型以及進行邏輯推理和證明三個緊密聯繫的步驟。經驗實證是指對理論實證得出的結論進行經驗檢驗的過程。
  • 【平安宏觀專題】宏觀研究框架系列(一):通貨膨脹的分析及預測模型
    平安觀點  本文梳理了通貨膨脹分析與預測的框架。關於CPI的分析框架主要包括三個維度:一是基於豬周期、進口價格和M1三個影響因素建立協整模型;二是基於CPI環比周期性的「環比均值法」;三是依靠產出缺口對CPI的趨勢進行預測。我們將根據前兩個維度得出CPI的預測值,尋找合適的權重進行加權,然後根據第三個維度對CPI預測值進行調整。
  • 上海交大團隊提出基於信號通路的肝癌風險預測模型
    該研究基於發現的13個與肝癌生存顯著相關的信號通路並構建了肝癌風險預測模型,在異質性(heterogeneity)較高的肝癌的多個數據集中取得了較高的預測精度,並且與新近發表的基於深度學習框架的預測模型進行了多方面的比較,表明了基於信號通路水平特徵的模型在預測腫瘤風險方面的優勢。博士生法博濤為論文第一作者,俞章盛教授為通訊作者。
  • 時間序列的LSTM模型預測——基於Keras
    時間序列的預測指的是基於序列的歷史數據,以及可能對結果產生影響的其他相關序列,對序列未來的可能取值做出預測。現實生活中的時間序列數據預測問題有很多,包括語音分析、噪聲消除以及股票期貨市場的分析等,其本質主要是根據前T個時刻的觀測數據推算出T+1時刻的時間序列的值。
  • 基於R的生存資料預測模型構建與Nomogram繪製
    我們首先使用Cox回歸基於構建預測模型並篩選獨立預後因素(用於建模的數據集一般稱為訓練集或者內部數據集)。需要說明的是本例的數據錄入、單因素Cox回歸分析,多因素Cox回歸分析等操作可參考筆者主編的《聰明統計學》[1] 與《瘋狂統計學》[2]。最終我們可得到三個與預後相關的獨立因素:Age, PgR, Pathologic_stage。
  • ESG投資實證研究:組合有效前沿與資產定價歸因之一
    5) 作者還使用四種ESG替代變量(碳排放、非罪惡股票指標、應計利潤和整體ESG評分)測試了本篇論文的理論,從實證角度分析了各指標對收益率的影響。本篇論文首先根據實證數據和統計分析估計其中一些ESG指標替代變量的ESG有效前沿,而且實證前沿的形狀取決於ESG是否可以預測回報。假設ESG中的G可以預測回報,E不能預測回報,那麼同時考慮兩者的前沿是很有趣的。在G可以預測回報的情況下,用其替代變量進行ESG投資既有好處,也有代價。