目錄
第一部分 經典論文分析
第二部分 ARIMA模型以及stata操作實例
(1)ARMA模型分析原理
(2)ADL模型分析原理
(3)stata實例操作
第三部分 VAR模型以及stata操作實例
時間序列是指以固定時間為間隔的、由所觀察的值組成的序列。根據觀測值的不同頻率,可將時間序列分成小時、天、星期、月份、季度和年等時間形式的序列。有時候,你也可以將秒鐘和分鐘作為時間序列的間隔,如每分鐘的點擊次數和訪客數等等。
為什麼我們要對時間序列進行分析呢?因為當你想對一個序列進行預測時,首先要完成分析這個步驟。除此之外,時間序列的預測也具有極大商業價值,如企業的供求量、網站的訪客量以及股票價格等,都是極其重要的時間序列數據。
早期的單變量時間序列模型有較少的參數卻可以得到非常精確的預測,因此隨著Box and Jenkins(1984)等奠基性的研究,時間序列方法得到迅速發展。從單變量時間序列到多元時間序列模型,從平穩過程到非平穩過程,時間序列分析方法被廣泛應用於經濟、氣象和過程控制等領域。本章將介紹如下時間序列分析方法,ARIMA模型、ARCH族模型、VAR模型、VEC模型、單位根檢驗及協整檢驗等。
第一部分 經典論文分析
在全球人口增長和氣候變化的背景下,監測農作物是維持農業的必要條件保護自然資源。許多研究已經證明了光學和合成孔徑雷達的能力遙感數據估計作物參數,這些數據沒有經過比較或組合預測作物物候期。儘管SAR極化數據對作物物候期高度敏感,但沒有研究使用了高時間解析度的數據。免費提供的SAR時間序列為每周以高空間解析度監測作物物候提供了一個獨特的機會基礎。
第二部分 ARIMA模型以及stata操作實例
(1)ARMA模型分析原理
對於AR(p)模型,其ACF函數拖尾,而PACF函數截尾。如果出現這種情形,則可判斷其為AR(p),不包含移動平均的部分。另一方面,對於MA(q)模型,其ACF函數截尾,而PACF函數拖尾。如果出現這種情形,則可判斷其為MA(q),不包含自回歸的部分。如果以上兩種情形均不符合,即ACF函數與PACF函數都拖尾①,則要考慮一般的ARMA(p,q)模型,其中p,q均不為零時間序列分析的鼻祖,Box, Jenkins andReinsel(1994)認為,對大多數情況,p≤2與q≤2就足夠了。當然,為了保險起見,可以讓Pmax與qm更大些。具體如何確定p,q,可以依據信息準則或由大到小的序貫t規則。在估計完模型之後,仍然需要進行一些診斷性分析( diagnosticchecking),以確定ARMA(p,q)模型的假定是否成立。其中,最重要的假定是,擾動項{ }為白噪聲。如果模型過小(inadequate),即p<p或q<q,則相當於遺漏解釋變量。這些被遺漏的解釋變量被納入擾動項中,導致擾動項出現自相關,不再是白噪聲。為此,可以使用Q檢驗來檢驗模型的殘差是否存在自相關。如果殘差存在自相關,則應考慮使模型更大些(增加自回歸或移動平均的階數),重新對模型進行估計,然後再檢驗新模型的殘差是否為白噪聲,如此反覆,直至確認殘差為白噪聲。
(2)ADL模型分析原理
如果自回歸分布滯後模型滿足以下假定,則萬事大吉,可以用OLS來估計它。E(y1-1yt-2, ,x1,t-1,1,-2,,x1-1,xk,t-2,…)=0。這個假定類似於嚴格外生性假設,它意味著擾動項ε,與所有解釋變量的整個歷史全部無關。這保證了對滯後期數(p,91,…,9K)的設定是正確的。如果滯後期數的設定不正確,比如,真實模型還應該包括:
(i) y-(p+1),但該項p+1y-(p+1)卻被納入擾動項ε,中,則擾動項ε,便與解釋變量相關,導致OLS不一致。
(ii) {y1,x1,…,x}為漸近獨立的平穩序列。
(iii) {y,,x1,…,x}有非零的有限四階矩。
(iv) 解釋變量無完全多重共線性。
對滯後期數的選擇可以使用信息準則(最小化AIC或BIC),或使用t,F檢驗來檢驗最後一期係數的顯著性。更一般地,可以在ARMA模型中引入其他變量,稱為「ARMAX」模型。
(3)stata實例操作
**自相關與偏自相關**計算第1至第corrgram,lags(**將ACF畫成自相關圖,並給出置信區間ac y , lags(**將PACF畫成偏自相關圖,並給出置信區間pac y ,lags(**ARMA模型arima y , ar(1/**選擇項「ar(1/**ARMA的另一等價命令格式為arima y, arima (** **計算殘差,並將其命名為e1predict el,res**檢驗殘差是否存在第1至第corrgram el,lags(**ADL與 ARMAX**ARMAX的 Stata命令為arima y x1 x2 x3,ar(下面以數據集 pe dta為例。該數據集的主要變量 logpe為18712002年美國標準普爾股指(S&P)的市盈率(price earning ratio)對數。由於 logpe為非平穩序列,故對其差分建立ARMA模型。首先,定義其一階差分為「d_logpe」:
use pe.dta,cleartwoway (line logpe year)twoway (line logpe year) (qfitci logpe year)**繪製logpe一階差分折線圖twoway (line logpe year) (line d_logpe year)
**計算第1至第10階ACF與PACFcorrgram d_logpe,lags(10)第四階的Q統計量較為顯著,P為0.0556,進一步可以觀察自相關和偏相關圖
**將ACF畫成自相關圖,並給出置信區間ac d_logpe ,lags(10)**將PACF畫成偏自相關圖,並給出置信區間pac d_logpe,lags(10)從上面兩個圖可以看出,第4階自相關與偏相關係數均在5%水平顯著的部位0,因而可以認為4階以上的自相關與偏相關係數為0,由於自相關與偏相關係數均截尾,分別考慮AR(4)和MA(4)。
**估計AR(4)arima d_logpe,ar (1/4) nolog**計算信息準則estat ic**檢驗殘差是否存在自相關predict e1 ,rescorrgram e1 ,lags(10)**估計MA(4)arima d_logpe,ma (1/4) nolog**計算信息準則estat ic**檢驗殘差是否存在自相關predict e2 ,rescorrgram e2,lags(10)第三部分 VAR模型以及stata操作實例
use varexample.dta,cleartsline inflation fedfunds unrate,xline(169)summarize inflation fedfunds unrate **根據信息準則確定VAR模型的階數varsoc inflation fedfunds unrate ,maxlag(13)var inflation fedfunds unrate ,lags(1/5)**檢驗各階係數的聯合顯著性varwle**檢驗殘差是否自相關varlmar**檢驗VAR系統是否穩定varstable,graph**VAR模型預測fcast compute f_,step(40)fcast graph f_inflation f_fedfunds f_unrate ,observed 1pattern("_")**變量之間的格蘭傑因果關係vargranger**進一步考察交叉相關圖xcorr inflation unrate if date <= tq (2002q1),name(iu)xcorr inflation fedfunds if date <= tq (2002q1),name(if)xcorr unrate fedfunds if date <= tq (2002q1),name(uf)graph combine iu if uf**交叉相關係數列表xcorr inflation unrate if date <= tq (2002q1),table**脈衝響應函數irf creat iuf ,set (macrovar) step (20)**繪製正交脈衝響應圖irf graph oirf ,yline(0)**變量的預測誤差方差irf table fevd ,r(inflation) noci**變量的預測誤差方差分解圖irf graph fevd ,r(inflation)**所有預測方差分解圖irf graph fevd**根據方差分解結果圖推薦的變量順序,建立新的脈衝響應結果irf create ifu ,order (inflation fedfunds unrate) step(20)**比較以上兩種變量順序,inflation對fedfunds的脈衝響應irf graph oirf,i(fedfunds) r(inflation) yline(0) noci**比較兩種變量排序,unrate對fedfunds的脈衝響應比重irf graph fevd,i(fedfunds) r(inflation)noci經典論文題目:
Evaluation of Sentinel-1 & 2 timeseries for predicting wheat and rapeseed phenological stages
經典論文連結:
https://www.sciencedirect.com/science/article/pii/S0924271620300794