adf檢驗模型 - CSDN

2021-01-18 CSDN技術社區

ADF檢驗

在使用很多時間序列模型的時候,如 ARMA、ARIMA,都會要求時間序列是平穩的,所以一般在研究一段時間序列的時候,第一步都需要進行平穩性檢驗,除了用肉眼檢測的方法,另外比較常用的嚴格的統計檢驗方法就是ADF檢驗,也叫做單位根檢驗

ADF檢驗全稱是 Augmented Dickey-Fuller test,顧名思義,ADF是 Dickey-Fuller檢驗的增廣形式。DF檢驗只能應用於一階情況,當序列存在高階的滯後相關時,可以使用ADF檢驗,所以說ADF是對DF檢驗的擴展。

單位根(unit root)

在做ADF檢驗,也就是單位根檢驗時,需要先明白一個概念,也就是要檢驗的對象——單位根。

當一個自回歸過程中: ,如果滯後項係數b為1,就稱為單位根。當單位根存在時,自變量和因變量之間的關係具有欺騙性,因為殘差序列的任何誤差都不會隨著樣本量(即時期數)增大而衰減,也就是說模型中的殘差的影響是永久的。這種回歸又稱作偽回歸。如果單位根存在,這個過程就是一個隨機漫步(random walk)。

ADF檢驗的原理

ADF檢驗就是判斷序列是否存在單位根:如果序列平穩,就不存在單位根;否則,就會存在單位根。

所以,ADF檢驗的 H0 假設就是存在單位根,如果得到的顯著性檢驗統計量小於三個置信度(10%,5%,1%),則對應有(90%,95,99%)的把握來拒絕原假設。

ADF檢驗的python實現

ADF檢驗可以通過python中的 statsmodels 模塊,這個模塊提供了很多統計模型。

使用方法如下:

導入adfuller函數

from statsmodels.tsa.stattools import adfuller

adfuller函數的參數意義分別是:

x:一維的數據序列。 maxlag:最大滯後數目。 regression:回歸中的包含項(c:只有常數項,默認;ct:常數項和趨勢項;ctt:常數項,線性二次項;nc:沒有常數項和趨勢項) autolag:自動選擇滯後數目(AIC:赤池信息準則,默認;BIC:貝葉斯信息準則;t-stat:基於maxlag,從maxlag開始並刪除一個滯後直到最後一個滯後長度基於 t-statistic 顯著性小於5%為止;None:使用maxlag指定的滯後) store:True  False,默認。 regresults:True 完整的回歸結果將返回。False,默認。

返回值意義為:

adf:Test statistic,T檢驗,假設檢驗值。 pvalue:假設檢驗結果。 usedlag:使用的滯後階數。 nobs:用於ADF回歸和計算臨界值用到的觀測值數目。 icbest:如果autolag不是None的話,返回最大的信息準則值。 resstore:將結果合併為一個dummy。

def adfuller(x, maxlag=None, regression="c", autolag='AIC', store=False, regresults=False): """ Augmented Dickey-Fuller unit root test The Augmented Dickey-Fuller test can be used to test for a unit root in a univariate process in the presence of serial correlation. Parameters x : array_like, 1d data series maxlag : int Maximum lag which is included in test, default 12*(nobs/100)^{1/4} regression : {'c','ct','ctt','nc'} Constant and trend order to include in regression * 'c' : constant only (default) * 'ct' : constant and trend * 'ctt' : constant, and linear and quadratic trend * 'nc' : no constant, no trend autolag : {'AIC', 'BIC', 't-stat', None} * if None, then maxlag lags are used * if 'AIC' (default) or 'BIC', then the number of lags is chosen to minimize the corresponding information criterion * 't-stat' based choice of maxlag. Starts with maxlag and drops a lag until the t-statistic on the last lag length is significant using a 5%-sized test store : bool If True, then a result instance is returned additionally to the adf statistic. Default is False regresults : bool, optional If True, the full regression results are returned. Default is False Returns -- adf : float Test statistic pvalue : float MacKinnon's approximate p-value based on MacKinnon (1994, 2010) usedlag : int Number of lags used nobs : int Number of observations used for the ADF regression and calculation of the critical values critical values : dict Critical values for the test statistic at the 1 %, 5 %, and 10 % levels. Based on MacKinnon (2010) icbest : float The maximized information criterion if autolag is not None. resstore : ResultStore, optional A dummy class with results attached as attributes """

 現在我們用一個RB1309的收盤數據來進行ADF檢驗,看一下結果:

result = adfuller(rb_price)print(result)(-0.45153867687808574, 0.9011315454402649, 1, 198, {'5%': -2.876250632135043, '1%': -3.4638151713286316, '10%': -2.574611347821651}, 1172.4579344852016)

看到 t-statistic 的值 -0.451 要大於10%,所以無法拒絕原假設,另外,p-value的值也很大。

將數據進行一階差分滯後,看一下結果如何:

rb_price = np.diff(rb_price)result = adfuller(rb_price)print(result)(-15.436034211511204, 2.90628134201655e-28, 0, 198, {'5%': -2.876250632135043, '1%': -3.4638151713286316, '10%': -2.574611347821651}, 1165.1556545612445)

 看到 t-statistic 的值 -15 要小於5%,所以拒絕原假設,另外,p-value的值也很小。

 

相關焦點

  • arma python 檢驗專題及常見問題 - CSDN
    假如某個觀察值序列通過序列預處理可以判定為平穩非白噪聲序列,就可以利用ARMA模型對該序列進行建模。建模的基本步驟如下:(1)求出該觀察值序列的樣本自相關係數(ACF)和樣本偏自相關係數(PACF)的值。(2)根據樣本自相關係數和偏自相關係數的性質,選擇適當的ARMA(p,q)模型進行擬合。(3)估計模型中位置參數的值。
  • python平穩性檢驗專題及常見問題 - CSDN
    (3)估計模型中位置參數的值。(4)檢驗模型的有效性。如果模型不通過檢驗,轉向步驟(2),重新選擇模型再擬合。(5)模型優化。如果擬合模型通過檢驗,仍然轉向不走(2),充分考慮各種情況,建立多個擬合模型,從所有通過檢驗的擬合模型中選擇最優模型。(6)利用擬合模型,預測序列的將來走勢。
  • 參數檢驗 - CSDN
    、檢驗步驟4、檢驗的p值在一個假設檢驗問題中, 拒絕原假設H0的最小顯著性水平稱為檢驗的(1)比率p的精確檢驗(2)比率p的近似檢驗 二、非參數的假設檢驗參數假設檢驗是在假設總體分布已知的情況下進行的 單總體位置參數的檢驗(1)中位數的符號檢驗
  • eviews 線性回歸模型 - CSDN
    多元線性回歸模型,並識別和修正多重共線性。普通最小二乘法、簡單相關係數檢驗法、綜合判斷法、逐步回歸法。最小二乘估計的原理、t檢驗、F檢驗、擬合優度R方值。但很明顯,在5%的顯著性水平下,模型中的各參數均不通過檢驗,在10%的顯著性水平下,也只有X2的係數通過檢驗。故認為解析變量之間存在多重共線性。
  • 線性回歸假設檢驗 - CSDN
    實際上使用左面的函數定義損失函數也能得到一個線性模型,只是並不是我們常說的線性回歸模型而已。所以:損失函數是機器學習模型的核心。(即使相同的模型形式,不同的損失函數對應著不同模型的效果)。如果把模型看成是人工智慧,那麼損失函數就是它的三觀。
  • eviews線性回歸模型專題及常見問題 - CSDN
    多元線性回歸模型,並識別和修正多重共線性。普通最小二乘法、簡單相關係數檢驗法、綜合判斷法、逐步回歸法。最小二乘估計的原理、t檢驗、F檢驗、擬合優度R方值。但很明顯,在5%的顯著性水平下,模型中的各參數均不通過檢驗,在10%的顯著性水平下,也只有X2的係數通過檢驗。故認為解析變量之間存在多重共線性。
  • r語言一元回歸模型專題及常見問題 - CSDN
    那麼要評價這條回歸線擬合的好壞,我們就需要對回歸模型進行顯著性檢驗。4. 回歸方程的顯著性檢驗從回歸參數的公式二可知,在計算過程中並不一定要知道Y和X是否有線性相關的關係。如果不存相關關係,那麼回歸方程就沒有任何意義了,如果Y和X是有相關關係的,即Y會隨著X的變化而線性變化,這個時候一元線性回歸方程才有意義。所以,我們需要用假設檢驗的方法,來驗證相關性的有效性。
  • 的方法 線性回歸方程檢驗專題及常見問題 - CSDN
    因此,對相關程度進行檢驗也是重要的,相關程度的檢驗方法主要有三種:相關係數的檢驗回歸方程的檢驗回歸係數的檢驗相關係數的檢驗變差關係先來一張圖:如上圖所示:當給定X0時,Y的實際值與均值的差值就是Y值隨X值的全部變化,稱之為總變差。
  • 卡方相關性檢驗 - CSDN
    卡方 自由度 P 值Pearson 11.788 4 0.019似然比 11.816 4 0.019Pearson 卡方和似然比卡方Minitab 執行 Pearson 卡方檢驗和似然比卡方檢驗。
  • 多元線性回歸的模型解釋、假設檢驗、特徵選擇
    我們將看到多個輸入變量如何共同影響輸出變量,同時還將了解計算與簡單LR模型的不同之處。我們還將使用Python構建一個回歸模型。最後,我們將深入學習線性回歸,學習共線性、假設檢驗、特徵選擇等內容。現在有人可能會想,我們也可以用簡單的線性回歸來分別研究我們對所有自變量的輸出。
  • 回歸方程的擬合優度檢驗 - CSDN
    分類數據的擬合優度檢驗卡方檢驗主要是測試樣本分類數據的分布是否符合預期分布。相信大家如果學過高中生物,都知道孟德爾——遺傳學之父,當時他根據顏色和形狀把豌豆分為四類:黃圓、綠圓、黃皺和綠皺.孟德爾根據遺傳學原理判斷這四類的比例應為9:3:3:1.為做驗證,孟德爾分別統計了這四類豌豆的個數,正是利用檢驗證明了這令人激動的結論在處理分類數據時,這些類別值本身對統計檢驗沒有多大用處,比如像「男性」、「女性」和「其他」這樣的類別數據沒有任何數學意義。
  • 音樂類短視頻APP媒介形象模型的建立和檢驗
    本研究將在文獻回顧和訪談的基礎上,根據音樂類短視頻APP的特性,以Biel提出品牌形象模型為基礎,輔以範秀成、陳潔品牌形象模型測量維度,從平臺形象、產品或服務形象、使用者形象以及人性化四個維度構建音樂類短視頻APP的媒介形象測評模型,並採用探索性因子分析等方法進行信度和效度檢驗,以形成有較好信度和效度的測評量表。
  • 百度開發者搜索上線 來源站點涵蓋博客園、知乎、csdn
    首頁 > 見聞 > 關鍵詞 > 百度最新資訊 > 正文 百度開發者搜索上線 來源站點涵蓋博客園、知乎、csdn
  • spss 非線性回歸 - CSDN
    各位SPSS學堂粉絲大家好,上次我們簡要給大家梳理了一篇有關非線性關係的文章,現在我們就關於此模型的數據如何用SPSS操作和結果分析進行詳細介紹,前面的描述性統計與相關分析等我們之前的文章中都有提到,這裡我們就不再示範,我們直接給大家示範假設檢驗部分的數據分析。
  • python 預測股票專題及常見問題 - CSDN
    本節從VAR模型的平穩性檢驗出發,依次完成VAR模型的定階及建模預測,最終通過分析驗證集上的準確率來評估預測效果。1、平穩性檢驗只有平穩的時間序列才能夠直接建立VAR模型,因此在建立VAR模型之前,首先要對變量進行平穩性檢驗。
  • 元分析:固定效應模型和隨機效應模型
    下面是對元分析固定效應模型和隨機效應模型的介紹。如果想要了解更多元分析知識,請關注微信公眾號「元分析」。兩種常用見的元分析統計模型:固定效應模型和隨機效應模型在固定效應模型下,我們假定在納入分析的所有研究存在一個真實的效應量,並且觀察效應量的所有差異均歸因於取樣誤差。雖然我們遵循將其稱為固定效應模型的做法,但更具描述性的術語將是共同效應模型(common-effect model)。
  • 「CSDN 2020年度博客之星」總榜單在此揭曉
    博客地址:https://aobing.blog.csdn.net/?博客地址:https://yunyaniu.blog.csdn.net/?在 csdn 有過不少 10w+ 閱讀量的文章,同時也有一個 10w+ 粉絲的技術公眾號「帥地玩編程」博客之星TOP11:DrugAI
  • spss線性回歸 回歸方程 - CSDN
    在問卷調研中,數據的採集都是有「預謀」的,也就是說從在設計問卷時,就需要考慮要做哪種分析,哪些問題會作為自變量放進模型裡。「預謀」的根據首先是已有模型,模型就是分析問題的方法,很多國外的調研公司之所以牛,模型的積累和應用是重要原因。年輕人,有機會還是要進大公司,多見識些模型。
  • 梁森:電子物證檢驗能手
    ■ 宋卓遠 周智慶 張琪琪 文/圖 投身禁毒一線,他開發禁毒數據分析系統,一年協助破案近百宗;紮根經偵戰場,他又主導建立電子物證檢驗工作機制,填補全省乃至全國公安經偵部門該領域執法規範空白。他就是市公安局經濟犯罪偵查局合成作戰中心副科級警官梁森。 大學畢業後,梁森懷著滿腔熱血加入深圳警隊。
  • 假設檢驗、Z檢驗與T檢驗
    有什麼證據支持這些說法,我們如何檢驗這些假設呢?作為一個統計愛好者,所有這些問題都挖掘了我對假設檢驗基本原理的舊知識。本文將討論假設檢驗的概念以及Z檢驗與t檢驗的區別。然後,我們將使用COVID-19案例研究總結我們的假設檢驗學習。