回歸係數顯著性t檢驗 - CSDN

2021-01-12 CSDN技術社區

目 錄

1. σ2 的估計

2. 回歸方程的顯著性檢驗

  t 檢驗(回歸係數的檢驗)

  F 檢驗(回歸方程的檢驗)

  相關係數的顯著性檢驗

  樣本決定係數

  三種檢驗的關係

一、σ2 的估計

  因為假設檢驗以及構造與回歸模型有關的區間估計都需要σ2的估計量,所以先對σ2作估計。

  通過殘差平方和(誤差平方和)

               (1)

 

(用到和,其中)

 

  又∵                                (2)

∴                                                        (3)

其中 為響應變量觀測值的校正平方和。殘差平方和有n-2 個自由度,因為兩個自由度與得到的估計值與相關。

                                         (4)

(公式(4)在《線性回歸分析導論》附錄C.3有證明)

∴  σ2的無偏估計量:

                                         (5)

為殘差均方, 的平方根稱為回歸標準誤差,與響應變量y 具有相同的單位。

因為σ2取決於殘差平方和, 所以任何對模型誤差假設的違背或對模型形式的誤設都可能嚴重破壞σ2的估計值的實用性。因為由回歸模型殘差算得,稱σ2的估計值是模型依賴的。

 

二、回歸方程的顯著性檢驗

  目的:檢驗 是否真正描述了變量 y 與 x 之間的統計規律性

  假設:正態性假設 (方便檢驗計算)

t 檢驗

  用t 檢驗來檢驗回歸係數的顯著性。採用的假設如下:

原假設     H0 : β1 = 0   (x 與 y 不存在線性關係)

對立假設  H1 : β1 ≠ 0

  回歸係數的顯著性檢驗就是要檢驗自變量 x 對因變量 y 的影響程度是否顯著。下面我們分析接受和拒絕原假設的意義。

  (1)接受 H0 : β1 = 0  (x 與 y 不存在線性關係)

  此時有兩種情況,一種是無論 x 取值如何, y 都在一條水平線上下波動,即,如下圖1,另一種情況為, x 與 y 之間存在關係,但不是線性關係,如圖2。

 

圖  1

 

圖 2

  (2)拒絕 H0 : β1 = 0  (x 對解釋 y 的方差是有用的

  拒絕原假設也有兩種情況,一種是直線模型就是合適的,如圖 3,另一種情況為存在 x 對 y 的線性影響,也可通過 x 的高階多項式得到更好的結果,如圖 4。

 

圖 3

 

圖 4

  接下來對其檢驗。

∵                               (6)

  ∴ 當H0 : β1 = 0 成立時,有:

                         (7)

   在零附近波動,構造 t 統計量:

                                (8)

  若原假設H0 : β1 = 0 成立,則 ,計算|t|,

|t| ≥ tα/2  , 拒絕 H0

|t| < tα/2  , 接受 H0

  2.F 檢驗(方差分析)

  F檢驗用於檢驗回歸方程的顯著性。

  方差分析法檢驗回歸顯著性,方差分析以分割響應變量 y 的總變異性為基礎。

∵   

∴   

∵  , 

∴  

∴                  (9)

  其中 稱為觀測值的校正平方和或總稱為平方和(SST: sum of squares for total, , Lyy),其度量了觀測值中總的變異性。刻畫 y 的波動程度

  稱為模型平方和(或回歸平方和),記為SSR(R: regression),,。其刻畫由 x 的波動引起的 y 波動的部分

   是殘差平方和(誤差平方和),記為SSE(E: error), , 。其刻畫了未加控制的因素引起 y 波動的部分

∴                    (10)

  下來分析它們的自由度。因為 約束 使丟掉了一個自由度,所以個自由度;因為完全由一個參數確定,所以個自由度;因為估計β0與β1時對離差施加了兩個約束,所以有n-2個自由度。

∵ 自由度有可加性

∴                    (11)

  因為總平方和反映因變量 y 的波動程度或稱不確定性,在建立了 y 對 x 的線性回歸後,總平方和SST就分解成回歸平方和SSR與殘差平方和SSE這兩部分,其中SSR是由回歸方程確定的,也就是由自變量 x 的波動引起的,SSE是不能用自變量解釋的波動,是由 x 之外的未加控制的因素引起的。這樣,總平方和SST 中,能夠由自變量解釋的部分為SSR,不能由自變量解釋的部分為SSE,從而,回歸平方和SSR越大,回歸的效果就越好,可以據此構造F 檢驗統計量為

                       (12)

  在正態假設下,原假設H0 : β1 = 0 成立時,,當時,拒絕原假設。

  3.相關係數的顯著性檢驗

  因為一元線性回歸方程討論的是變量 x 與變量 y 之間的線性關係,所以變量 x 與 y 之間的相關係數來檢驗回歸方程的顯著性。用相關係數來反應 x 與 y 的線性關係的密切程度。

  x 與 y 的簡單相關係數(Pearson 相關係數):

               (13)

r的絕對值小於等於1:|r| ≤ 1

  根據相關係數的檢驗表,通常當|r| 大於表中α=0.05相應的值時,認為 x 與 y 有顯著的線性關係。

  缺點:接近於1的程度與數據組數 n 有關(n 較小時,相關係數的波動較大,|r| 接近於1,n 較大時,|r|易偏小,n 較小時,不能僅憑 r 判定 x 與 y 之間有密切的線性關係)

  另外補充一點,Pearson相關係數的適用範圍:

  ① 兩個變量之間是線性關係,都是連續數據;

  ② 兩個變量的總體是正態分布,或接近正態分布;

  ③ 兩個變量的觀測值是成對的,每對觀測值之間相互獨立。

  4.樣本決定係數

  由公式(10)可知,越大,線性回歸越好,所以定義樣本決定係數r2: 回歸平方和與總離差平方和之比。

                        (14)

∵   

(用到和)

∴                    (15)

  其中最右邊的 r2 表示相關係數的平方。

  決定係數 r2 是一個回歸直線與樣本觀測值擬合優度(Goodness of Fit, 指回歸直線對觀測值的擬合程度)的相對指標,反映了因變量的波動中能用自變量解釋的比例。

  0 ≤  r2  ≤ 1,r2  越接近於 1 ,擬合優度越好。

  那麼r2 的值比較小的時候反應了什麼情況呢?

  r2 小的可能原因:

  ① 線性回歸不成立,y 與 x 是曲線關係,應用曲線回歸;

  ② y 與 x 之間符合線性模型,誤差項方差σ2大,導致r2 小(n 很大時,線性回歸顯著)

  在對自變量有重複觀測時可以通過檢驗正確區分以上兩種不同情況,或者用殘差分析的方法。

相關係數和樣本決定係數:

相關係數是建立在相關分析的理論基礎上,研究兩個變量 x 與 y 之間的線性相關關係;樣本決定係數是建立在回歸分析的理論基礎之上,研究非隨機變量 x 對 y 的解釋程度。樣本決定係數除掉了相關係數為0或1(|r|=1 or 0)的情況.

  5.三種檢驗的關係

  對於一元線性回歸來說,回歸係數顯著性的 t 檢驗,回歸方程顯著性的 F 檢驗,相關係數顯著性的 t 檢驗,這三種檢驗是等價的。相關係數顯著性的 t 檢驗與回歸係數顯著性的 t 檢驗是完全相等的,式(12)F統計量則是這兩個 t 統計量的平方。對於一元線性回歸只需要做一種檢驗即可,而對於多元線性回歸,這三種檢驗考慮的問題不同,是三種不同的檢驗,並不等價。

相關焦點

  • 回歸方程的顯著性檢驗 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係  假設:正態性假設 (方便檢驗計算)t 檢驗  用t 檢驗來檢驗回歸係數的顯著性。
  • 檢驗回歸係數的顯著性excel_excel相關係數顯著性檢驗 - CSDN
    首先我們用數據分析—相關係數分析計算一下自變量和因變量之間的相關係數為0.95157,為強相關。R即相關係數R的值,和我們之前做相關分析得到的值一樣,大於0.8表示強正相關。 4、  第二張表,方差分析表,df是自由度,SS是平方和,MS是均方,F是F統計量,Significance F是回歸方程總體的顯著性檢驗,其中我們主要關注F檢驗的結果,即Significance F值,F檢驗主要是檢驗因變量與自變量之間的線性關係是否顯著,用線性模型來描述他們之間的關係是否恰當
  • 回歸係數顯著性t檢驗_多元線性回歸方程及回歸係數的顯著性檢驗...
    【回歸方程無法解釋的】6、自由度【p回歸係數的個數】RSS殘差平方和的自由度 dfr  = n -p -1SSR回歸平方和的自由度 dfm= p 總平方和的自由都           dft = n -1dft = dfr + drm========================================
  • 一元線性回歸顯著性檢驗專題及常見問題 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係(方便檢驗計算)t 檢驗  用t 檢驗來檢驗回歸係數的顯著性。採用的假設如下:原假設     H0 : β1 = 0   (x 與 y 不存在線性關係)對立假設  H1 : β1 ≠ 0  回歸係數的顯著性檢驗就是要檢驗自變量 x 對因變量 y 的影響程度是否顯著。下面我們分析接受和拒絕原假設的意義。
  • t檢驗回歸方程專題及常見問題 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係  假設:正態性假設 (方便檢驗計算)t 檢驗  用t 檢驗來檢驗回歸係數的顯著性。
  • 線性回歸方程的顯著性驗證,總體驗證的F檢驗與個體驗證的t檢驗
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第8章,顯著性驗證,總體驗證的F檢驗與個體驗證的t檢驗。2、回歸方程的總體顯著性驗證(F檢驗)。3、回歸係數的個體顯著性驗證(t檢驗)。一、什麼是顯著性驗證?如果回歸模型用於需求預測是有效的(顯著的),那麼,回歸模型不僅僅是對我們建模時所用到的數據有效,對其他數據也應該用樣有效。
  • 多元線性回歸t檢驗專題及常見問題 - CSDN
    多元線性回歸模型通常用來研究一個應變量依賴多個自變量的變化關係,如果二者的以來關係可以用線性形式來刻畫,則可以建立多元線性模型來進行分析。1.t檢驗t檢驗是對單個變量係數的顯著性檢驗,一般看p值; 如果p值小於0.05表示該自變量對因變量解釋性很強。
  • 一元回歸t檢驗與f檢驗_多元回歸模型的r檢驗f檢驗與t檢驗 - CSDN
    就如同這兩個概念的符號表示一樣,在數學上可以證明,相關係數R的平方就是判定係數。變量的顯著性檢驗變量的顯著性檢驗的目的:剔除回歸係數中不顯著的解釋變量(也就是X),使得模型更簡潔。在一元線性模型中,我們只有有一個自變量X,就是要判斷X對Y是否有顯著性的影響;多元線性回歸中,驗證每個Xi自身是否真的對Y有顯著的影響,不顯著的就應該從模型去掉。變量的顯著性檢驗的思想:用的是純數理統計中的假設檢驗的思想。
  • 在回歸分析中t檢驗_回歸分析的t檢驗如何做 - CSDN
    (3)t分布(3)F分布三大分布的用途:卡方分布:常用於擬合優度檢驗t分布:       多用於比例的估計和檢驗,用於方差分析,協方差分布和回歸分析t分布:       在信息不足的情況下,只能用t分布,比如在整體方差不知道的情況下,對總體均值的估計和檢驗常用
  • 回歸分析t檢驗公式_線性回歸t檢驗公式 - CSDN
    【回歸方程無法解釋的】6、自由度【p回歸係數的個數】RSS殘差平方和的自由度 dfr  = n -p -1SSR回歸平方和的自由度 dfm= p 總平方和的自由都           dft = n -1dft = dfr + drm========================================
  • 回歸係數和回歸方程的顯著性_多元線性回歸方程及回歸係數的顯著性...
    基於閥門流阻性能實驗測得相關數據,利用Minitab軟體對其進行回歸分析,得到閥門阻力係數與流速的擬合曲線和回歸方程,然後進行多項式顯著性檢驗和擬合優度檢驗,確定出最優回歸模型
  • 回歸係數不顯著說明什麼_回歸係數的顯著性檢驗 - CSDN
    通過分析汝箕溝煤礦煤質得到了84組煤質分析數據,包括Ad,Mad,Vdaf,Qgr,d,並統一了各變量的基準;...通過F-檢驗和相關係數檢驗,說明回歸方程是顯著的,有實用價值;通過誤差分析
  • f值 mse p值 ssr 線性回歸 - CSDN
    估計標準誤差     F檢驗統計量      回歸係數抽樣分布的標準誤差   各回歸係數的t檢驗統計量     各回歸係數的置信區間    對數似然值(log likelihood)              AIC準則
  • t檢驗的目的_單樣本t檢驗的目的 - CSDN
    4,T檢驗和F檢驗的關係t檢驗過程,是對兩樣本均數(mean)差別的顯著性進行檢驗。T檢驗和F檢驗的關係另一種解釋:t檢驗有單樣本t檢驗,配對t檢驗和兩樣本t檢驗。發生第一類錯誤的概率被稱作顯著性水平,一般用α表示,在進行假設檢驗時,是通過事先給定顯著性水平α的值而來控制第一類錯誤發生的概率。
  • f t 線性回歸專題及常見問題 - CSDN
    1、標準化對於多元線性回歸需要對各個自變量進行標準化,排除單位的影響。標準化方法:即將原始數據減去相應變量的均數後再除以該變量的標準差,而標準化得到的回歸方程稱為標準化回歸方程,相應得回歸係數為標準化回歸係數。
  • 【方法】相關係數的計算與顯著性檢驗
    樣本相關係數可以用來對論文中建立的統計模型進行驗證,也可以用來進行元分析。相關係數的計算和顯著性檢驗是一個很輕鬆的工作——通常情況下,研究者會使用SPSS計算SPSS中各變量的相關,SPSS也直接提供了對相關係數的顯著性檢驗,研究者需要做的就是點點滑鼠,然後將結果抄寫在論文中。
  • t檢驗 機器學習_機器學習 t 檢驗 - CSDN
    假設檢驗常見的假設檢驗有:T檢驗(Student’s t Test),F檢驗(方差齊性檢驗),卡方驗證等。3大抽樣分布分類 : 卡方檢驗, 方差分析, 互信息回歸 : 相關係數卡方檢驗及應用思想:
  • 回歸係數顯著性水平多少範圍_多元線性回歸方程及回歸係數的顯著性...
    為準確預測元寶山露天煤礦湧水量,...而多元非線性回歸分析法的湧水量預測值與實測值相關係數達0.946,顯著性水平檢驗R~2為0.894,能解釋湧水量89.4%的變異,預測更精確,可作為今後礦區湧水量預測的依據
  • 顯著性檢驗的計算 - CSDN
    轉自個人微信公眾號【Memo_Cleon】的統計學習筆記:R筆記:兩配對樣本的顯著性檢驗。跟兩獨立樣本相對應的是兩配對樣本,生物醫學中常見的案例是治療前後的比較,兩種檢測方法的比較(同一樣本接受不同的檢驗方法)、配對的對象接受不同的處理。
  • 線性回歸的統計假設 - CSDN
    回歸的等式如下:託賓qi,t= b0 + b1(規模i,t)+b2(槓桿i,t)+b3(Betai,t)+b4(政治風險,t)+b5(透明度,t)+b6(地域分布i,t)+εi,t其中託賓qi,t= 年度t時跨國公司i的託賓q,託賓q的計算公式為(權益+長期債務的帳面價值)/(權益的帳面價值+長期債務的帳面價值)規模i,t= 年度t時跨國公司i的總銷售額的自然對數