的方法 線性回歸方程檢驗專題及常見問題 - CSDN

2021-01-07 CSDN技術社區

回歸方程建立及回歸參數的區間估計,但是它們都是建立在假定因變量和自變量線性相關的基礎上。因此,對相關程度進行檢驗也是重要的,相關程度的檢驗方法主要有三種:

相關係數的檢驗

回歸方程的檢驗

回歸係數的檢驗

相關係數的檢驗

變差關係

先來一張圖:

如上圖所示:當給定X0時,Y的實際值與均值的差值就是Y值隨X值的全部變化,稱之為總變差。在總變差中,一部分變差可以用設定的回歸方程解釋,稱之為回歸變差;另一部分變差是回歸方程不能解釋的,稱為剩餘變差,它們之間有下面等式:

如果在總變差Y中,回歸變差所佔的比例越大,則說明Y值隨X值的變化越顯著,或者說X解釋Y的能力越強。反之,回歸變差在總變差中所佔比例越小,則說明Y值隨X值的變化越不顯著,或者說X解釋Y的能力越差。

對於所有數據點,變差之間的關係可以用離差平方和表示:

它們從左到右分別稱為:總離差平方和、剩餘平方和和回歸平方和。

決定係數與相關係數

回歸變差所佔的比例越大,則說明Y值隨X值的變化越顯著。利用回歸平方和與總離差平方和的比值來說明X與Y的相關性,稱為決定係數,即有:

決定係數的開方被稱為相關係數,前面介紹過相關係數r(Excel數據分析工具:協方差與相關係數),計算公式為:

兩者的計算結果是完全一致的。

相關係數與決定係數都能表示變量之間的線性相關程度,但是相關係數計算更簡便且能表示相關關係的方向。

相關係數的檢驗

當已求得r值時,這個r值是真正刻畫了兩個變量之間的線性關係呢,還是僅僅由於樣本的偶然相關而引起的?僅憑相關係數的大小,不能直接說明變量之間是否存在線性相關,通過對r的檢驗,確定樣本是否抽自一個總體相關係數為0的總體,可以解答這個問題。可以證明r的t統計量服從自由度為n-2的t分布:

範例分析

某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將1991-2000年的數據,列入下表中,根據這些數據對回歸方程相關係數r在顯著水平0.05做雙側檢驗。

解:運用Excel對數據進行回歸分析,得到回歸方程和決定係數R平方;

決定係數為0.9149,相關係數r=0.9565;相關係數r的假設檢驗過程如下:

回歸方程的檢驗

對回歸方程進行顯著性檢驗,就是看自變量從總體上是否對因變量有明顯的影響。有回歸方程y=a+bx,如果b=0,則Y等於一個常數a,X與Y沒有任何關係,故方程不存在。如果b不等於0,則Y隨著X的變化而變化,說明方程有意義。

為了對b=0進行檢驗,需要構造一個檢驗的統計量。可以證明:在一元線性回歸中,當b=0時,有以下結論:

範例分析

某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將1991-2000年的數據,列入下表中,根據這些數據對回歸方程在顯著水平0.05做單側檢驗。

解:運用Excel對數據進行回歸分析,得到回歸方程和決定係數R平方;

回歸係數的檢驗

上面回歸方程的檢驗是利用b=0時,回歸方程的特性建立F統計量,進而進行假設檢驗。也可以構造另一個統計量t,如下:

利用上述t統計量即可對b進行假設檢驗。

範例分析

再次使用上面的例題:某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將1991-2000年的數據,列入表8-1中,根據這些數據對回歸係數b在顯著水平0.05做雙側檢驗。

解:運用Excel對數據進行回歸分析,得到回歸方程和決定係數R平方;

三種檢驗方法雖然各有側重,但在一元線性回歸方程的檢驗中,三種檢驗的作用是相同的,因此對於一元線性回歸方程而言,只要選擇一種方法進行檢驗即可。

範例分析

某個工廠生產運營多年,生產與銷售情況比較穩定。老闆想建立產量與單位成本的數量關係模型。現在收集了之前12年的產量與單位成本資料(如下表),根據這些資料說明產量與單位成本的數量關係,並通過產量預測單位成本。

立項分析

工廠運營一項很重要的工作就是成本控制。理論上,產品的產量與單位成本之間有內在聯繫。按照成本性質,產品成本由固定成本(折舊、人員工資等)和變動成本(包材、原輔料和水電氣等)構成,其中的固定成本總額在一定範圍內,與產量無關。當產量變動時,單位產品所負擔的固定費用也會變化,從而使單位成本發生變動。因此,產量變化與單位成本由相關關係,但還需要通過數據驗證。

1、散點圖。因為要分析的是產量對單位成本的影響,所以,將產量作為自變量,單位成本作為因變量(回顧:一元(簡單線性)相關分析與回歸分析)。

從圖形上看,產量與單位成本呈負的線性關係,這與實際是相符的。

2、通過相關係數來驗證這種關係(回顧:一元(簡單線性)回歸方程的假設檢驗)。

相關係數可以通過決定係數計算,也可以通過協方差計算,兩者計算結果一致(回顧:一元(簡單線性)回歸方程的假設檢驗):

從相關係數可見產量與單位成本具有負的高度線性關係,可以建立一元線性回歸方程。

3、建立一元線性回歸方程(回顧:一元(簡單線性)相關分析與回歸分析)

回歸方程表明隨著產量的增加單位產品成本降低。產量每增加100件,單位產品成本下降0.2元。當產量為0時,單位成本是16.45元,是固定成本發生的部分。

4、回歸方程的檢驗(一元(簡單線性)回歸方程的假設檢驗)

回歸方程的檢驗有三種方法(回顧:一元(簡單線性)回歸方程的假設檢驗),這裡用回歸係數檢驗方法,給定顯著水平0.05,進行檢驗。

5、區間估計(回顧:回歸參數的區間估計)

因為上面計算得到的回歸方程是一個點估計,可以在95%的置信水平下,根據樣本數據估計總體單位成本下降的置信區間。

b的雙側95%置信區間

數據說明,在95%的置信水平下,產量每增加100件,單位產品成本下降0.139~0.261元之間。

單位成本的預測

假設某年計算生產2800件產品,預測單位成本的95%置信區間。

將X=28代入回歸方程,Y=10.85,置信區間為:

計算結果說明,在95%的概率下,當產量為2800件時,產品的單位成本在8.85~12.85元之間。

利用回歸方程進行預測,如果X的取值範圍在樣本範圍之內,則預測相對是準確的。如果超出這個範圍,預測則要小心,因為在樣本數據之外變量所形成的關係可能會發生變化,而不再是線性關係。

相關焦點

  • t檢驗回歸方程專題及常見問題 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係  3.相關係數的顯著性檢驗  因為一元線性回歸方程討論的是變量 x 與變量 y 之間的線性關係,所以變量 x 與 y 之間的相關係數來檢驗回歸方程的顯著性。用相關係數來反應 x 與 y 的線性關係的密切程度。
  • 多元線性回歸t檢驗專題及常見問題 - CSDN
    多元線性回歸模型通常用來研究一個應變量依賴多個自變量的變化關係,如果二者的以來關係可以用線性形式來刻畫,則可以建立多元線性模型來進行分析。1.t檢驗t檢驗是對單個變量係數的顯著性檢驗,一般看p值; 如果p值小於0.05表示該自變量對因變量解釋性很強。
  • spss 方法 線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • 一元線性回歸顯著性檢驗專題及常見問題 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係  3.相關係數的顯著性檢驗  因為一元線性回歸方程討論的是變量 x 與變量 y 之間的線性關係,所以變量 x 與 y 之間的相關係數來檢驗回歸方程的顯著性。用相關係數來反應 x 與 y 的線性關係的密切程度。
  • f t 線性回歸專題及常見問題 - CSDN
    1、標準化對於多元線性回歸需要對各個自變量進行標準化,排除單位的影響。標準化方法:即將原始數據減去相應變量的均數後再除以該變量的標準差,而標準化得到的回歸方程稱為標準化回歸方程,相應得回歸係數為標準化回歸係數。
  • spss多元線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • 線性回歸假設檢驗專題及常見問題 - CSDN
    機器學習眼中的線性回歸左圖是原始建模數據,目的是用來尋找玩偶數量和成本的某種關係。右圖將數據可視化得到散點圖。第一步 進行場景確定第二步 定義損失函數建模的目的:模型預測值與真實值之間的差距越小越好。下面有兩種定義損失函數的方法。
  • spss多元線性回歸模型專題及常見問題 - CSDN
    多元線性回歸,主要是研究一個因變量與多個自變量之間的相關關係,跟一元回歸原理差不多,區別在於影響因素(自變量)更多些而已,例如:一元線性回歸方程 為:    毫無疑問,多元線性回歸方程應該為:那麼,多元線性回歸方程矩陣形式為:
  • spss線性回歸自變量因變量專題及常見問題 - CSDN
    該研究想建立變量(pH、SOM、SAN等)與產量之間的回歸方程,此時我們可以考慮採用多元線性回歸分析。數據分析值得注意的是,多元線性回歸分析需要數據滿足以下4個假設:(1)需要至少2個自變量,且自變量之間互相獨立(本次6個);(2)因變量為為連續變量(本案例產量為連續變量);(3)數據具有方差齊性、無異常值和正態分布的特點(檢驗方法);(4)自變量間不存在多重共線性。
  • 值 多元線性回歸模型專題及常見問題 - CSDN
    多元線性回歸模型通常用來研究一個應變量依賴多個自變量的變化關係,如果二者的以來關係可以用線性形式來刻畫,則可以建立多元線性模型來進行分析。1.模型簡介1.1模型的結構多元線性回歸模型通常用來描述變量y和x之間的隨機線性關係,即:
  • t值 線性回歸專題及常見問題 - CSDN
    線性回歸 用線性回歸找到最佳擬合直線回歸的目的是預測數值型數據,根據輸入寫出一個目標值的計算公式,這個公式就是回歸方程(regression equation),變量前的係數(比如一元一次方程)稱為回歸係數(regression weights)。
  • 回歸方程的顯著性檢驗 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係  3.相關係數的顯著性檢驗  因為一元線性回歸方程討論的是變量 x 與變量 y 之間的線性關係,所以變量 x 與 y 之間的相關係數來檢驗回歸方程的顯著性。用相關係數來反應 x 與 y 的線性關係的密切程度。
  • f p 線性回歸專題及常見問題 - CSDN
    對於一個樣本\(x_i\),它的輸出值是其特徵的線性組合:\[\begin{equation}f(x_i) = \sum_{m=1}^{p}w_m x_{im}+w_0={w}^T{x_i}\end{equation}\]線性回歸的目標是用預測結果儘可能地擬合目標label,用最常見的Least square作為loss function:\[\begin{equation}
  • 多元線性回歸預測spss - CSDN
    回歸一直是個很重要的主題。因為在數據分析的領域裡邊,模型重要的也是主要的作用包括兩個方面,一是發現,一是預測。而很多時候我們就要通過回歸來進行預測。關於回歸的知識點也許不一定比參數檢驗,非參數檢驗多,但是複雜度卻絕對在其上。回歸主要包括線性回歸,非線性回歸以及分類回歸。本文主要討論多元線性回歸(包括一般多元回歸,含有虛擬變量的多元回歸,以及一點廣義差分的知識)。
  • 線性回歸方程的顯著性驗證,總體驗證的F檢驗與個體驗證的t檢驗
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第8章,顯著性驗證,總體驗證的F檢驗與個體驗證的t檢驗。上一章,我講述了回歸方程的精度,在回歸分析中,我們求出回歸方程後,除了確認回歸方程的精度外,我們要需要對回歸方程進行顯著性驗證,以確認回歸方程的有效性。本章,我同樣分如下三個小節對顯著性驗證進行講解,歡迎閱讀與探討。我的《線性回歸分析》專欄總目錄見下圖。1、什麼是顯著性驗證?
  • 回歸分析t檢驗公式_線性回歸t檢驗公式 - CSDN
    1/2】Ha 假設【檢驗】:硬幣是有問題整個假設檢驗過程,是在H0假設條件下,進行試驗,如果推導出自相矛盾的結論,那麼就拒絕H0假設。          SSR回歸平方和表示,數據可解釋的差異【也就是回歸方程能解釋的差異】          RSS殘差平方和,表示不可解釋的差異。
  • 卡方檢驗相關性專題及常見問題 - CSDN
    過濾式方法是先按照某種規則對數據集進行特徵選擇,然後再訓練學習器,特徵選擇過程與後續學習器無關,這相當於先用特徵選擇過程對初始特徵進行「過濾」,再用過濾後的特徵來訓練模型。相關係數法、卡方檢驗法和互信息法是進行特徵選擇時常用的幾種過濾式方法。
  • r語言多元線性回歸相關性_多元線性回歸調整相關性 - CSDN
    多元線性回歸多元線性回歸的核心問題:應該選擇哪些變量???RSS(殘差平方和)與R2  (相關係數的平方)選擇法:遍歷所有可能的組合,選出使RSS最小,R2  最大的模型。
  • 擬合優度專題及常見問題 - CSDN
    那麼,y的總變差平方和(total sum of squares,SST),就等於其「回歸平方和」與「剩餘平方和」之和。即:回到擬合優度的問題上,我們就容易理解,當所有樣本點都落在回歸線上時,回歸方程的擬合優度一定是最高的。此時,y的SST只包含SSR部分,沒有SSE。
  • 回歸係數顯著性t檢驗_多元線性回歸方程及回歸係數的顯著性檢驗...
    1/2】Ha 假設【檢驗】:硬幣是有問題整個假設檢驗過程,是在H0假設條件下,進行試驗,如果推導出自相矛盾的結論,那麼就拒絕H0假設。          SSR回歸平方和表示,數據可解釋的差異【也就是回歸方程能解釋的差異】          RSS殘差平方和,表示不可解釋的差異。