spss線性回歸自變量因變量專題及常見問題 - CSDN

2021-01-07 CSDN技術社區

轉載自公眾號:青年智囊

SPSS多元線性回歸

在回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元回歸。事實上,一種現象常常是與多個因素相聯繫的,由多個自變量的最優組合共同來預測或估計因變量,比只用一個自變量進行預測或估計更有效,更符合實際,因此多元線性回歸被廣泛運用。今天大家一起來學習吧!

案例闡述

養分含量與產量的回歸分析

土壤和植被養分是作物產量的重要影響因素。為探討土壤和葉片養分元素含量對作物產量的影響,一項研究測定了某區域30個樣地的作物產量、土壤pH值、有機質含量(SOM)、鹼解氮含量(SAN)、速效磷含量(SAP)和葉片氮含量(STN)及磷含量(STP),部分數據如下:

註:表中數據均為隨機生成,不可他用。

該研究想建立變量(pH、SOM、SAN等)與產量之間的回歸方程,此時我們可以考慮採用多元線性回歸分析。

數據分析

值得注意的是,多元線性回歸分析需要數據滿足以下4個假設:

(1)需要至少2個自變量,且自變量之間互相獨立(本次6個);

(2)因變量為為連續變量(本案例產量為連續變量);

(3)數據具有方差齊性、無異常值和正態分布的特點(檢驗方法);

(4)自變量間不存在多重共線性。

前2個假設可根據試驗設計直接判斷;假設(3)的檢驗在之前的教程中已有呈現,點擊「檢驗方法」即可查看。

關於假設(4)的檢驗方法如下:

1. 點擊 分析 → 回歸 → 線性。

2.將pH等自變量選入自變量框,將產量選入因變量框,點擊統計。

3.在統計窗口選擇共線性診斷,點擊繼續,然後再主頁面點擊確定即可。

4.結果判斷:在結果中我們關注係數表即可,當VIF值大於等於10時,我們認為變量間存在嚴重的共線性,當VIF值小於10時,我們認為數據基本符合多元線性分析的假設(4),即不存在多重共線性問題。

因此,本案例數據均滿足以上4個假設,可以進行多元線性回歸的運算。

SPSS分析步驟

一、準備工作

SPSS軟體(我使用的是IBM SPSS Statistics 25 中文版,其實各個版本格局上都是相似的,如果大家需要我的版本可以直接點擊(安裝包)下載;Excel數據整理。

二、分析數據

1. 點擊 分析 → 回歸 → 線性

2.將pH等自變量選入自變量框,將產量選入因變量框,點擊統計。

3.在統計界面勾選如下選項,點擊繼續

4.點擊主頁面的保存,然後在新窗口中勾選如下選項,然後點擊繼續。

5.點擊主頁面中的「確定」即可得到分析結果。

結果闡述

一、描述性統計結果

這是對各變量數據的簡單指標的描述,SPSS分別對各指標的數據求了平均值和標準偏差,並統計了每個組的數據個數。

二、模型納入變量表

輸入/除去的變量:

我們可以從這個表中看到該研究的基本信息:(1) 輸入的變量欄顯示該研究納入的自變量包括LTP、PH、SOM、SAP、SAN和LTN;(2) 方法欄顯示納入方法為輸入(區別於逐步回歸分析);(3) 該回歸模型是模型1。

三、模型摘要

下表是本次回歸模型的模型摘要表

(1)下表中R為多重相關係數,主要用於判斷自變量和因變量的線性關係,同時也是回歸模型的擬合程度指標,可做模型優度的參考指標;

(2)R方和調整後R方是指回歸分析中因變量變異對自變量的解釋度,一般我們採用調整後R方來衡量。本案例中可以解釋為:土壤pH值等6項指標能解釋產量變化的90.7%(0.907),這表明本案例中測定的土壤和葉片養分指標能較好的解釋作物產量的變異,土壤和葉片養分含量對作物產量具有較高的影響強度。

四、ANOVA表

此表是模型顯著性的檢驗。

該表中F值=48.177,為F檢驗的結果;

P值<0.001,根據F值計算而來,P<0.05則表明提示因變量和自變量之間存在線性相關。

這個檢驗的零假設是多重相關係數R=0。如果P<0.05,就說明多重線性回歸模型中至少有一個自變量的係數不為零。同時,回歸模型有統計學意義也說明相較於空模型,納入自變量有助於預測因變量;或說明該模型優於空模型。

五、回歸係數表

(1)此表為回歸模型係數表:①為模型係數;②為標準化係數;③為變量在模型中的顯著性檢驗;④為之前提到的共線性檢驗結果VIF值。

(2)本案例中我們的回歸模型可以假設為:

產量 = B0(常量) + B1*PH + B2*SOM + B3*SAN + B4*SAP + B5*LTN +B6*LTP

(3)首先我們看各自變量在模型中的顯著性檢驗結果。當P>0.05時,該自變量在本模型中沒有統計學意義,應當在回歸模型中刪除相應變量;當P<0.05時該變量在模型中具有統計學意義,應當保留。

(4)本案例中僅SOM和LTP的顯著性檢驗結果小於0.05,因此本案例的回歸模型為:產量 = 27.188*SOM + 807.02*LTP

五、結果描述

本案例以土壤pH值、SOM、SAN、SAP含量和葉片LTN及LTP含量為自變量,筍產量為因變量進行多元線性回歸分析。結果表明,回歸模型具有顯著的統計學意義(F=48.177,P<0.001),自變量能解釋作物產量變化的90.7%,具有較高的解釋度。顯著性檢驗結果表明,SOM和LTP含量對作物產量的影響具有統計學意義(P<0.05,如下表)

當然,關於結果的論述大家還是要多看文獻啦!這只是一個參考,希望大家進步多多!

END

本次教程就到這裡,公眾號還會持續更新有關SPSS數據分析與Excel、Wrod和PPT小技巧的教程,大家想先學習什麼知識可以直接在公眾號回復哦。

點個關注吧!一起學習!

相關焦點

  • spss 方法 線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • spss多元線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • spss多元線性回歸模型專題及常見問題 - CSDN
    多元線性回歸,主要是研究一個因變量與多個自變量之間的相關關係,跟一元回歸原理差不多,區別在於影響因素(自變量)更多些而已,例如:一元線性回歸方程 為:上圖中的 x1,  x2, xp分別代表「自變量」Xp截止,代表有P個自變量,如果有「N組樣本,那麼這個多元線性回歸,將會組成一個矩陣,如下圖所示:
  • 多元線性回歸預測spss - CSDN
    對於線性回歸的定義主要是這樣的:線性回歸,是基於最小二乘法原理產生古典統計假設下的最優線性無偏估計。是研究一個或多個自變量與一個因變量之間是否存在某種線性關係的統計學方法。這個什麼叫線性回歸,什麼叫最小二乘法,在在高中數學課本裡邊就有涉及。我就不重複了嘿嘿。本質上講一元線性回歸是多元線性回歸的一個特例,因此我們就直接討論多元線性回歸了哈。
  • f t 線性回歸專題及常見問題 - CSDN
    1、標準化對於多元線性回歸需要對各個自變量進行標準化,排除單位的影響。標準化方法:即將原始數據減去相應變量的均數後再除以該變量的標準差,而標準化得到的回歸方程稱為標準化回歸方程,相應得回歸係數為標準化回歸係數。
  • 單變量回歸分析spss - CSDN
    簡單線性回歸模型用於分析1個自變量對1個因變量的影響,或者說是由1個自變量預測1個因變量。但是事物間的聯繫往往是多方面的,因變量的變化往往不是由單個自變量的變化造成的。探索多個自變量對1個因變量的影響時,可以採用:多重線性回歸分析。
  • python一元線性回歸分析專題及常見問題 - CSDN
    python多重線性回歸分析多重線性回歸分析定義多重線性回歸模型:Mulitiple Linear Regression多元線性回歸模型:MultivariateLinear Regression數據準備#多重線性回歸#數據準備import pandas as pddf=pd.read_csv('e:/python/out/corr.csv',encoding='utf8')df根據預測目標,確定自變量和因變量#多重線性回歸
  • 多元線性回歸t檢驗專題及常見問題 - CSDN
    多元線性回歸模型通常用來研究一個應變量依賴多個自變量的變化關係,如果二者的以來關係可以用線性形式來刻畫,則可以建立多元線性模型來進行分析。1.t檢驗t檢驗是對單個變量係數的顯著性檢驗,一般看p值; 如果p值小於0.05表示該自變量對因變量解釋性很強。
  • spss多變量回歸分析 - CSDN
    回歸分析的棘手問題--非線性關係1回歸分析要求自變量與應變量存在著線性關係回歸分析主要探討自變量x與研究結局變量y的關係,無論線性回歸,logistic回歸或者因此,一個變量需要回答兩個問題,最好的辦法是把這個變量分為兩個子變量,分別計算b值和OR值,這個子變量便是啞變量。
  • 一元線性回歸顯著性檢驗專題及常見問題 - CSDN
    採用的假設如下:原假設     H0 : β1 = 0   (x 與 y 不存在線性關係)對立假設  H1 : β1 ≠ 0  回歸係數的顯著性檢驗就是要檢驗自變量 x 對因變量 y 的影響程度是否顯著。下面我們分析接受和拒絕原假設的意義。
  • spss 非線性回歸 - CSDN
    我們在做問卷分析時,由於因變量多為連續的線性變量,多半會採用線性回歸分析來研究變量之間的關係。此時,一般資料或者人口學變量中,就會含有很多分組或分類的變量,比如性別,學歷等等。 如果因變量在這些人口學變量上存在顯著的差異,那麼做回歸分析時候,就需要將這些存在顯著差異的人口學變量作為控制變量納入線性回歸分析。
  • 的方法 線性回歸方程檢驗專題及常見問題 - CSDN
    回歸方程建立及回歸參數的區間估計,但是它們都是建立在假定因變量和自變量線性相關的基礎上。相關係數的檢驗當已求得r值時,這個r值是真正刻畫了兩個變量之間的線性關係呢,還是僅僅由於樣本的偶然相關而引起的?僅憑相關係數的大小,不能直接說明變量之間是否存在線性相關,通過對r的檢驗,確定樣本是否抽自一個總體相關係數為0的總體,可以解答這個問題。
  • 回歸分析兩個因變量 - CSDN
    當陽性結果出現概率較小時(一般小於0.05)或者較大時(大於0.95),OR=(P1/(1-P1))/(P2/(1-P2))≈P1/P2=RR【2】二分類資料的logistic回歸SPSS操作示例適用條件:①因變量為二分類變量,自變量可以是連續變量也可以是分類變量;②各觀測間相互獨立;③自變量與因變量logit(P)之間存在線性關係;④自變量間不存在多重共線;⑤儘量避免異常值
  • 回歸分析的基礎概念1:什麼是變量、自變量、因變量和「啞變量」
    大家好,我是許栩,歡迎來到我的專欄《從入門到高手-線性回歸分析詳解》,這是專欄的第一篇文章,介紹幾個回歸分析的基礎概念:變量、自變量、因變量和「啞變量」。常用的定量預測方法包括時間序列預測法與回歸分析預測法。時間序列預測法是以內生數據(也就是歷史需求數據)為分析對象的預測方法,而回歸分析預測法則以外生數據(或稱解釋性數據,比如促銷)為分析對象。
  • 檢驗回歸方程中自變量X是否對因變量Y具有顯著影響的一個最常見
    檢驗回歸方程中自變量X是否對因變量Y具有顯著影響的一個最常見方法是( )。A.F檢驗 B.R2檢驗 C.自變量相關係數檢驗 D.t檢驗 查看答案解析【答案解析】 本題考查簡單線性回歸模型。t檢驗是檢驗回歸方程中自變量X是否對因變量Y具有顯著影響的一個最常見方法。參見教材P312。
  • 值 多元線性回歸模型專題及常見問題 - CSDN
    多元線性回歸模型通常用來研究一個應變量依賴多個自變量的變化關係,如果二者的以來關係可以用線性形式來刻畫,則可以建立多元線性模型來進行分析。1.模型簡介1.1模型的結構多元線性回歸模型通常用來描述變量y和x之間的隨機線性關係,即:
  • t檢驗回歸方程專題及常見問題 - CSDN
    採用的假設如下:原假設     H0 : β1 = 0   (x 與 y 不存在線性關係)對立假設  H1 : β1 ≠ 0  回歸係數的顯著性檢驗就是要檢驗自變量 x 對因變量 y 的影響程度是否顯著。下面我們分析接受和拒絕原假設的意義。
  • SPSS分析技術:線性回歸分析
    ,也就是函數關係,不能解決針對未來的分析與預測問題。回歸方程式不僅能夠解釋現在個案內部隱藏的規律,明確每個自變量對因變量的作用程度。而且,基於有效的回歸方程,還能形成更有意義的數學方面的預測關係。因此,回歸分析是一種分析因素變量對因變量作用強度的歸因分析,它還是預測分析的重要基礎。
  • 多元線性回歸分析:納入多元回歸自變量的確定及求解多元回歸方程
    在前面的章節中我講到,實際需求預測場景中,通常,影響需求的因素不止一個,對需求影響的因素可能多種多樣,也就是說自變量多種多樣,很少能用單一的變量(也即一元線性回歸分析)來做好需求預測。這時,我們需要用到多元線性回歸分析。回歸分析在需求預測的應用,也主要是多元線性回歸分析。對需求預測而言,多元線性回歸更具有實用性和有效性。
  • SPSS-線性相關與多重線性回歸
    本期:相關與回歸日常工作中,我們不僅關心2變量之間的差異,也關注2變量之間的聯繫,比如年齡與血壓