單變量回歸分析spss - CSDN

2021-01-16 CSDN技術社區

簡單線性回歸模型用於分析1個自變量對1個因變量的影響,或者說是由1個自變量預測1個因變量。但是事物間的聯繫往往是多方面的,因變量的變化往往不是由單個自變量的變化造成的。

探索多個自變量對1個因變量的影響時,可以採用:多重線性回歸分析。

適用條件與簡單線性回歸分析類似,包括:線性趨勢、獨立性、正態性、方差齊性。

但是對樣本量有要求,樣本量太少時,可能會出現檢驗效能不足,回歸結果可靠性降低等問題。一般要求樣本量要超過自變量數的20倍。

案例:根據多個步態指標預測老年人動態平衡能力

實驗對象:60歲左右的老年人。

測試內容:老年人平衡分數,以及步態指標。

· 時間類指標:雙支撐時間、單支撐時間。

· 空間類指標:步長、步向角、左右側COP、前後側COP。

研究目的:根據步態參數預測老年人平衡能力。

本次分析目的:採用多個步態指標預測老年人的動態平衡能力

部分數據:

圖1

1.SPSS步驟:

1)分析-回歸-線性

圖2

2)"動態平衡得分"選入"因變量";"步長、步向角、左右測COP、前後側COP、雙支撐時間、單支撐時間"選入"自變量"。

圖3

3)按下圖勾選。

圖4

2.結果

圖5

圖5給出了各指標的均值、標準差。

圖6

圖6,共建立3個回歸模型,同時給出了依次輸入的變量,由於引入新變量後,原來模型中引入的自變量仍然有統計學意義,因此沒有自變量被除去。

圖7

(1)復相關係數R,表示模型中所有自變量與因變量之間的線性回歸關係的密切程度。實際上是yi與估計值y^的簡單線性回歸係數。取值範圍(0,1)。

復相關係數在評價多重線性回歸模型優劣時存在不足,即使向模型中增加的變量沒有統計學意義,R值仍會增大。

R值多大合適?不同的學科有不同的判斷標準。社會科學類研究一般要求大於0.4,自然科學一般要求大於0.8。

(2)決定係數R2,表示因變量y的總變異可由回歸模型中自變量解釋的部分所佔比例。

(3)調整後的決定係數R2adj。即使向模型中增加的變量沒有統計學意義,R2值仍會增大,因此需要對其調整,形成調整後的決定係數R2adj。當模型中增加沒有統計學意義的變量時,R2adj會變小,因此,R2adj是衡量模型好壞的重要指標之一。R2adj越大,模型的效果越好。

案例模型的R2adj=0.768,模型效果較好。

圖8

回歸模型的方差分析結果顯示,三個模型的P值均小於0.05,說明回歸模型有統計學意義。

剩餘標準差是誤差均方的算術平方根,反映建立的模型預測因變量的精度。剩餘標準差越小,模型的預測效果就越好。

圖9

給出了各模型自變量的偏回歸係數估計值、標準化後的偏回歸係數,以及回歸係數的顯著性檢驗結果。回歸方程:

標準化偏回歸係數:由於不同自變量的偏回歸係數的量綱不同,需要比較各自變量對因變量影響程度時,無法根據偏回歸係數值的大小直接進行比較。標準化偏回歸係數是偏回歸係數標準化的結果,排除了量綱和自變量離散程度差異的影響,可以根據絕對值的大小判斷自變量的重要程度。

標準化偏回歸係數分別為0.780,0.708,-0.233。

多重共線性。

多重共線性指自變量間存在線性相關關係,也就是一個自變量可以用其他一個或幾個自變量的線性表達式進行表示。存在多重共線性時,模型可能會有以下表現:

(1)模型檢驗結果為P≤α,但是各自變量的偏回歸係數的檢驗結果卻為P>α。

(2)專業上認為應該有統計學意義自變量檢驗結果卻無統計學意義。

(3)自變量的偏回歸係數的取值大小甚至符號明顯與實際情況相違背,難以解釋。

(4)增加或刪除一個自變量或一個案例,自變量偏回歸係數發生較大變化。

以上情況使回歸模型,特別是其中的回歸係數難以有合乎專業知識的解釋。

要強調的是,多重共線性的存在不一定必然影響模型的使用價值。理論上,共線性不應當降低模型的預測效果,主要影響的是偏回歸係數,導致模型無法用專業知識解釋。

多重共線性的識別

(1)容忍度(tolerance)。某自變量的容忍度等於1減去以該自變量為因變量,以模型中其他自變量為自變量的線性回歸模型的決定係數。容忍度越小,多重共線性就越嚴重。一般容忍度小於0.1時,認為存在嚴重的多重共線性。

案例中的容忍度都偏大,說明不存在多重共線性(圖9) 。

(2)方差膨脹因子(VIF),容忍度的倒數。VIF越大,多重共線性越嚴重。一般認為VIF要大於5或大於10時多重共線性較嚴重。

案例中的方差膨脹因子都不大於2,進一步說明模型不存在多重共線性(圖9) 。

(3)特徵值。對模型所有常數項及所有自變量提取主成分,如果自變量間存在較強的線性相關關係,則前面幾個主成分特徵值偏大,後面的主成分特徵值偏小,甚至接近0。

(4)條件指數。為最大主成分特徵值與當前主成分特徵值比值的算術平方根。所以第1個主成分的條件指數為1,如果條件指數偏大(如大於30),則存在多重共線性。

(5)變異構成。回歸模型中各項(包括常數項)的變異能夠被主成分解釋的比例,或者說各主成分對模型中各項的貢獻。如果某個主成分同時對兩個或多個自變量的貢獻都比較大,則說明這幾個自變量間存在一定程度的共線性。

多重共線性的處理

(1)逐步回歸法。只能在一定程度上解決多重共線性問題。

(2)嶺回歸。能有效解決。

(3)主成分回歸。從存在多重共線性的自變量中提取主成分,然後將特徵根較大的(如大於1)幾個主成分與其他自變量一起進行多重線性回歸,得出主成分回歸係數,再根據主成分表達式反推出原始自變量的參數估計值。代價是提取主成分時丟失了一部分信息,收益是大大降低了共線性對參數估計值的扭曲,而且多重共線性越強,主成分丟失的信息越少,越適合做主成分回歸。

相關焦點

  • spss多變量回歸分析 - CSDN
    點擊學習全部醫學統計學與SPSS教程SPSS 教程36 啞變量設置分析‍啞變量(DummyVariable),也叫虛擬變量,是解決回歸分析分類自變量的重要舉措。它是「不發聲」的過程變量,通過設置啞變量,可將多分類變量進行二值化的處理,從而結局多分類特別是無需多分類變量無法納入回歸分析模型的尷尬局面。
  • spss 非線性回歸 - CSDN
    我們在做問卷分析時,由於因變量多為連續的線性變量,多半會採用線性回歸分析來研究變量之間的關係。此時,一般資料或者人口學變量中,就會含有很多分組或分類的變量,比如性別,學歷等等。 如果因變量在這些人口學變量上存在顯著的差異,那麼做回歸分析時候,就需要將這些存在顯著差異的人口學變量作為控制變量納入線性回歸分析。
  • spss 方法 線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • spss多元線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • 回歸分析兩個因變量 - CSDN
    分析數據來自孫振球主編的《醫學統計學》第三版。(1)數據錄入賦值。二分類變量取值只有「0」和「1」兩個值,本例年齡和體重指數嚴格來講是要設成啞變量的(可參見本文後面關於啞變量的介紹),但由於樣本量的問題,為更好的演示spss操作,本例按等級資料直接賦值。
  • 回歸分析spss步驟 - CSDN
    我們的教程中曾詳細講述了SPSS線性回歸分析,儘管線性回歸可以滿足絕大多數的數據分析,但是在現實情況中,並不能適用於所有的數據,當因變量和自變量之間的關係我們無法確定是否為線性或者其他非線性類型的模型關係時候,那麼我們就需要用到曲線回歸,來確定因變量和自變量之間到底最適合什麼樣的模型。
  • 多元線性回歸預測spss - CSDN
    回歸一直是個很重要的主題。因為在數據分析的領域裡邊,模型重要的也是主要的作用包括兩個方面,一是發現,一是預測。而很多時候我們就要通過回歸來進行預測。關於回歸的知識點也許不一定比參數檢驗,非參數檢驗多,但是複雜度卻絕對在其上。回歸主要包括線性回歸,非線性回歸以及分類回歸。本文主要討論多元線性回歸(包括一般多元回歸,含有虛擬變量的多元回歸,以及一點廣義差分的知識)。
  • spss協方差分析
    什麼是協方差分析?協方差分析又稱「共變量分析」,是方差分析的引申和擴大。基本原理是將線性回歸與方差分析結合起來,調整各組平均數和 F 檢驗的實驗誤差項,檢驗兩個或多個調整平均數有無顯著差異,以便控制在實驗中影響實驗效應(因變量)而無法人為控制的協變量(與因變量有密切回歸關係的變量)在方差分析中的影響。好吧,聽不懂。簡單舉個例子來說:有一項研究,想知道男生和女生在跑步後的心率是否有差異。
  • spss卡方_spss卡方檢驗 - CSDN
    spss中交叉分析主要用來檢驗兩個變量之間是否存在關係,或者說是否獨立,其零假設為兩個變量之間沒有關係。在實際工作中,經常用交叉表來分析比例是否相等。例如分析不同的性別對不同的報紙的選擇有什麼不同。
  • spss線性回歸自變量因變量專題及常見問題 - CSDN
    轉載自公眾號:青年智囊SPSS多元線性回歸在回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元回歸。事實上,一種現象常常是與多個因素相聯繫的,由多個自變量的最優組合共同來預測或估計因變量,比只用一個自變量進行預測或估計更有效,更符合實際,因此多元線性回歸被廣泛運用。今天大家一起來學習吧!
  • SPSS因子分析案例
    所以,有必要確定綜合評價指標,便於對比。因子分析是一個不錯的選擇,5 個指標即為我們分析的對象,我們希望從這5個可觀測指標中尋找出潛在的因素,用這些具有綜合信息的因素對各地區進行評價。下圖是spss因子分析的操作界面,主要包括5方面的選項,變量區只能選擇數值型變量,分類型變量不能進入該模型。
  • 如何用SPSS做單因素和多因素方差分析
    前段時間明明同學推送了一篇「如何用Excel做方差分析」,今天就講講如何用SPSS為大家展示常用的3種分析方法使用技巧即:單因素方差分析、雙因素方差分析(無交互效應和有交互效應)。讓大家對方差分析有一個更深的了解。首先,我們來了解一下什麼是方差分析。方差分析是對多個樣本平均數差異顯著性檢驗的一種方法,也就是推斷對多個樣本均數是否相等的方法。
  • 數據分析難?教你spss使用的正確姿勢
    軟體不會用,各種數據傻傻搞不清楚,尤其是怎麼分析數據更是暈頭轉向,當然跟著靠譜的老師學習,一邊看實操一邊自己做,這樣肯定事半功倍。本次我們整理出了spss的數據分析教程,都是有實操的,只要跟著做,絕對沒問題!
  • spss主成分怎麼進行分析?spss主成分分析法步驟
    spss 這款軟體功能非常多哦,還可以分析主成分哦,但是很多朋友不知道spss主成分怎麼進行分析?小編下面準備了spss主成分分析法詳細步驟,大家安裝 詳細步驟一步步操作就知道spss主成分怎麼進行分析?
  • spss怎麼分析因子?spss因子分析法詳細步驟
    spss不僅可以分析主成分 ,還可以分析因子哦,但是很多朋友不知道spss怎麼分析因子?小編下面有一個spss因子分析法詳細步驟哦,只要大家按照spss因子分析法詳細步驟一步步操作就知道spss怎麼分析因子了哦,下面就和小編一起來看看吧!
  • 基本數據統計分析--spss
    在數據分析工作中,描述性統計分析是我們日常使用率最高的,主要的基本統計分析維度包括但不限於均值、 中位數、眾數、方差、百分位、頻數、峰度、偏度、探索分析、交叉聯列表分析、多選項分析、基本統計報表製作等。而這些功能操作在spss中是可以直接使用的。當然我們也需要理解相關定義。
  • SPSS方差分析方法與實例演練
    在數據分析過程中,為了進行兩組以上均數的比較,往往可以使用方差分析方法。那麼我們一起了解一下方差分析基本概念、 單因素方差分析、 多因素方差分析及協方差分析;同時在spss中的操作演練。在spss中經常使用方差齊性檢驗(都是levene檢驗),一般情況下,只要sig值大於0.05就可以認為方差齊性的假設成立,因此方差分析的結果應該值得信賴;如果sig值小於或等於0.05,方差齊性的假設就值得懷疑,導致方差分析的結果也值得懷疑。
  • 數據分析之主成分分析,spss主成分分析實例
    主成分分析方法能夠解決以上問題,主成分分析法是一種降維的統計方法,是考察多個變量間相關性一種多元統計方法。二、spss主成分分析操作流程導入數據。將已有數據整理後導入spss導入數據主成分分析操作流程。
  • 數據分析基礎相關性分析,SPSS實操
    一般根據研究的目的不同、或變量的類型不同,採用不同的相關分析方法。 常用的相關分析方法:二元定距變量的相關分析、二元定序變量的相關分析、偏相關分析和距離相關分析等。偏相關分析是指當兩個變量同時與第三個變量相關時,將第三個變量的影響剔除,只分析另外兩個變量之間相關程度的過程。
  • spss多元線性回歸模型專題及常見問題 - CSDN
    多元線性回歸,主要是研究一個因變量與多個自變量之間的相關關係,跟一元回歸原理差不多,區別在於影響因素(自變量)更多些而已,例如:一元線性回歸方程 為:   今天跟大家一起討論一下,SPSS---多元線性回歸的具體操作過程,下面以教程教程數據為例,分析汽車特徵與汽車銷售量之間的關係。通過分析汽車特徵跟汽車銷售量的關係,建立擬合多元線性回歸模型。數據如下圖所示: