SPSS分析技術:線性回歸分析

2021-01-14 SPSS生活統計學

基礎回顧

相關分析可以揭示事物之間共同變化的一致性程度,但它僅僅只是反映出了一種相關關係,並沒有揭示出變量之間準確的可以運算的控制關係,也就是函數關係,不能解決針對未來的分析與預測問題。相關分析請點擊回顧:

SPSS分析技術:Pearson相關、Spearman相關及Kendall相關;

SPSS分析技術:偏相關分析;

SPSS分析技術:低測度數據的相關性分析;


回歸分析就是分析變量之間隱藏的內在規律,並建立變量之間函數變化關係的一種分析方法,回歸分析的目標就是建立由一個因變量和若干自變量構成的回歸方程式,使變量之間的相互控制關係通過這個方程式描述出來。


回歸方程式不僅能夠解釋現在個案內部隱藏的規律,明確每個自變量對因變量的作用程度。而且,基於有效的回歸方程,還能形成更有意義的數學方面的預測關係。因此,回歸分析是一種分析因素變量對因變量作用強度的歸因分析,它還是預測分析的重要基礎。


回歸分析類型

回歸分析根據自變量個數,自變量冪次以及變量類型可以分為很多類型,常用的類型有:

線性回歸;

曲線回歸;

二元Logistic回歸技術;


線性回歸原理

回歸分析就是建立變量的數學模型,建立起衡量數據聯繫強度的指標,並通過指標檢驗其符合的程度。線性回歸分析中,如果僅有一個自變量,可以建立一元線性模型。如果存在多個自變量,則需要建立多元線性回歸模型。線性回歸的過程就是把各個自變量和因變量的個案值帶入到回歸方程式當中,通過逐步迭代與擬合,最終找出回歸方程式中的各個係數,構造出一個能夠儘可能體現自變量與因變量關係的函數式。在一元線性回歸中,回歸方程的確立就是逐步確定唯一自變量的係數和常數,並使方程能夠符合絕大多數個案的取值特點。在多元線性回歸中,除了要確定各個自變量的係數和常數外,還要分析方程內的每個自變量是否是真正必須的,把回歸方程中的非必需自變量剔除。


名詞解釋

線性回歸方程:一次函數式,用於描述因變量與自變量之間的內在關係。根據自變量的個數,可以分為一元線性回歸方程和多元線性回歸方程。

觀測值:參與回歸分析的因變量的實際取值。對參與線性回歸分析的多個個案來講,它們在因變量上的取值,就是觀測值。觀測值是一個數據序列,也就是線性回歸分析過程中的因變量。

回歸值:把每個個案的自變量取值帶入回歸方程後,通過計算所獲得的數值。在回歸分析中,針對每個個案,都能獲得一個回歸值。因此,回歸值也是一個數據序列,回歸值的數量與個案數相同。在線性回歸分析中,回歸值也常常被稱為預測值,或者期望值。

殘差:殘差是觀測值與回歸值的差。殘差反映的是依據回歸方程所獲得的計算值與實際測量值的差距。在線性回歸中,殘差應該滿足正態分布,而且全體個案的殘差之和為0。


回歸效果評價

在回歸分析的評價中,通常使用全部殘差的平方之和表示殘差的量度,而以全體回歸值的平方之和表示回歸的量度。通常有以下幾個評價指標:


判定係數

為了能夠比較客觀的評價回歸方程的質量,引入判定係數R方的概念:

判定係數R方的值在0~1之間,其值越接近1,表示殘差的比例越低,即回歸方程的擬合程度越高,回歸值越能貼近觀測值,更能體現觀測數據的內在規律。在一般的應用中,R方大於0.6就表示回歸方程有較好的質量。


F值

F值是回歸分析中反映回歸效果的重要指標,它以回歸均方和與殘差均方和的比值表示,即F=回歸均方和/殘差均方和,在一般的線性回歸中,F值應該在3.86以上。

 

T值

T值是回歸分析中反映每個自變量的作用力的重要指標。在回歸分析時,每個自變量都有自己的T值,T值以相應自變量的偏回歸係數與其標準誤差的比值來表示。在一般的線性回歸分析中,T的絕對值應該大於1.96。如果某個自變量的T值小於1.96,表示這個自變量對方程的影響力很小,應該儘可能把它從方程中剔除。

 

檢驗概率(Sig值)

回歸方程的檢驗概率值共有兩種類型:整體Sig值和針對每個自變量的Sig值。整體的Sig值反映了整個方程的影響力,而針對自變量的Sig值則反映了該自變量在回歸方程中沒有作用的可能性。只有Sig值小於0.05,才表示有影響力。


案例分析(一元線性回歸)

現在有一份《大學生學習狀況》的數據,請分析作業情況與數學成績之間的關係,構造回歸方程,並評價回歸分析的效果。


(所有例題的數據文件都已經上傳到QQ群中,需要的朋友可以前往下載)


SPSS分析步驟

1、選擇菜單【分析】-【回歸】-【線性】命令,啟動線性回歸命令。

2、將數學成績選為因變量,將作業情況選為自變量,點擊【確定】。



結果解釋


判定係數R方值為0.919,表示此回歸方程具有很好的質量。

在方差分析表格中,顯著性為0.000,小於0.05,表示回歸方程具有很強的影響力,能夠很好的表達數學成績與作業情況的控制關係。

最後一個表格中的B列,常數為39.887,作業情況的係數為6.539,所以回歸方程為y=6.539x+39.887。


案例分析(多元線性回歸)

分析數學成績與專業、愛好、作業情況、上網時間和遊戲時間之間的關係。

 

分析步驟

1、字符型數據數值化編碼,將愛好和專業進行數值化編碼。

2、選擇踩踏【分析】-【回歸】-【線性】命令。

3、將數學成績選入因變量,將數值化後的愛好、專業以及上網時間、遊戲時間、作業情況選為自變量。

4、在自變量下的選項框中選擇【逐步】,如下圖:


紅框內選項含義:

輸入:對於用戶提供的所有自變量,回歸方程全部接納。

逐步:先檢查不在方程中的自變量,把F值最大(檢驗概率最小)且滿足進入條件的自變臉選入方程中,接著,對已經進入方程的自變量,查找滿足移出條件的自變量(F值最小且F檢驗概率滿足移出條件)將其移出。

前進:對於用戶提供的所有自變量,系統計算出所有自變量與因變量的相關係數,每次從尚未進入方程的自變量組中選擇與因變量具有最強正或負相關係數的自變量進入方程,然後檢驗此自變量的影響力,直到沒有進入方程的自變量都不滿足進入方程的標準為止。

後退:對於用戶提供的所有自變量,先讓它們全部強行進入方程,再逐個檢查,剔除不合格變量,直到方程中的所有變量都不滿足移出條件為止。

刪除:也叫一次性剔除方式,其思路是通過一次檢驗,而後剔除全部不合格變量。這種方法不能單獨使用,通常建立在前面已經構造出初步的回歸方程的基礎上,與前面其他篩選方法結合使用。


結果解釋

1、第一個表格是輸入/移去變量表格;


即最後遊戲時間和作業情況被納入到回歸方程當中。


2、模型表格和方差分析表格。這兩個表格表明產生兩個回歸模型,這是遊戲時間和作業情況依次進入回歸過程之後的結果,且第二個回歸模型的R方值大於第一個,所以第二個回歸方程比較好。



3、係數表格;


採用第二個回歸模型是y=-0.743*x1+1.216*x2+97.729,x1代表遊戲時間,x2代表作業情況。


所有例題的數據文件都已經上傳到QQ群中,需要的朋友可以前往下載。


溫馨提示:

SPSS教學視頻,請點擊:《SPSS入門基礎》視頻教程;

生活統計學QQ群:134373751,用於分享文章提到的各種案例資料、軟體、數據文件等。支持各種資料的直接下載和百度雲盤下載。

生活統計學微信交流群,用於各自行業的數據研究項目及其成果交流分享;由於人數大於100人,請添加微信possitive2,拉您入群。

相關焦點

  • spss 方法 線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • spss多元線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • SPSS多元線性回歸案例:回歸分析方法實戰
    回歸分析是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析,時間序列模型以及發現變量之間的因果關係。使用曲線/線來擬合這些數據點,在這種方式下,從曲線或線到數據點的距離差異最小。
  • SPSS統計分析案例:一元線性回歸
    微信號後臺有非常之多的關於回歸分析的留言,作為最常見的統計分析方法,在工作生活中的應用需求量巨大,這兩天已經為大家選好了案例數據,先從一元線性回歸分析開始。一元線性回歸,顧名思義,僅有一個自變量的回歸模型,研究的是一個因素對結果的影響,可以用於預測,也經常被稱之為簡單線性回歸分析。
  • SPSS:簡單線性回歸分析(圖文案例)
    分享SPSS統計分析方法,使科學研究更容易。
  • spss協方差分析
    什麼是協方差分析?協方差分析又稱「共變量分析」,是方差分析的引申和擴大。基本原理是將線性回歸與方差分析結合起來,調整各組平均數和 F 檢驗的實驗誤差項,檢驗兩個或多個調整平均數有無顯著差異,以便控制在實驗中影響實驗效應(因變量)而無法人為控制的協變量(與因變量有密切回歸關係的變量)在方差分析中的影響。好吧,聽不懂。簡單舉個例子來說:有一項研究,想知道男生和女生在跑步後的心率是否有差異。
  • 數據分析基礎相關性分析,SPSS實操
    一、相關性分析定義相關性分析用於描述變量之間線性相關程度的強弱,並用適當的統計指標表示出來的過程。(1)首先假設總體相關性為零,即H0為兩總體無顯著的線性相關關係。(2)其次,計算相應的統計量,並得到對應的相伴概率值。如果相伴概率值小於或等於指定的顯著性水平,則拒絕H0,認為兩總體存在顯著的線性相關關係;如果相伴概率值大於指定的顯著性水平,則不能拒絕H0,認為兩總體不存在顯著的線性相關關係。
  • 多元線性回歸spss結果分析_spss多元線性回歸分析結果分析 - CSDN
    通過查閱北京統計局出示的有關數據以及閱讀相關文獻,搜集北京市近15年的統計資料,基於SPSS多元線性回歸中的逐步回歸分析法,建立回歸模型。
  • 多元線性回歸預測spss - CSDN
    回歸一直是個很重要的主題。因為在數據分析的領域裡邊,模型重要的也是主要的作用包括兩個方面,一是發現,一是預測。而很多時候我們就要通過回歸來進行預測。關於回歸的知識點也許不一定比參數檢驗,非參數檢驗多,但是複雜度卻絕對在其上。回歸主要包括線性回歸,非線性回歸以及分類回歸。本文主要討論多元線性回歸(包括一般多元回歸,含有虛擬變量的多元回歸,以及一點廣義差分的知識)。
  • 【線性回歸】多變量分析:多元回歸分析
    實際上大部分學習統計分析和市場研究的人的都會用回歸分析,操作也是比較簡單的,但能夠知道多元回歸分析的適用條件或是如何將回歸應用於實踐,可能還要真正領會回歸分析的基本思想和一些實際應用手法!下面我們就來談談多元回歸分析,這張圖是利用多元線性回歸製作的策略分析圖,你可以理解X軸是重要性,Y軸是表現;首先,多元回歸分析應該強調是多元線性回歸分析!
  • 範例分析:多元線性回歸分析
    基礎回顧簡單線性和多元線性回歸理論基礎請回顧:相關與回歸分析基礎;一元(簡單線性)相關分析與回歸分析
  • 機器學習的線性回歸分析
    打開APP 機器學習的線性回歸分析 是DRR啊 發表於 2020-01-23 17:33:00 概述 線性回歸是利用數理統計中回歸分析
  • SPSS教程-回歸分析
    SPSS702:46來自LearningYard學苑//SPSS//Course//回歸分析SPSS01 線形回歸分析 BREEZE步驟一:在菜單欄中找到分析→回歸→線性,打開「線性回歸」對話框;步驟二:將變量「財政收入」移入因變量框 ,「國內生產總值」移入自變量框;步驟三:打開「統計」對話框,勾選「估計」和「模型擬合度」;步驟四:打開「圖」對話框,將DEPENDENT作為y軸,*ZPRED為x軸作圖
  • 簡單線性回歸分析
    線性回歸分析,統計學上是對具有相關性的變量進行定量分析,分析變量之間的定量關係。
  • SPSS因子分析案例
    因子分析在各行各業的應用非常廣泛,尤其是科研論文中因子分析更是頻頻出現。【二、簡單實例】現在有 12 個地區的 5 個經濟指標調查數據(總人口、學校校齡、總僱員、專業服務、中等房價),為對這 12 個地區進行綜合評價,請確定出這 12 個地區的綜合評價指標。【三、解決方案】1、spss因子分析同一指標在不同地區是不同的,用單一某一個指標難以對12個地區進行準確的評價,單一指標智能反映地區的某一方面。
  • SPSS方法|嶺回歸分析
    :嶺回歸分析是在構建多重線性回歸模型時, 對基於「最小二乘原理」推導出的估計回歸係數的計算公式作一下校正,使回歸係數更穩定。當自變量之間存在較強的多重共線性時,求得的多重線性回歸模型很不穩定; 尤其是某些自變量回歸係數的正負號與實際問題的專業背景不吻合時,嶺回歸分析可以很好地解決這一問題。
  • 回歸分析spss步驟 - CSDN
    我們的教程中曾詳細講述了SPSS線性回歸分析,儘管線性回歸可以滿足絕大多數的數據分析,但是在現實情況中,並不能適用於所有的數據,當因變量和自變量之間的關係我們無法確定是否為線性或者其他非線性類型的模型關係時候,那麼我們就需要用到曲線回歸,來確定因變量和自變量之間到底最適合什麼樣的模型。
  • spss多變量回歸分析 - CSDN
    回歸分析的棘手問題--非線性關係1回歸分析要求自變量與應變量存在著線性關係回歸分析主要探討自變量x與研究結局變量y的關係,無論線性回歸,logistic回歸或者線性回歸啞變量的SPSS操作線性回歸SPSS操作有兩種方法,常規的線性回歸的啞變量設置十分複雜,此外還可以採用廣義線性模型的模塊進行啞變量的設置分析。
  • SPSS大戰多元回歸分析
    多元回歸分析應用於各個領域,主要有經濟、醫學、農學等。今天小編為大家分享一篇SPSS大戰多元回歸的數據分析實例。線性回歸數據來自於國泰安數據服務中心的經濟研究資料庫。網址:http://www.gtarsc.com/p/sq/。數據名稱為:全國各地區能源消耗量與產量,該數據的年度標識為2006年,地區包括我國30個省,直轄市,自治區(西藏地區無數據)。
  • 數據分析難?教你spss使用的正確姿勢
    軟體不會用,各種數據傻傻搞不清楚,尤其是怎麼分析數據更是暈頭轉向,當然跟著靠譜的老師學習,一邊看實操一邊自己做,這樣肯定事半功倍。本次我們整理出了spss的數據分析教程,都是有實操的,只要跟著做,絕對沒問題!