管理心理學之統計(22)回歸分析與多元回歸

2020-12-05 金碧輝煌姚小六

1. 回歸方程的顯著性測驗:回歸分析

回歸方程假設檢驗的虛無假設陳述了兩個變量總體間不存在關係,具體表述為:方程沒有對Y值的變異做出有顯著性的貢獻和解釋。或者說回歸方程中算出的b值不能代表任何X和Y之間的真正關係,只是由隨機或者樣本誤差造成的,總體真正的b為零。

Y分數的SS可以被分成兩個部分:可預測的r2和殘差部分(1- r2)。與ANOVA一樣,回歸分析使用F分數來確定回歸方程能解釋的方差是否顯著大於隨機的期望值。

圖表表示為:

2. 多元回歸

之前討論的回歸都是用一個變量預測另一個變量。現實情況中,一個變量通常與多個因素相關,結合幾個預測變量得到更精確的預測的過程被稱為多元回歸。

需要注意的是多元回歸,即使限定於兩個預測變量,預測的過程也可能十分複雜。同時不同預測變量間常常彼此相關,彼此重疊,所以在回歸方程中加入一個預測變量並不總能增加預測的精準度。

如下圖所示IQ和高考成績都與大學成績相關。IQ預測了40%大學成績的方差(a+b),高考成績預測了30%大學成績的方差(b+c)。當我們把高考成績作為第二個預測變量加入時,由於變量傾向於重疊(b),加入的新變量不能顯著增加預測的質量。

2.1 兩個預測變量的回歸方程

我們將兩個預測變量表示為X1和X2。那麼兩個預測變量的多元回歸方程的一般形式為:

如果三個變量都轉化為標準z分數,那麼標準化形式是:

2.2 多元回歸方程的目的

多元回歸方程的目的在於得到更精確的估計Y值。這個目標由最小二乘法達成。在多元回歸方程中,誤差被定義為每個個體的預測Y值與實際Y值之間的差異,通過將這些誤差的平方相加,最後我們會通過計算得到最小誤差平方和b1,b2和a值。推導公式較為複雜,這裡不做詳細展開。

2.3 回歸方差所佔的百分比與殘差

對於多元回歸方程,R2描述了Y 分數的總體變異中能被回歸方程說明的那部分所佔的百分比。

SS殘差=(1-R2)SSY

估計的標準誤為

2.4 多元回歸方程的顯著性檢驗:回歸分析

與一元公式一樣,多元回歸顯著性也是通過計算F分數來評估。Y的總變異分為兩部分:

SS回歸,df=2

SS殘差,df=n-3。

A. 評估每個預測變量的貢獻

除了評估多元回歸方差的總體顯著性,研究者還常常需要評估每個預測變量的貢獻。在回歸方程中,由於b值被其他很多因素影響,即使b1大於b2,也不意味著X1是比X2更好地預測。但是在標準化回歸方程中,β值的相對大小可以說明兩個變量的相對貢獻。較大的β值說明該變量預測了更多的方差。

B. 評估每個貢獻的顯著性

除了判斷每個預測變量的相對貢獻,還可以評估每個貢獻的顯著性。虛無假設的一般表述為多元回歸方程並不一定比只有X1的簡單一元回歸方程好。或者公式中的b2值與零沒有顯著差異。假設檢驗首先需要確定用X1和X2共同進行預測的方差比用X1單獨預測的方差大多少。

2.5 多元回歸的應用:控制第三個變量

多元回歸是將第二個預測變量加到回歸方程上,考慮在第一個預測變量的貢獻以外新變量對預測的貢獻的大小。在這個過程中,通過一次只加入一個新的預測變量的做法,研究者就可以排除第三個變量可能對這個關係造成的影響。

參考書目:行為科學統計,現代心理與教育統計學

相關焦點

  • 【線性回歸】多變量分析:多元回歸分析
    多元回歸分析(Multiple Regression Analysis)是多變量分析的基礎,也是理解監督類分析方法的入口
  • 多元回歸分析入門
    要了解變量之間如何發生相互影響的,就需要利用相關分析和回歸分析。在上一章講述了相關分析有關內容。本章介紹回歸分析基本概念,回歸分析的主要類型:一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計、時間序列的曲線估計、含虛擬自變量的回歸分析以及邏輯回歸分析等。j基本概念:    相關分析和回歸分析都是研究變量間關係的統計學課題。
  • 多元線性回歸分析:納入多元回歸自變量的確定及求解多元回歸方程
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第五章,多元線性回歸分析:如何求解多元線性回歸方程。在前面的章節中我講到,實際需求預測場景中,通常,影響需求的因素不止一個,對需求影響的因素可能多種多樣,也就是說自變量多種多樣,很少能用單一的變量(也即一元線性回歸分析)來做好需求預測。這時,我們需要用到多元線性回歸分析。回歸分析在需求預測的應用,也主要是多元線性回歸分析。對需求預測而言,多元線性回歸更具有實用性和有效性。
  • 【從入門到高手:回歸分析】多元回歸分析:如何求解多元回歸方程
    在前面的章節中我講到,實際需求預測場景中,通常,影響需求的因素不止一個,對需求影響的因素可能多種多樣,也就是說自變量多種多樣,很少能用單一的變量(也即一元回歸分析)來做好需求預測。這時,我們需要用到多元回歸分析。回歸分析在需求預測的應用,也主要是多元回歸分析。對需求預測而言,多元回歸更具有適用性和有效性。
  • 多元線性逐步回歸分析
    一、方法簡述多元逐步回歸有3種篩選自變量的方法:(1)向前法:這種算法SPSS會建立由一個自變量開始,每次引入一個偏回歸平方和最大且具有統計學意義的自變量,由少到多,直到無具有統計學意義的因素可以代入方程為止,此法也可能納入部分無意義變量;(2)向後法:這種算法SPSS會先建立一個全因素的回歸方程,再逐步剔除一個偏回歸平方和最小且無統計學意義的自變量
  • 範例分析:多元線性回歸分析
    基礎回顧簡單線性和多元線性回歸理論基礎請回顧:相關與回歸分析基礎;一元(簡單線性)相關分析與回歸分析
  • SPSS大戰多元回歸分析
    使用多元回歸進行數據分析,分析軟體供選擇的比較多,主要有Eviews、Spss、Stata、Sas、Gretel等。
  • 一文讀懂多元回歸分析
    一、多元回歸分析簡介用回歸方程定量地刻畫一個應變量與多個自變量間的線性依存關係,稱為多元回歸分析(multiple linear
  • r語言 多元回歸模型_r語言多元回歸模型殘差分析 - CSDN
    1、多元線性回歸模型1.1多元回歸模型與多元回歸方程設因變量為y,k個自變量分別為,描述因變量y如何依賴於自變量和誤差項ε的方程稱為多元回歸模型。其一般形式可表示為:式中,為模型的參數,ε為隨機誤差項。
  • 統計計量 | 用R做多元線性回歸分析(文末有福利)
    回歸分析是一種統計學上分析數據的方法,目的在於了解兩個或多個變量間是否相關
  • 逐步回歸分析調整後r2和模型的顯著性f值_多元線性回歸方程的顯著...
    多重線性回歸分析簡單線性回歸模型只考慮單因素影響,事實上,影響因變量的因素往往不止一個,可能會有多個影響因素,這就需要用到多重線性回歸分析。多重線性回歸與多元線性回歸區別就看因變量或自變量的個數,多重線性回歸是指包含兩個或兩個以上自變量的線性回歸模型,而多元線性回歸是指包含兩個或兩個以上因變量的線性回歸模型。
  • 多元線性回歸spss結果分析_spss多元線性回歸分析結果分析 - CSDN
    通過查閱北京統計局出示的有關數據以及閱讀相關文獻,搜集北京市近15年的統計資料,基於SPSS多元線性回歸中的逐步回歸分析法,建立回歸模型。
  • 多元回歸分析(multiple linear regression)和判別分析(discriminant analysis)
    研究多個因素間關係及具有這些因素的個體之間的一系列統計分析方法稱為多元(因素)分析。主要包括:多元線性回歸,判別分析,聚類分析,主成分分析,因子分析,典型相關,logistic 回歸,Cox 回歸。本期和下一期公眾號文章將挑選幾個常用的多元統計方法為進行介紹。
  • 學會用多元回歸分析武裝頭腦
    回歸分析是在體育博彩中應用最廣泛的統計方法,在影響比賽結果的因素和結果之間建立定量的聯繫。最常用的回歸方法是多元線性回歸和邏輯回歸,在不同的條件下,可以計算體育比賽某個結果的概率或者直接計算出結果。當因變量是線性的時候適合用線性回歸,比如計算球隊的積分、黃牌數等等;非線性時適合用邏輯回歸,非線性變量其實就是分類變量,比如輸或贏就2種狀態。
  • 原創案例:Matlab多元線性回歸分析-逐步回歸
    在多元線性回歸分析中,逐步回歸法是對多個變量進行分析的有效方法。逐步回歸的基本思想是逐個引入自變量,保留影響顯著的變量,剔除影響不顯著的變量,最終使得回歸方程擬合度趨於完美。在Matlab中,函數stepwise的功能就是對需要分析的變量進行逐步回歸,最後得出回歸方程各個擬合信息。Stepwise的簡單用法是stepwize(X,Y),X是由若干個自變量列向量組成的矩陣,Y是由因變量構成的列向量。
  • r語言多元線性回歸相關性_多元線性回歸調整相關性 - CSDN
    多元線性回歸多元線性回歸的核心問題:應該選擇哪些變量???RSS(殘差平方和)與R2  (相關係數的平方)選擇法:遍歷所有可能的組合,選出使RSS最小,R2  最大的模型。
  • 四行代碼搞定多元回歸分析,教你預測未來
    如果你確實想要得知這些問題,那麼多元回歸分析正可以幫助到你。多元回歸分析由於分析多種信息之間存在的聯繫而十分有趣。它不只是簡單地分析事物和另外一件事物的關聯——就像簡單線性回歸那樣,而是可以幫助你處理許多不同事物和你想要預測事物之間的關係。
  • SPSS多元線性回歸案例:回歸分析方法實戰
    回歸分析是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析,時間序列模型以及發現變量之間的因果關係。使用曲線/線來擬合這些數據點,在這種方式下,從曲線或線到數據點的距離差異最小。
  • 多元回歸樹分析Multivariate Regression Trees,MRT
    回歸樹建模的原理與方法多元回歸樹的計算通常分兩步來完成,最初生成一顆較大的樹,然後通過統計估計來刪除底部的一些節點對樹進行修剪,以防止過度擬合併保留最佳的分類方案。1.  數據約束劃分在預測變量(連續型或分類變量)的控制下,通過持續的(或遞歸的)分層將響應變量(連續型變量)不斷分類(亦即分枝),其劃分的依據為這一系列預測變量的解釋變量。
  • 多元線性回歸與模型診斷
    一、多元線性回歸1.