SPSS加權線性回歸案例實踐,解決異方差問題

2021-01-08 騰訊網

線性回歸時要求殘差方差齊次,通俗理解為所有的觀測數據在計算過程中具有相同的貢獻。但是實踐中有時候會出現殘差方差不齊的情況,此時普通最小二乘法不再適用。

通常來說,此類情況可以使用加權的最二乘法(WLS)擬合線性回歸模型。WLS會降低具有較大方差的觀測數據對分析過程的影響。

案例背景介紹

現在我想用歷史數據來預測一個新商業街的成本,解釋變量包括面積、商業街種類(室內、戶外)、建築師從業年數。

先測試普通線性回歸擬合的殘差表現,以成本為因變量,以面積、商業街種類、建築師從業年數為自變量做線性回歸,我們輸出一個殘差散點圖,如下:

觀察發現,殘差有逐漸放大的趨勢,初步判斷殘差方差不齊。圖形法是最為簡便的辦法,推薦大家常用。

現在結論是線性回歸不適用了,殘差的方差不齊,怎麼辦?小兵來測試使用加權的回歸分析。

首先估算權重

加權加權,那我們首先得有權重才行。這個權重可不是隨便指定一個,它應當是隨著觀察數據的變異和變化的。

SPSS提供了【估算權重】的專用菜單,需要用戶指定一個與因變量相關的連續數據變量作為權重計算的基礎。

在SPSS頂部菜單欄打開【分析】【回歸】【權重估算】對話框。

(1)以成本為因變量,以面積、商業街種類、建築師從業年數為自變量;

(2)根據專業知識,本例選擇面積自變量來估計權重,權重為1/權重變量k次方;

(3)命令SPSS幫我們尋找最佳的冪k,本例為快速確認冪k,從[3,5]間以0.1為步長進行尋優;

(4)【選項】按鈕打開,勾選【將最佳權重保存為新變量】;

SPSS執行後我們來看結果:

冪k從3開始,3.1到3.2,依次遞進到5,每次都計算一個對數似然值(不用管它原理),注意標準哦:對數似然值取最大時對應指數就是我們要確認的最佳冪k。顯然本例k取3.5時,對數似然值最大。

因此k=3.5,權重為1/面積變量的3.5次方。這些我們不用自己計算了,SPSS已經幫我們計算並另存為一個新變量。

在SPSS的數據視圖下,我們會看到新增了一個變量,名稱為【WGT_1】這就是我們未來加權的權重數據了。

阿彌陀佛,終於有權重數據了。

開始加權回歸WLS

SPSS菜單欄【分析】【回歸】【線性】。

(1)以成本為因變量,以面積、商業街種類、建築師從業年數為自變量;

(2)以新增的WGT_1為權重變量;

(3)點開【保存】對話框,保存未標準化後的預測值和殘差;

執行加權的線性回歸,來看結果:

前面方差分析結果顯示加權回歸模型有統計學意義(P小於0.01),調整後的R方72.4%,加權的回歸模型解釋能力尚可,具體表格結果此處略。

直接看回歸係數表格。各自變量具有統計學意義。寫出加權的回歸擬合方程如下:

Y=53.44+149.3*面積-26.5*商業街種類-2.2*建築師從業年數

強調一下,加權回歸過程呢不會自動幫我們輸出殘差圖,這需要用戶自行來轉換數據並自行作圖。這一操作略微麻煩一些,不過讀者們千萬不要畏難。

加權回歸輸出的未標準化殘差和預測值,還需要經過轉換後方可用於殘差圖的製作。因此我們需要利用SPSS的【計算變量】功能來轉換回去。目標是生存兩個新的預測值和殘差,轉換的方法是他們本身乘以加權變量的開平方。

Ok,現在做加權回歸的殘差圖。

和未加權回歸殘差相比,加權處理後殘差散點圍繞在ei=0這條直線的上下兩側均勻分布,無明顯規律性變化,說明此處殘差的方差基本能滿足齊次的要求,加權處理起到改善模型的效果。

本文完

文/圖=數據小兵

相關焦點

  • spss 方法 線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • spss多元線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • 計量經濟學之異方差性問題,如何解決?
    在計量經濟學中,一些情況下會出現異方差問題,嚴重的異方差問題會影響模型估計和模型檢驗等,因而在OLS回歸時需要對其進行檢驗,如果出現異方差問題需要進行對應處理。2、white檢驗懷特檢驗是最常用於檢驗異方差的方法。SPSSAU中會自動輸出懷特檢驗結果。3、BP檢驗除此之外,也可用BP檢驗結果判斷,SPSSAU中會自動輸出此結果。如果BP結果與white檢驗結果出現矛盾,建議以懷特檢驗結果為準。通過案例能夠能清楚地說明,下面是關於工資的影響因素的OLS回歸分析。
  • 多元線性回歸預測spss - CSDN
    對於線性回歸的定義主要是這樣的:線性回歸,是基於最小二乘法原理產生古典統計假設下的最優線性無偏估計。是研究一個或多個自變量與一個因變量之間是否存在某種線性關係的統計學方法。這個什麼叫線性回歸,什麼叫最小二乘法,在在高中數學課本裡邊就有涉及。我就不重複了嘿嘿。本質上講一元線性回歸是多元線性回歸的一個特例,因此我們就直接討論多元線性回歸了哈。
  • 用SPSS做方差分析趨勢檢驗
    我之前寫的所有方差分析的案例文章,均沒有提及趨勢檢驗,當我們的數據分析中有這樣的需求之時,自然而然的就會想到應該考察一下是不是存在某種趨勢。 先不說回歸分析,在方差分析裡面就可以解決這個問題,方案則是方差分析的趨勢檢驗過程。
  • SPSS統計分析案例:一元線性回歸
    微信號後臺有非常之多的關於回歸分析的留言,作為最常見的統計分析方法,在工作生活中的應用需求量巨大,這兩天已經為大家選好了案例數據,先從一元線性回歸分析開始。一元線性回歸,顧名思義,僅有一個自變量的回歸模型,研究的是一個因素對結果的影響,可以用於預測,也經常被稱之為簡單線性回歸分析。
  • spss協方差分析
    什麼是協方差分析?協方差分析又稱「共變量分析」,是方差分析的引申和擴大。基本原理是將線性回歸與方差分析結合起來,調整各組平均數和 F 檢驗的實驗誤差項,檢驗兩個或多個調整平均數有無顯著差異,以便控制在實驗中影響實驗效應(因變量)而無法人為控制的協變量(與因變量有密切回歸關係的變量)在方差分析中的影響。好吧,聽不懂。簡單舉個例子來說:有一項研究,想知道男生和女生在跑步後的心率是否有差異。
  • SPSS多元線性回歸案例:回歸分析方法實戰
    1.線性回歸(Linear Regression)線性回歸通常是人們在學習預測模型時首選的技術之一。在這種技術中,因變量是連續的,自變量可以是連續的也可以是離散的,回歸線的性質是線性的。線性回歸使用最佳的擬合直線(也就是回歸線)在因變量(Y)和一個或多個自變量(X)之間建立一種關係。
  • SPSS:簡單線性回歸分析(圖文案例)
    線性回歸是用直線回歸方程表示兩個數量變量間依存關係的統計分析方法。如果某一個變量隨著另一個變量的變化而變化,並且它們的變化在直角坐標系中呈直線趨勢,就可以用一個直線方程來定量地描述它們之間的數量依存關係。線性回歸分析中兩個變量的地位不同,其中因變量(y)是依賴自變量(x)而變化。
  • 線性回歸的幾何與概率視角
    Content線性回歸-幾何視角線性回歸-概率視角Pseudo-inverse偽逆的介紹局部加權線性回歸多個output的線性回歸情況線性回歸的幾何角度這也和現實裡面的情況相符,比方說我們認為某個時刻的股價受周圍幾天的股價影響較大,而更遠的股價對這個時刻的股價影響較小。借用一個知乎上給出一個例子,我們可以看到局部加權回歸相較於OLS線性回歸的強大之處。這是我們要擬合的一個data,顯然如果使用OLS會是一個欠擬合的結果。
  • spss 非線性回歸 - CSDN
    我們在做問卷分析時,由於因變量多為連續的線性變量,多半會採用線性回歸分析來研究變量之間的關係。此時,一般資料或者人口學變量中,就會含有很多分組或分類的變量,比如性別,學歷等等。 如果因變量在這些人口學變量上存在顯著的差異,那麼做回歸分析時候,就需要將這些存在顯著差異的人口學變量作為控制變量納入線性回歸分析。
  • SPSS分析技術:線性回歸分析
    基礎回顧相關分析可以揭示事物之間共同變化的一致性程度,但它僅僅只是反映出了一種相關關係,並沒有揭示出變量之間準確的可以運算的控制關係,也就是函數關係,不能解決針對未來的分析與預測問題
  • 多元線性回歸與模型診斷
    Python案例分析:#導入cv模塊import numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltimport pandas as pddata=pd.read_excel('D:/歐晨的金學智庫/線性回歸案例.xlsx
  • 科研SPSS統計思維實戰研討會
    4、 課程內容實用性強,均為科研工作中一定會使用到的內容,且從案例、問題出發,知識更立體,更能學以致用。課程設計不是為了考試,而是解決實際問題,因此可按照真實應用情況安排課程重點。課程解決的問題:(包含但不限於以下問題,由於重在思維推理,因此更多核心還見現場課程。
  • CFA二級:線性回歸假設的違反,識別與處理「量化方法分析」
    以上六個假設如果有一個或多個被違反,則線性回歸分析的結果會有問題,最常見的三個問題是異方差性、序列相關與多重共線性。針對以上三個問題,我們需要明確:   (1)問題的含義是什麼?   (2)它對回歸分析的影響;   (3)如何識別這些問題?   (4)如何處理這些問題?
  • spss線性回歸自變量因變量專題及常見問題 - CSDN
    轉載自公眾號:青年智囊SPSS多元線性回歸在回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元回歸。事實上,一種現象常常是與多個因素相聯繫的,由多個自變量的最優組合共同來預測或估計因變量,比只用一個自變量進行預測或估計更有效,更符合實際,因此多元線性回歸被廣泛運用。今天大家一起來學習吧!
  • SPSS因子分析案例
    【二、簡單實例】現在有 12 個地區的 5 個經濟指標調查數據(總人口、學校校齡、總僱員、專業服務、中等房價),為對這 12 個地區進行綜合評價,請確定出這 12 個地區的綜合評價指標。【三、解決方案】1、spss因子分析同一指標在不同地區是不同的,用單一某一個指標難以對12個地區進行準確的評價,單一指標智能反映地區的某一方面。
  • spss多元線性回歸模型專題及常見問題 - CSDN
    多元線性回歸,主要是研究一個因變量與多個自變量之間的相關關係,跟一元回歸原理差不多,區別在於影響因素(自變量)更多些而已,例如:一元線性回歸方程 為:    毫無疑問,多元線性回歸方程應該為:2:無偏性假設,即指:期望值為03:同共方差性假設,即指,所有的  隨機誤差變量方差都相等4:獨立性假設,即指:所有的隨機誤差變量都相互獨立,可以用協方差解釋。   今天跟大家一起討論一下,SPSS---多元線性回歸的具體操作過程,下面以教程教程數據為例,分析汽車特徵與汽車銷售量之間的關係。
  • 職場SPSS:最優尺度回歸統計分析案例
    普通線性回歸對數據的要求十分嚴格,當遇到分類變量時,線性回歸無法準確地反映分類變量不同取值的距離,比如性別變量,男性和女性本身是平級的,沒有大小、順序、趨勢區分,若直接納入線性回歸模型,則可能會失去自身的意義。最優尺度回歸就是為了解決類似問題,它擅長將分類變量不同取值進行量化處理,從而將分類變量轉換為數值型進行統計分析。
  • SPSS方差分析方法與實例演練
    在數據分析過程中,為了進行兩組以上均數的比較,往往可以使用方差分析方法。那麼我們一起了解一下方差分析基本概念、 單因素方差分析、 多因素方差分析及協方差分析;同時在spss中的操作演練。方差分析的前提條件,即不同水平下,各總體均值服從方差相同的正態分布,因此方差分析問題就轉換成研究不同水平下各個總體的均值是否有顯著差異的問題。