SPSS統計分析案例:一元線性回歸

2021-01-08 數據小兵

微信號後臺有非常之多的關於回歸分析的留言,作為最常見的統計分析方法,在工作生活中的應用需求量巨大,這兩天已經為大家選好了案例數據,先從一元線性回歸分析開始。

一元線性回歸,顧名思義,僅有一個自變量的回歸模型,研究的是一個因素對結果的影響,可以用於預測,也經常被稱之為簡單線性回歸分析。它的模型表達式為:

Y=a+bX+e

回歸的過程就是要確定截距a和回歸係數b的具體值,當然前提條件是模型具備統計學意義。

看案例:

案例數據很好理解,是常見的銷售數據,反映的是某公司太陽鏡一年12個月的具體銷售情況。試分析當廣告費用為15萬元時,預測當月的銷售量值。

幾乎所有的回歸分析問題,首先都從一個散點圖開始,散點圖能夠快速而且直觀的看到自變量和應變量之間是否包含線性關係,如果圖形上看不出明顯線性關係的話,後續的分析效果也不會太好。

散點圖菜單步驟:圖形→舊對話框→散點圖→簡單算點圖,自變量廣告費用用作X軸,銷售量用作Y軸。

由散點圖可以看出,增加廣告投入銷售量隨之上升,一個正相關線性關係,圖示的作用在於讓我們對預測銷售量充滿信心,接下來開始一元線性回歸。

一調出主面板

菜單欄中點擊【分析】→【回歸】→【線性】,彈出線性回歸主功能面板,銷售量作為因變量,廣告費用作為自變量,散點圖顯示二者有較強的線性關係,我們將採取強制【輸入】的方法要求建立一元回歸模型。

二統計按鈕參數設置

默認勾選回歸係數的【估算值】,要求SPSS軟體為我們輸出回歸係數,也就是模型中的參數b,同時默認勾選【模型模擬】,要求軟體幫助我們建議回歸模型是否具有統計學意義。

以上這兩個參數是線性回歸分析必選設置,不能忽略不計。在此基礎上,我們可以根據實際需要選擇其他參數。

本案例勾選【德賓沃森】,要求就模型殘差進行Durbin Watson檢驗,用於判斷殘差是否獨立,作為一個基礎條件來判斷數據是否適合做線性回歸。

三圖按鈕參數設置

上半部分有些複雜,允許我們定製殘差的圖形,作為入門理解,此處建議直接勾選底部【直方圖】和【正態概率圖】,要求軟體輸出標準化殘差圖,同樣用於判斷數據是否適合進行線性回歸。

四保存按鈕參數設置

我們此處分析的目的是為了利用廣告費用來預測銷售量,保存按鈕參數與預測和殘差有關,可以勾選【未標準化】預測值。

在這個對話框上面,有許多參數可選,嚴謹態度出發的話,建議在這裡深入學習,本例暫時不討論。

五選項按鈕參數設置

這裡建議接受軟體默認選項即可。

主要參數基本設置完成,現在點擊主面板下方的【確定】按鈕,要求SPSS開始執行此次簡單線性回歸分析過程,我們坐等結果。

六主要結果解釋

1、模型摘要表

第三列R方,在線性回歸中也稱為判定係數,用於判定線性方程擬合優度的重要指標,體現了回歸模型解釋因變量變異的能力,通常認為R方需達到60%,最好是80%以上,當然是接近1更好。

本例R方=0.93,初步判斷模型擬合效果良好。

2、方差分析表

剛才我們建立的回歸模型是不是有統計意義,增加廣告費用可銷售量這樣的線性關係是否顯著,方差分析表可以回答這些問題。

直接讀取最後一列,顯著性值=0.000<0.01<0.05,表明由自變量「廣告費用」和因變量「銷售量」建立的線性關係回歸模型具有極顯著的統計學意義。

3、回歸係數表

這是有關此處建模的最直接結果,讀取未標準化係數,我們可以輕鬆寫出模型表達式,如下:

Y=76.407+7.662X

關鍵的是,自變量廣告費用的回歸係數通過檢驗,t檢驗原假設回歸係數沒有意義,由最後一列回歸係數顯著性值=0.000<0.01<0.05,表明回歸係數b存在,有統計學意義,廣告費用與銷售量之間是正比關係,而且極顯著。

OK,現在我們有了回歸模型表達式在手裡,心裡總會油然沉甸甸的,因為就連小學生都知道,只要把廣告費用的具體值帶入回歸方程式中,就可以輕鬆計算出對應的銷售量數據。

不急,在開始預測前還有一項關鍵操作,我們需要檢驗數據是否可以做回歸分析,它對數據的要求是苛刻的,有必要就殘差進行分析。

七適用性檢驗

1、殘差正態性檢驗

從標準化殘差直方圖來看,呈一個倒扣的鐘形,左右兩側不完全對稱,有一定瑕疵;從標準化殘差的P-P圖來看,散點並沒有全部靠近斜線,並不完美,綜合而言,殘差正態性結果不是最好的,當然在現實分析當中,理想狀態的正態並不多見,接近或近似即可考慮接受。

2、模型殘差獨立性檢驗

採用Durbin Watson檢驗來判斷,回過頭來再看模型摘要表。

DW=1.464,查詢 Durbin Watson table 可以發現本例DW值恰好出在無自相關性的值域之中,認定殘差獨立,通過檢驗。

實際上關於回歸模型的適應性檢驗還有其他項目,比如異常點、共線性等檢驗項目,本例暫不展開,有興趣的讀者可以自行學習。

根據以上殘差正態性和殘差獨立性檢驗的結果,本例認為案例數據基本滿足線性回歸要求(值得在其他應用中討論,本例僅展示主要過程),所建立的模型可根據擬合質量進行預測。

八預測

通過前面的一系列分析和論證,我們現在已經得到回歸模型的方程式:Y=76.407+7.662X,

我們的預測任務是當廣告投入達15萬元時,太陽鏡的銷售量,具體計算:Y=76.407+7.662*15=191.337,

至此,建立了廣告和銷售量之間的線性回歸模型,並且實施了預測,那麼模型的準確性到底如何呢,有待最終實際銷售比對分析。本例結束。

(文/圖=數據小兵)

(已同步在SPSS統計訓練營微信號原創推送)

相關焦點

  • spss 方法 線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • spss多元線性回歸專題及常見問題 - CSDN
    本文收集整理關於spss多元線性回歸結果解讀的相關議題,使用內容導航快速到達。內容導航:Q1:請高手幫忙分析下SPSS的多元線性回歸結果吧~急啊~~~你的回歸方法是直接進入法擬合優度R方等於0.678,表示自變量可以解釋因變量的67.8%變化,說明擬合優度還可以。
  • SPSS:簡單線性回歸分析(圖文案例)
    分享SPSS統計分析方法,使科學研究更容易。
  • SPSS分析技術:線性回歸分析
    線性回歸分析中,如果僅有一個自變量,可以建立一元線性模型。如果存在多個自變量,則需要建立多元線性回歸模型。線性回歸的過程就是把各個自變量和因變量的個案值帶入到回歸方程式當中,通過逐步迭代與擬合,最終找出回歸方程式中的各個係數,構造出一個能夠儘可能體現自變量與因變量關係的函數式。在一元線性回歸中,回歸方程的確立就是逐步確定唯一自變量的係數和常數,並使方程能夠符合絕大多數個案的取值特點。
  • 科研SPSS統計思維實戰研討會
    為了便於掌握,下述問題將會包含到課程案例分析中,而不會按下述清單依次講解)1) 為什麼說目前科研設計與統計分析質量令人擔憂?2) 如何培養統計思維?統計思維的常見誤區有哪些?43) 萬變不離其中的統計設計與布局思想,如何把握統計的核心?44) 一元統計與多元統計的區別及核心?
  • SPSS多元線性回歸案例:回歸分析方法實戰
    回歸分析是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析,時間序列模型以及發現變量之間的因果關係。使用曲線/線來擬合這些數據點,在這種方式下,從曲線或線到數據點的距離差異最小。
  • 多元線性回歸預測spss - CSDN
    回歸一直是個很重要的主題。因為在數據分析的領域裡邊,模型重要的也是主要的作用包括兩個方面,一是發現,一是預測。而很多時候我們就要通過回歸來進行預測。關於回歸的知識點也許不一定比參數檢驗,非參數檢驗多,但是複雜度卻絕對在其上。回歸主要包括線性回歸,非線性回歸以及分類回歸。本文主要討論多元線性回歸(包括一般多元回歸,含有虛擬變量的多元回歸,以及一點廣義差分的知識)。
  • spss 非線性回歸 - CSDN
    我們在做問卷分析時,由於因變量多為連續的線性變量,多半會採用線性回歸分析來研究變量之間的關係。此時,一般資料或者人口學變量中,就會含有很多分組或分類的變量,比如性別,學歷等等。 如果因變量在這些人口學變量上存在顯著的差異,那麼做回歸分析時候,就需要將這些存在顯著差異的人口學變量作為控制變量納入線性回歸分析。
  • SPSS統計分析案例:多項logistic回歸分析
    小兵博客幾年前分享的二項logistic回歸分析案例非常受歡迎,在實際應用中,可能還會碰到因變量是多個分類的情況,並且不包含排序信息。比如視力分為輕度、中度、重度三個水平,此時如果想考察影響視力評價的指標,常用的二項logistic回歸已經無法勝任。幸好,SPSS軟體為我們提供了多項logistic回歸。
  • SPSS因子分析案例
    【二、簡單實例】現在有 12 個地區的 5 個經濟指標調查數據(總人口、學校校齡、總僱員、專業服務、中等房價),為對這 12 個地區進行綜合評價,請確定出這 12 個地區的綜合評價指標。【三、解決方案】1、spss因子分析同一指標在不同地區是不同的,用單一某一個指標難以對12個地區進行準確的評價,單一指標智能反映地區的某一方面。
  • 線性回歸的統計假設 - CSDN
    在用多元線性回歸模型進行統計推斷之前,我們需要知道該模型的基礎假設。假設我們有n個因變量Y及自變量X1,X2,...,Xk的值,我們想推斷多元回歸方程Yi= b0 + b1X1i + b2X2i + ... + bkXki +εi。
  • 線性回歸分析詳解10(完結篇):線性回歸分析預測的十大步驟
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第10章,這是本專欄的最後一章,是專欄的完結篇:用線性回歸分析做預測,多元線性回歸分析預測的十大步驟。線性回歸分析專格欄總目錄請見上圖,前9章,我分別講述了回歸分析及與回分析相關的概念,一元、多元線性回歸分析的公式與計算方法,以及多重共線性、回歸方程的精度、顯著性驗證和置信區間等進行回歸分析的重要步驟及其計算方法。至此,以回歸分析進行需求預測的各項知識點及各項準備工作全部完成,我們可以正式的以回歸分析進行需求預測。
  • spss線性回歸自變量因變量專題及常見問題 - CSDN
    該研究想建立變量(pH、SOM、SAN等)與產量之間的回歸方程,此時我們可以考慮採用多元線性回歸分析。點擊 分析 → 回歸 → 線性。2.將pH等自變量選入自變量框,將產量選入因變量框,點擊統計。3.在統計窗口選擇共線性診斷,點擊繼續,然後再主頁面點擊確定即可。
  • 基本數據統計分析--spss
    在數據分析工作中,描述性統計分析是我們日常使用率最高的,主要的基本統計分析維度包括但不限於均值、 中位數、眾數、方差、百分位、頻數、峰度、偏度、探索分析、交叉聯列表分析、多選項分析、基本統計報表製作等。而這些功能操作在spss中是可以直接使用的。當然我們也需要理解相關定義。
  • 數據分析難?教你spss使用的正確姿勢
    軟體不會用,各種數據傻傻搞不清楚,尤其是怎麼分析數據更是暈頭轉向,當然跟著靠譜的老師學習,一邊看實操一邊自己做,這樣肯定事半功倍。本次我們整理出了spss的數據分析教程,都是有實操的,只要跟著做,絕對沒問題!
  • 多元線性回歸spss結果分析_spss多元線性回歸分析結果分析 - CSDN
    通過查閱北京統計局出示的有關數據以及閱讀相關文獻,搜集北京市近15年的統計資料,基於SPSS多元線性回歸中的逐步回歸分析法,建立回歸模型。
  • 一元線性回歸模型容易理解嗎?讓公式和變量來告訴你!
    什麼是一元線性回歸模型?一元回歸模型,也叫簡單線性回歸,是統計學中最為基礎的部分,也是數理統計中的入門必會模型。在實際研究當中常用於預測一個變量如何隨另一個變量而變化,例如一件商品的購買意願是否會隨著商品的定價變化而變化,這其中的變化關係如何去刻畫描摹,這時就需要搭建一元回歸模型來進行檢驗。一元回歸模型的數據要求是什麼?因變量(Y):被預測的變量,也叫被解釋變量,例如購買意願,以李克特7級量表打分為例(購買意願分為1-7,得分越高,購買意願越強)。
  • 機器學習的線性回歸分析
    打開APP 機器學習的線性回歸分析 是DRR啊 發表於 2020-01-23 17:33:00 概述 線性回歸是利用數理統計中回歸分析
  • SPSS加權線性回歸案例實踐,解決異方差問題
    線性回歸時要求殘差方差齊次,通俗理解為所有的觀測數據在計算過程中具有相同的貢獻。但是實踐中有時候會出現殘差方差不齊的情況,此時普通最小二乘法不再適用。 通常來說,此類情況可以使用加權的最二乘法(WLS)擬合線性回歸模型。WLS會降低具有較大方差的觀測數據對分析過程的影響。
  • 零基礎的同學如何用stata做一元線性回歸模型?
    stata軟體越來越受研究生的喜歡,很多研究生在做統計研究、學術分析的時候,也多選用此軟體。網上有關stata的教程有很多,但對於沒有基礎的同學來說,學起來稍微就有些吃力了。那麼,零基礎的同學應該如何學習呢?如何用stata做出滿意的一元線性回歸模型呢 ?