回歸是一種統計方法,可讓我們了解自變量和因變量之間的關係。
逐步回歸是回歸分析中一種篩選變量的過程,我們可以使用逐步回歸從一組候選變量中構建回歸模型,讓系統自動識別出有影響的變量。
理論說明
逐步回歸,是通過逐步將自變量輸入模型,如果模型具統計學意義,並將其納入在回歸模型中。同時移出不具有統計學意義的變量。最終得到一個自動擬合的回歸模型。其本質上還是線性回歸。
一、研究背景
研究人員針對血壓與年齡,體重,體表面積,持續時間,脈搏率、壓力水平之間是否存在關係進行研究。
二、操作步驟
首先,可以分別對變量做相關分析或散點圖,初步了解各自變量X與因變量Y的關係。
登錄SPSSAU,選擇【通用方法】--【相關】或【可視化】--【散點圖】。
相關分析
從相關分析結果看,年齡、體重、體表面積、脈搏頻率與血壓有顯著的正相關關係。
然後,再利用逐步回歸進行分析。選擇【進階方法】--【逐步回歸】。
進階方法-逐步回歸
逐步回歸
逐步回歸
逐步回歸分析僅在回歸分析的基礎上,加入了一項功能,即自動化移除掉不顯著的X,通常逐步回歸分析用於探索研究中。
指標說明
在分析時,可首先對模型情況進行分析,然後分析X的顯著性,並判斷X對Y的影響關係大小及方向。
根據回歸結果顯示,最終模型共包含年齡、體重、體表面積共3個自變量。R方值為0.995,意味著年齡,體重,體表面積可以解釋血壓的99.5%變化原因,說明模型構建較好。
最終具體分析可知:
年齡的回歸係數值為0.702(t=15.961,p=0.000<0.01),意味著年齡會對血壓產生顯著的正向影響關係。
體重的回歸係數值為0.906(t=18.490,p=0.000<0.01),意味著體重會對血壓產生顯著的正向影響關係。
體表面積的回歸係數值為4.627(t=3.042,p=0.008<0.01),意味著體表面積會對血壓產生顯著的正向影響關係。
總結分析可知:年齡, 體重, 體表面積會對血壓產生顯著的正向影響關係。
三、其他說明
逐步回歸雖然是很好的選擇自變量的方法,但同時這種方法也存在一些缺陷:
首先,該方法按一定順序添加或刪除變量,所以最終會得到由該順序確定的自變量組合,由系統自動判斷哪些變量應該保留,哪些需要移除,可能會出現核心研究變量被移除的情況。
其次,如果逐步回歸結果會收到樣本量的影響,一般需要適當的大樣本才能獲得較為可靠的分析結果。