最是人間留不住,朱顏辭鏡花辭樹。
——王國維詞《蝶戀花》
回歸分析是一種處理變量的統計相關關係的一種數理統計方法。
回歸分析的基本思想是: 雖然自變量和因變量之間沒有嚴格的、確定性的函數關係, 但可以設法找出最能代表它們之間關係的數學表達形式。
回歸分析是建立因變量Y(response variables, dependent variables)與自變量X(predictors, independent variables)之間關係的模型。
回歸分析按照自變量的不同,分為一元回歸分析、多元回歸分析,按照模型類型分為線性回歸和非線性回歸。
一元線性回歸是一個主要影響因素作為自變量來解釋因變量的變化,在現實問題研究中,因變量的變化往往受幾個重要因素的影響,此時就需要用兩個或兩個以上的影響因素作為自變量來解釋因變量的變化,這就是多元回歸亦稱多重回歸。當多個自變量與因變量之間是線性關係時,所進行的回歸分析就是多元性回歸。 設y為因變量X1,X2…Xk為自變量,並且自變量與因變量之間為線性關係時,則多元線性回歸模型為:
Y=b0+b1x1+…+bkxk+e
其中,b0為常數項,b1,b2…bk為回歸係數。多元線性回歸採用最小二乘法進行估計。
選擇File-Open-Data,打開gaoxueya.sav數據文件。
選擇Analyse-Regression-Linear:
在出來的對話框中,將血壓y選入Dependent變量框,x1、x2、x3選入Independent變量框,點擊ok。
在出來的對話框中,將血壓y選入Dependent變量框,x1、x2、x3選入Independent變量框,點擊ok。
得到如下結果:
上圖是模型擬合優度的檢驗。結果顯示,模型可決係數R Square為0.801,模型擬合結果較好。
上圖是回歸模型假設檢驗的結果。結果顯示,F值為37.669,p值為0.000<0.05,說明建立的回歸模型有統計學意義,至少有一個自變量的回歸係數不為0。
上圖是回歸模型估計的結果。結果顯示,x1年齡的估計係數為1.547,對應t值為6.798,p值為0.000<0.05,該估計係數顯著,說明血壓與年齡有顯著關係,且為正的;x2吸菸的估計係數為8.992,對應t值為3.670,p值為0.001<0.05,該估計係數顯著,說明血壓與吸菸有顯著關係,且為正的;x3體重指數的估計係數為3.195,對應t值為1.601,p值為0.12>0.05,該估計係數不顯著,說明血壓與年齡沒有顯著關係。
歡迎掃碼關注,若有問題,請點擊「在看」留言或在公眾號裡留言。