使用Excel數據分析工具進行多元回歸分析與簡單的回歸估算分析方法基本相同。但是由於有些電腦在安裝辦公軟體時並未加載數據分析工具,所以從加載開始說起(以Excel2010版為例,其餘版本都可以在相應界面找到)。
點擊「文件」,如下圖:
在彈出的菜單中選擇「選項」,如下圖所示:
在彈出的「選項」菜單中選擇「加載項」,在「加載項」多行文本框中使用滾動條找到並選中「分析工具庫」,然後點擊最下方的「轉到」,如下圖所示:
在彈出的「加載宏」菜單中選擇「分析工具庫」,然後點擊 「確定」,如下圖所示:
加載完畢,在「數據」工具欄中就出現「數據分析」工具庫,如下圖所示:
給出原始數據,自變量的值在A2:I21單元格區間中,因變量的值在J2:J21中,如下圖所示:
假設回歸估算表達式為:
試使用Excel數據分析工具庫中的回歸分析工具對其回歸係數進行估算並進行回歸分析:
點擊「數據」工具欄中中的「數據分析」工具庫,如下圖所示:
在彈出的「數據分析」-「分析工具」多行文本框中選擇「回歸」,然後點擊 「確定」,如下圖所示:
彈出「回歸」對話框並作如下圖的選擇:
上述選擇的具體方法是:
在「Y值輸入區域」,點擊右側摺疊按鈕,選取函數Y數據所在單元格區域J2:J21,選完後再單擊摺疊按鈕返回;這過程也可以直接在「Y值輸入區域」文本框中輸入J2:J21;
在「X值輸入區域」,點擊右側摺疊按鈕,選取自變量數據所在單元格區域A2:I21,選完後再單擊摺疊按鈕返回;這過程也可以直接在「X值輸入區域」文本框中輸入A2:I21;
置信度可選默認的95%。
在「輸出區域」如選「新工作表」,就將統計分析結果輸出到在新表內。為了比較對照,我選本表內的空白區域,左上角起始單元格為K10.點擊確定後,輸出結果如下:
第一張表是「回歸統計表」(K12:L17):
其中:
Multiple R:(復相關係數R)R2的平方根,又稱相關係數,用來衡量自變量x與y之間的相關程度的大小。本例R=0.9134表明它們之間的關係為高度正相關。(Multiple:複合、多種)
R Square:複測定係數,上述復相關係數R的平方。用來說明自變量解釋因變量y變差的程度,以測定因變量y的擬合效果。此案例中的複測定係數為0.8343,表明用用自變量可解釋因變量變差的83.43%
Adjusted R Square:調整後的複測定係數R2,該值為0.6852,說明自變量能說明因變量y的68.52%,因變量y的31.48%要由其他因素來解釋。( Adjusted:調整後的)
標準誤差:用來衡量擬合程度的大小,也用於計算與回歸相關的其它統計量,此值越小,說明擬合程度越好
觀察值:用於估計回歸方程的數據的觀察值個數。
第二張表是「方差分析表」:主要作用是通過F檢驗來判定回歸模型的回歸效果。
該案例中的Significance F(F顯著性統計量)的P值為0.00636,小於顯著性水平0.05,所以說該回歸方程回歸效果顯著,方程中至少有一個回歸係數顯著不為0.(Significance:顯著)
第三張表是「回歸參數表」:
K26:K35為常數項和b1~b9的排序默認標示.
L26:L35為常數項和b1~b9的值,據此可得出估算的回歸方程為:
該表中重要的是O列,該列的O26:O35中的 P-value為回歸係數t統計量的P值。
值得注意的是:其中b1、b7的t統計量的P值為0.0156和0.0175,遠小於顯著性水平0.05,因此該兩項的自變量與y相關。而其他各項的t統計量的P值遠大於b1、b7的t統計量的P值,但如此大的P值說明這些項的自變量與因變量不存在相關性,因此這些項的回歸係數不顯著。