使用Excel數據分析工具進行多元回歸分析

2021-02-13 上海數據

使用Excel數據分析工具進行多元回歸分析與簡單的回歸估算分析方法基本相同。但是由於有些電腦在安裝辦公軟體時並未加載數據分析工具,所以從加載開始說起(以Excel2010版為例,其餘版本都可以在相應界面找到)。

點擊「文件」,如下圖:



在彈出的菜單中選擇「選項」,如下圖所示:

在彈出的「選項」菜單中選擇「加載項」,在「加載項」多行文本框中使用滾動條找到並選中「分析工具庫」,然後點擊最下方的「轉到」,如下圖所示:

在彈出的「加載宏」菜單中選擇「分析工具庫」,然後點擊 「確定」,如下圖所示:


加載完畢,在「數據」工具欄中就出現「數據分析」工具庫,如下圖所示:

給出原始數據,自變量的值在A2:I21單元格區間中,因變量的值在J2:J21中,如下圖所示:



假設回歸估算表達式為:

試使用Excel數據分析工具庫中的回歸分析工具對其回歸係數進行估算並進行回歸分析:

點擊「數據」工具欄中中的「數據分析」工具庫,如下圖所示:

在彈出的「數據分析」-「分析工具」多行文本框中選擇「回歸」,然後點擊 「確定」,如下圖所示:


彈出「回歸」對話框並作如下圖的選擇:

上述選擇的具體方法是:

在「Y值輸入區域」,點擊右側摺疊按鈕,選取函數Y數據所在單元格區域J2:J21,選完後再單擊摺疊按鈕返回;這過程也可以直接在「Y值輸入區域」文本框中輸入J2:J21;

在「X值輸入區域」,點擊右側摺疊按鈕,選取自變量數據所在單元格區域A2:I21,選完後再單擊摺疊按鈕返回;這過程也可以直接在「X值輸入區域」文本框中輸入A2:I21;

置信度可選默認的95%。

在「輸出區域」如選「新工作表」,就將統計分析結果輸出到在新表內。為了比較對照,我選本表內的空白區域,左上角起始單元格為K10.點擊確定後,輸出結果如下:


第一張表是「回歸統計表」(K12:L17):

其中:

Multiple R:(復相關係數R)R2的平方根,又稱相關係數,用來衡量自變量x與y之間的相關程度的大小。本例R=0.9134表明它們之間的關係為高度正相關。(Multiple:複合、多種)

R Square:複測定係數,上述復相關係數R的平方。用來說明自變量解釋因變量y變差的程度,以測定因變量y的擬合效果。此案例中的複測定係數為0.8343,表明用用自變量可解釋因變量變差的83.43%

Adjusted R Square:調整後的複測定係數R2,該值為0.6852,說明自變量能說明因變量y的68.52%,因變量y的31.48%要由其他因素來解釋。( Adjusted:調整後的)

標準誤差:用來衡量擬合程度的大小,也用於計算與回歸相關的其它統計量,此值越小,說明擬合程度越好

觀察值:用於估計回歸方程的數據的觀察值個數。

第二張表是「方差分析表」:主要作用是通過F檢驗來判定回歸模型的回歸效果。

該案例中的Significance F(F顯著性統計量)的P值為0.00636,小於顯著性水平0.05,所以說該回歸方程回歸效果顯著,方程中至少有一個回歸係數顯著不為0.(Significance:顯著)

第三張表是「回歸參數表」:

K26:K35為常數項和b1~b9的排序默認標示.

L26:L35為常數項和b1~b9的值,據此可得出估算的回歸方程為:

該表中重要的是O列,該列的O26:O35中的 P-value為回歸係數t統計量的P值。

值得注意的是:其中b1、b7的t統計量的P值為0.0156和0.0175,遠小於顯著性水平0.05,因此該兩項的自變量與y相關。而其他各項的t統計量的P值遠大於b1、b7的t統計量的P值,但如此大的P值說明這些項的自變量與因變量不存在相關性,因此這些項的回歸係數不顯著。

相關焦點

  • 用Excel進行數據分析:回歸分析
    在日常數據分析工作當中,回歸分析是應用十分廣泛的一種數據分析方法,按照涉及自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關係類型
  • SPSS大戰多元回歸分析
    使用多元回歸進行數據分析,分析軟體供選擇的比較多,主要有Eviews、Spss、Stata、Sas、Gretel等。
  • 案例 統計學之多元線性回歸分析
    現在,我們有12名一年級女大學生體重,身高與肺活量的數據。這裡就要用到統計學上另一種重要的統計方法:多元線性回歸分析。多元線性回歸分析就是研究一個因變量(這裡是:肺活量)和多個自變量(這裡是:體重和身高)之間的關係。和上回介紹的一元線性回歸方程差不多,多元線性回歸方程只是增加了一個自變量而已:ŷ=a+b1x1+ b2x2。 x1和x2為2個自變量,y為因變量。在上面這個例子中,身高是x1;體重是x2;而肺活量就是y。
  • 像Excel一樣使用python進行數據分析
    來自: 藍鯨的網站分析筆記  ID:bluewhale_cc《像Excel一樣使用python進行數據分析》這也是藍鯨大師的新書
  • Excel作為一種強大的數據挖掘工具,數據分析是做什麼的
    數據挖掘工具(方法)中神經網絡、購物籃分析,粗糙(Rough)集、對應分析(雙尺度法)、主成分分析、聚類分析等。 (2)預測;利用數萬個數據進行預測,最有效的方法是神經網絡法,它是具有強大功能的工具,即使數據是非線性關係也無妨。伹缺點是,需要大量數據並且因子分析的功能弱。
  • 多元線性回歸分析
    多元線性回歸建立模型並不難,但需要認證考察多元線性分析的條件,以及建立的模型是否能夠最優的擬合數據。分析步驟:(1)適用條件考察及處理:線性趨勢、獨立、正態、方差齊、不存在多重共線等,同時要注意強影響點。(2)建立回歸模型,並進行模型和偏回歸係數的假設檢驗。
  • excel數據分析工具庫系列三回歸分析
    今天跟大家分享excel數據分析工具庫系列三——回歸分析!
  • 機器學習:回歸分析——Logistic回歸分析
    Logistic回歸是使用多元非線性回歸來預測離散型因變量的模型,尤其對於二分類變量的預測,可以認為該模型是一種分類技術。作為一種廣義的線性回歸分析模型,常用於數據挖掘,疾病自動診斷,經濟預測等領域。下面的示例中將使用Sklearn.linear_model模塊中LogisticRegression函數,對客戶是否會及時還信用卡欠款的數據進行預測。
  • 如何使用SPSS進行數據分析工作
    SPSS是一款非常強大的數據處理軟體,那麼該如何用SPSS進行數據分析呢?
  • Excel數據分析:相關係數、協方差、回歸的案例演示【超詳細!!】
    Excel中的相關係數工具是單相關係數。2. 相關係數工具的使用CORREL 和 PEARSON 工作表函數均可計算兩個測量值變量之間的相關係數,條件是每種變量的測量值都是對 N 個對象進行觀測所得到的。(丟失任何對象的任何觀測值都會導致在分析中忽略該對象。)相關係數分析工具特別適合於當 N 個對象中的每個對象都有兩個以上的測量值變量的情況。
  • 如何使用Excel進行數據分析?
    各項因素對結果的影響可以使用Excel 的相關係數工具來進行分析,通過對比各項因素的相關係數來判斷客觀的影響力度。1.注意事項數據分析的對象雖然不僅僅局限於純粹的數字類信息,但是Excel 分析工具只能對數據類信息進行處理。因此在使用Excel 分析工具時要靈活地將文字、圖形類信息轉化為數據信息。
  • SPSS數據分析多元回歸分析陳金文老師手把手教學
    多元回歸,是研究一個因變量、與兩個或兩個以上自變量的回歸,是反映一種現象或事物的數量,依多種現象或事物的數量的變動而相應地變動的規律。多元回歸的應用:(1) 確定幾個特定的變量之間是否存在相關關係,如果存在的話,找出它們之間合適的數學表達式;(2) 根據一個或幾個變量的值, 預測或控制另一個變量的取值,並且可以知道這種預測或控制能達到什麼樣的精確度;(3) 進行因素分析。
  • 數據分析工具你用對了嗎?SPSS、SAS、R、Python、Excel...
    殊不知一款好的數據分析工具可以讓你事半功倍,瞬間提高學習工作效率。雖然數據分析的工具千萬種,綜合起來萬變不離其宗。無非是數據獲取、數據存儲、數據管理、數據計算、數據分析、數據展示等幾個方面。而SAS、R、SPSS、python、excel是被提到頻率最高的數據分析工具。那麼,這些工具本身到底有什麼特點呢?
  • 用Excel進行供應鏈數據分析:如何判斷正態分布
    前幾集連結如下用Excel進行供應鏈數據分析:ABC 法詳解(附視頻)用Excel進行供應鏈數據分析:生成月度銷售數據(附視頻)用Excel進行供應鏈數據分析:獲取外部數據(附視頻)用Excel函數實現庫存分析、控制和預測用Excel函數實現庫存分析和供應鏈預測
  • 使用Matlab解決多元線性回歸問題
    上期我們分享了使用matlab進行數組最值的搜尋,有同學留言想了解matlab多元線性回歸,安排!
  • 四行代碼搞定多元回歸分析,教你預測未來
    如果你確實想要得知這些問題,那麼多元回歸分析正可以幫助到你。多元回歸分析由於分析多種信息之間存在的聯繫而十分有趣。它不只是簡單地分析事物和另外一件事物的關聯——就像簡單線性回歸那樣,而是可以幫助你處理許多不同事物和你想要預測事物之間的關係。線性回歸模型是一種數據模型,經常適用於數據科學,也是機器學習中的一個基礎構建塊。多元回歸分析(MLR)是一種數據技術,可以使用一些變量來預測不同變量的結果。其旨在建造自變量和因變量之間的線性關係。它展現了多種自變量如何與一種因變量相關聯。
  • SPSS多元線性回歸案例:回歸分析方法實戰
    回歸分析是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析,時間序列模型以及發現變量之間的因果關係。使用曲線/線來擬合這些數據點,在這種方式下,從曲線或線到數據點的距離差異最小。
  • 教你幾個Excel常用的數據分析技巧!
    其實微軟給我們開了個玩笑,它將一些好用的功能給隱藏起來了,比如「數據分析」,「規劃求解」工具欄。我也是在使用mac之後才發現,原來微軟是提供這兩個工具欄的,想想以前,真是被騙了好久……下面以2010版excel進行說明:文件->選項->自定義功能區->主選項卡打勾->excel工具欄多了一項開發工具-->加載項->選擇「數據分析」,「規劃求解」->數據選項卡就多了這兩個工具。
  • 大數據學習資料下載,新手攻略,數據分析工具、軟體使用教程
    「大數據時代的到來很突然,在國內發展勢頭激進,而人才卻非常有限,現在完全是供不應求的狀況。所有從底層數據工作者往上發展的基本路徑:1. 第一階段(一般崗位叫數據專員)基本學會excel(VBA最好學會;會做透視表;熟練用篩選、排序、公式),做好PPT。
  • 用R進行Lasso regression回歸分析
    ridge regression,嶺回歸lasso regression,套索回歸elastic-net regression,彈性網絡回歸這3者的區別就在於正則化的不同,套索回歸使用回歸係數的絕對值之和作為正則項,即L1範式;嶺回歸採用的是回歸係數的平方和,即L2範式;彈性網絡回歸同時採用了以上兩種策略,其正則項示意如下