如何用Excel做方差分析

2020-12-09 數據分析與可視化

01方差齊性的檢驗

我們前面講到過,理解商業過程中的變異十分重要。例如,某個地方的員工或者某一群員工,是不是比其他地方的員工或別的群的員工,表現出更大的變異性?我們可以用一種新型的檢驗——F檢驗來檢驗兩個樣本之間的方差齊性。為了運用這一檢驗,我們必須假定這兩個樣本都是從正態分布的母體中抽取的。我們檢驗的假設是:

為了檢驗這些假設,我們從母體1中選擇了包含n1個觀察值的樣本,從母體2中選擇了包含n2個觀察值的樣本。檢驗使用F檢驗統計量,它是兩個樣本的方差的比率:

這一統計量的抽樣分布稱為F分布。與t分布相類似,F分布也用自由度來描述;然而F分布有兩個自由度,一個與F統計量的分子n1-1相關,另一個與F統計量的分母n2-1相關。

如果方差相互之間存在顯著差異,我們將預期F比1大很多,而F越是接近1,則兩個方差越有可能相同。因此,我們只需要將F的值與右尾臨界值進行對比。當F統計量超過了臨界值時,我們拒絕原假設。要注意,我們使用α/2來找臨界值,而不是α,這是因為我們只使用了右尾的信息來形成我們的推斷。

02對方差齊性運用F檢驗

為了例證F檢驗,假設我們希望確定「採購訂單」表格中 Alum Sheeting和 Durrable Products這兩家供應商的交付周期的方差是不是相同。F檢驗可以運用 Excel「數據分析」工具中的「F-檢驗」來檢驗方差齊性。對話框提示你鍵入每個變量的樣本數據區域(可以參考下圖)。

如我們提到過的那樣,你應當確保第一個變量有較大的方差,這可能需要你在運用該工具之前,事先計算兩個變量的方差。在這一例子中,供應商 Alum Sheeting交付周期的方差大於供應商 Durrable Products交付周期的方差,因此,它可以規定為變量1。還要注意的是,如果我們選擇α=0.05,那麼,在Excel對話框中必須鍵入0.025作為顯著性水平。其結果如下圖所示

F統計量的值F為3.467.我們將這個值與右尾臨界值(F單尾臨界)相比較,F單尾臨界值為3.607。由於其小於單尾臨界,所以,我們不能拒絕原假設並推斷相互之間的方差不存在明顯的差異。注意,p值P(F<=f)單尾=0.0286,雖然顯著性水平為0.05,要記住的是,我們必須把這個與α/2=0.025進行比較,因為我們只使用了右尾信息。

03方差分析

到這個時候,我們已經討論了將母體參數與常數數值進行比較,或者將兩個不同母體的平均值進行比較的假設檢驗。通常,我們希望比較幾個不同組的平均值,以確定它們是否全都相等,或者任何組的平均值與其他組的明顯不同。

「保險調查」數據中的區別

在 如下的 「保險調查」表格中,

我們感興趣的是,觀察擁有不同受教育程度的個人的滿意度之間是否存在顯著差別。我們可以將「受教育程度」數據進行排序,然後創建一個類似於下表的表格。

雖然每個組的平均滿意度某種程度上存在差別,而且似乎擁有研究生學位的個人的平均滿意度更高一些,但是,由於抽樣誤差的存在,我們不能推斷這些差別是否顯著。

在統計學術語中,關注的變量稱為因素。在這一例子中,因素是受教育程度,而這一因素有三個類別,分別是大學畢業、研究生學位和其他學院畢業。因此,似乎我們必須進行三次不同的兩-兩檢驗,才能確定它們之間是否存在顯著的差別。隨著因素的增加,你會發現兩-兩檢驗的次數將迅速增多。

幸運的是,我們不需要進行這樣繁雜的任務,而是可以使用其他一些統計工具。方差分析ANOVA就是其中的一種。方差分析的原假設是所有組的母體平均值全都相等,備擇假設是至少有一個組的平均值不同於其他組:

顧名思義,方差分析就是我們分析數據中的方差。本質上講,方差分析計算了每個組的平均值之間的方差的量數,以及各組之內的方差的量數,並研究一個檢驗統計量:這些量數的比例。這一檢驗統計量顯示了具有F分布(類似於方差齊性的檢驗)。如果根據選定的顯著性水平, F-統計量足夠大,超過了臨界值,我們將拒絕原假設。Excel提供了「數據分析」工具——方差分析:單因素方差分析。

04運用 Excel的方差分析工具

在如上的Excel表格文件「保險調查」中,為了檢驗「所有受教育程度的平均滿意度全都相等」原假設與「至少有一個平均值與其他平均值不同」的備擇假設,從「數據分析」選項中選擇「方差分析:單因素方差分析」。在下圖所示的對話框中,規定數據的輸入範圍(它必須處在連續的列之中)以及它到底是按行還是按列來排序的(即各因素的水平或組是否處在區域中的一行或列)。各因素水平的樣本容量不需要相同,但輸入區域必須是一個包含所有數據的矩形區域,此外還必須規定顯著性水平。

這個例子中的結果如下圖所示。輸出報告首先是每個組的基本統計量數。方差分析部分報告了假設檢驗的細節。你不必擔心所有這些數學細節。

解釋這一檢驗的重要信息是標註為F(F-統計量)、P值(檢驗的p值)和 F crit(F-分布的臨界值)的列中。在這個例子中,F=3.92,而來自F分布的臨界值為3.4668.在這裡,F> F crit;因此我們必須拒絕原假設,並推斷各組的平均值之間存在顯著差別。也就是說,在三種受教育程度不同的人群中,滿意度的平均值是不同的。作為選擇,我們發現p值比選定的0.05的顯著性水平低,從而得出相同的結論。

05方差分析的假設

方差分析需要做出以下假設:將要研究的m個組或因素水平代表了母體,其結果量數:

1.是隨機地而且獨立地獲得的。2.是呈正態分布的。3.方差相等。如果違反了這些假設,那麼,顯著性水平和檢驗效能可能受到影響。通常情況下,當我們為數據選擇了隨機樣本時,容易驗證第一條假設。方差分析是相當可靠的,不會偏離正態分布,因此,大多數情況下,第二條假設也不是一個嚴重的問題。如果樣本容量相等,違反第三條假設,不會對統計推斷產生嚴重影響。不過,如果樣本容量不相等,那就對統計推斷產生嚴重影響。

當違反了方差分析根本的假設時,你可以用一種不需要這些假設的非參數檢驗。

相關焦點

  • 如何用Excel軟體幫你做統計分析?
    近來,身邊一直有同事及朋友跟我求救:幫我做個t檢驗唄,幫我做個方差分析可行?行,行,當然ok。我們往往用SPSS軟體或者R軟體很快的給出結果,我也很疑惑,如果說R軟體等編程軟體你不會情有可原,可是對我的同事們已經多次培訓過SPSS如何做簡單的統計分析,並且SPSS是一款很簡單的非編程軟體。為什麼,為什麼還是一遍一遍的來問我?
  • 別人都在用數據分析軟體了,不要再用excel做數據分析了
    之前聽朋友吐槽過,他們是上千人的企業,但做數據分析居然還是靠手動上傳數據,而且還是用的excel做的。但其實excel並不是企業做數據分析的好工具。 數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。
  • Excel裡的這個工具,做財務分析一定要學會
    回歸分析最關鍵的一步,就是要得到a和b的值。可以用二元一次方程的方式去求解,但那樣用到的數據太少,會影響到預測的準確性。在excel裡,提供了一個非常好的工具,可以基於一組數據來進行求解。只要有準備好的數據,用工具自動計算a和b的值,比手工計算的準確度要好,也更簡單。 1、準備工作。
  • Excel四因素二水平正交實驗方差分析直觀分析極差分析
    正交實驗方差分析,研究多因素多水平的一種設計方法,它是根據正交性從全面試驗中挑選出部分有代表性的點進行試驗,這些有代表性的點具備了「均勻分散,齊整可比」的特點,正交試驗設計是分式析因設計的主要方法,是一種高效率、快速、經濟的實驗設計方法。
  • 「經驗分享」怎麼計算樣本總體方差
    ['下面用wps中的excel通過分步計算和VARPA函數一步計算分別計算樣本的總體方差,方便大家理解方差的算法。']['工具/原料']wps-excel,office-excel類同['方法/步驟']1樣本總體方差的計算公式為:S^2= ∑(X-X平 ) ^2 / n(注意樣本方差公式中為n-1),S^2為樣本總體方差,X為變量,X平為樣本均值,n為樣本例數
  • spss協方差分析
    什麼是協方差分析?協方差分析又稱「共變量分析」,是方差分析的引申和擴大。基本原理是將線性回歸與方差分析結合起來,調整各組平均數和 F 檢驗的實驗誤差項,檢驗兩個或多個調整平均數有無顯著差異,以便控制在實驗中影響實驗效應(因變量)而無法人為控制的協變量(與因變量有密切回歸關係的變量)在方差分析中的影響。好吧,聽不懂。簡單舉個例子來說:有一項研究,想知道男生和女生在跑步後的心率是否有差異。
  • 我用Excel發現了數據分析的本質:回歸分析
    比如,用戶點擊率與網站訪問量之間是否有關係、廣告曝光量與投入成本的關係等等,這個方程的求取過程也就是所謂的「回歸分析」。回歸分析在統計學中包含了很多類別,比如一元回歸、多遠回歸、方差回歸、線性回歸、非線性回歸等,但我們不必涉及這麼深,只需要了解其本質即可。
  • Excel集成的STDEV方差計算函數
    方差的手工運算相當複雜,為了快速獲得結果,用戶可以使用Excel集成的STDEV方差計算函數,那Excel集成的STDEV方差計算函數怎麼使用呢?打開Excel,將相關數據錄入Execel表格中,並在下方加一行銷售額方差,然後選中12那個單元格下方的單元格。點擊選擇工具欄中的公式,點擊自動求和下方的下拉箭頭,然後選擇其他公式。彈出的界面選擇STDEV,然後點擊確定。
  • 精益六西格瑪管理-假設檢驗-兩因子方差分析
    為了做更一般的討論,現做如下假定,每一個總體的分布都是正態分布,其均值為uij, 它與因子A及B的水平有關,方差相同,都是σ^2,數據相互間是獨立的,為便於理解和分析,數據整理成表格形式現在我們分析因子A的水平不同對指標的均值有無顯著影響,因子B的水平不同對指標的均值有無顯著影響,又是還需要回答兩個因子不同水平的搭配對指標的均值有無顯著影響
  • excel如何畫箱形圖? 手把手教你如何利用Excel畫箱形圖
    excel如何畫箱形圖? 手把手教你如何利用Excel畫箱形圖時間:2018-04-08 11:32   來源:系統天堂   責任編輯:沫朵 川北在線核心提示:原標題:excel如何畫箱形圖? 手把手教你如何利用Excel畫箱形圖 excel如何畫箱形圖?
  • excel如何畫箱形圖 EXCEL箱形圖繪製圖文教程
    excel如何畫箱形圖 EXCEL箱形圖繪製圖文教程時間:2018-03-31 14:04   來源:系統天堂   責任編輯:沫朵 川北在線核心提示:原標題:excel如何畫箱形圖 EXCEL箱形圖繪製圖文教程 excel如何畫箱形圖?大家都知道excel的功能很強大,那麼大家是否知道EXCEL也可以做箱形圖呢?
  • 只會用Excel嗎?這套全面的數據分析工具打包送你,拿走不謝
    從簡單的表格製作,數據透視表,寫公式,再到VBA語言,除了數據分析之外還能Excel可以做很多事情,可以畫一張課程表,做一份調查問卷,當作計算器來算數,甚至還可以用來畫畫,用VBA寫個小遊戲,可以說是全能型選手。
  • 巧用excel製作t-分布和卡方分布的臨界值表
    巧用Excel製作臨界值表02:05來自LearningYard學苑本篇推送將介紹如何用Excel製作t-分布和卡方分布臨界值表A.t-分布t-分布是用於根據小樣本來估計呈正態分布且方差未知的總體的均值步驟一:打開excel,橫軸為置信水平,豎軸為自由度,填好相應的值,做一個框架步驟二:點擊菜單欄的公式,選擇插入函數,選擇函數T.INV,點擊確定;第一個參數Probobility代表置信水平,選中B1單元格;第二個參數Deg_freedom代表自由度
  • 你還在用Excel做表格?月入30K的早就在用TA了
    目前大多數傳統企業還是採用的excel表的方式來收集數據,當他們使用excel進行填報和數據匯總的時候,只能通過郵件或者網絡發送給相關人員。當下級單位不能及時上報數據的時候,也只能通過電話和網絡通知到下級填報單位。人工統計匯總,造成流程不暢,零散的數據也很難進行分析應用。
  • Excel製作圖表不行,用哪些可視化分析工具?
    那麼在如今「顏值為王」的現在,如何將數據展現得更好看,讓別人更願意看,這也是一個技術活。好比公司領導讓你對某一個項目得研究成果做匯報,那麼你不可能給他看單純的數據一樣,你需要讓數據更直觀,甚至更美觀。像我們以前上學的時候學過的柱狀圖,餅狀圖,也是數據可視化的一種。
  • 如何用聚類模型(k-means)做數據分析?
    聚類模型在數據分析當中的應用:既可以作為一個單獨過程,用於尋找數據內在規律,也可以作為分類等其他分析任務的前置探索。,方差恰好是歐幾裡得距離平方,如果採用其他距離但依然去最小化方差和,會導致整個算法無法收斂,所以k-means使用歐幾裡得方法。
  • 手把手教你用graphpad作圖:重複測量方差分析的圖形繪製
    統計分析採用重複測量資料的方差分析,統計圖使用Prism Graphpad繪製。1、使用SPSS軟體計算出每組數據的均值和標準,整理到Excel中。可以參考本公眾號之前的文章《手把手教你用Graphpad+SPSS輕鬆完成分組柱形圖》。
  • 如何用Python讀取Excel中圖片?
    公眾號: 早起Python作者:劉早起大家好,在使用Python進行辦公自動化操作時,一定少不了與Excel表格的交互,我們通常是用pandas處理表格數據,但大多數情況下,都是讀取表格中的數值進行分析。
  • excel函數應用:做一張函數控制的動態圖
    今天, excel也迎來了今年的第一場大雪,趕緊出來和小玲老師一起賞雪吧!瑞雪兆豐年,我用excel陪你看雪景,以感謝一路相伴與支持!值此元旦佳節之際,利用excel,特獻上一副動態雪景圖,讓我們共同迎接新的一年的到來!
  • 單因素完全隨機實驗設計方差分析
    完全隨機實驗設計是用隨機化的方式控制誤差變異的。它假設,由於被試是隨機分配給各處理水平的,被試之間的變異在各個處理水平之間也應是隨機分布、在統計上無差異的,不會只影響某一個或幾個處理水平。②平方和計算:SS總變異=[AS]-[Y]=268.875SS組間=[A]-[Y]=190.125SS組內= SS總變異- SS組間=78.750(4)方差分析表及對結果的解釋