方差分析不能用,那就用多組獨立樣本的非參數檢驗

2020-12-20 言爸說育兒

我們一般會在文獻的統計方法部分看到這樣的描述:

對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,兩組比較採用t檢驗,三組及三組以上組間組間比較採用方差分析;否則採用中位數(四分位數間距)進行統計描述,採用非參數檢驗進行組間比較。

大家對於非參數檢驗可能會比較陌生,一般遇到數據不符合正態分布時,手足無措。

今天,我們一起來看看。

1

基礎知識

非參數檢驗(Nonparametric tests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本內容。

當數據符合正態分布時,三組及三組以上組間組間比較採用方差分析,否則採用非參數檢驗

與單因素方差分析對應的非參數檢驗方法叫做Kruskal-Wallis H檢驗,即克魯斯卡爾-沃利斯檢驗(也叫做對秩次的單因素方差分析)。

用於檢驗多組間連續或有序變量是否存在差異,當然兩組間差異也可以用。

2

軟體操作

問題:我們想比較三組人群的BMI(體質指數)水平是否有差異?

1、查看數據集

Group 組別,分類變量, 1、2、3各代表1組;

Age 年齡,數值變量;bmi 體質指數, 數值變量。

2、 Kruskal-Wallis H檢驗

點擊Analyze→Nonparametric Tests→Independent Samples,在彈出的對話框中選擇SCAN DATA,然後出現Nonparametric Tests: Two or More Independent Samples對話框,默認選擇Automatically compare distributions across groups。

點擊Fields,選擇Use custom field assignments,將變量bmi選入Test Fields框中,將變量group選入Groups框中。

點擊Settings,選擇Customize tests,在Compare Median Difference to Hypothesized區域選擇Kruskal-Wallis 1-way ANOVA (k samples),Multiple comparisons選擇All pairwise。

3

結果解釋

雙擊Hypothesis Test Summary,啟動Model Viewer窗口。

1、總體檢驗結果可以表述為:

經Kruskal-Wallis H檢驗結果顯示,H=7.873,p=0.020,三組人群BMI差異具有統計學意義。

但至於是哪兩組人群間BMI存在差異,還需要進一步看看兩兩比較的結果。

較低版本的SPSS軟體無法直接獲取相關結果,但在SPSS 22.0版本以上,能夠通過軟體直接得出兩兩比較的結果了。

點擊Model Viewer右下方的View,選擇「Pairwise Comparisons」,Pairwise Comparisons右側視圖會出現兩兩比較的結果。

2、兩兩比較的結果可表述為:

採用Bonferroni法校正顯著性水平的事後兩兩比較結果顯示,BMI水平在組1和組3(調整後P=0.023)的差異具有統計學意義,其它組之間的差異無統計學意義。

習慣用R軟體的朋友,也可以參考我之前的文章《

多組獨立樣本非參數檢驗及兩兩比較

》。

學會統計分析的好處:

分析自己的數據

幫助別人分析數據,結交朋友

幫助別人分析數據,增加收入,一般一套統計分析收費在500-1000元

結識大佬:某主治醫生,會統計分析,許多科室大佬見了都親切打招呼

相關焦點

  • 如何用非參數檢驗,分析多個相關樣本數據?
    檢驗一致性,你用哪種方法?其實,差異性與一致性可以看作是一體兩面的分析,如果一組數據具有很強的差異性,那就表示數據的一致性很差。不同的方法有不同的要求和側重,因此才出現這麼多的檢驗方法,分別針對不同的應用場景。下面就介紹幾種側重於檢驗多組相關數據的非參數檢驗方法。①Friedman檢驗Friedman檢驗,是研究多相關樣本差異性的方法,屬於非參數檢驗的一種。
  • 手把手教你多組獨立樣本的非參數檢驗及兩兩比較
    再送兩個介 紹數值變量如果服從正態分布,採用均數±標準差進行統計描述,採用方差分析進行組間比較,如果組間差異有統計學意義,進一步採用LSD法(也可以是其它方法)進行兩兩比較。如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • 全流程總結方差分析,就靠它了!
    方差分析流程圖Step1:數據類型方差分析用於分析定類數據與定量數據之間的關係情況,可以比較2組或多組數據的差異。②使用非參數檢驗:如果沒有呈現出正態性特質,可使用非參數檢驗進行分析。SPSSAU-非參數檢驗③直接使用方差分析:參數檢驗的檢驗效能高於非參數檢驗,比如方差分析為參數檢驗,所以很多時候即使數據不滿足正態性要求也使用方差分析。
  • 手把手教你用 GraphPad 做配對樣本 t 檢驗
    在統計學分析裡,最重要的元素是數據,因為數據的屬性決定了用什麼樣的方式來比較數據,不同的數據比較方式就決定了統計分析方法以及對應的統計圖。 Graphpad prism 8.0是一款強大統計分析軟體,兼有分析數據和作圖的能力。
  • 方差分析常見問題匯總,你想知道的都在這裡
    本文以SPSSAU系統為例,針對方差分析的常見問題進行匯總說明。關於方差分析的分析思路及相關操作可閱讀連結文章:SPSSAU:全流程總結方差分析,只看這篇就夠了。①問題一:t檢驗與方差分析的區別?t檢驗只能進行兩組之間的比較,當分析項X組別超過兩組時,應使用方差分析。
  • python 檢驗方差齊性 - CSDN
    之前已經介紹的變量分析:①相關分析:一個連續變量與一個連續變量間的關係。②雙樣本t檢驗:一個二分分類變量與一個連續變量間的關係。本次介紹:方差分析:一個多分類分類變量與一個連續變量間的關係。其中分類個數大於兩個,分類變量也可以有多個。
  • 兩樣本t檢驗原理與R語言實現
    這一發現的偉大之處在於:你不必知道原始分布的4個參數(K·皮爾遜體系的四個參數分別是平均數、標準差、對稱性、峰度)的確切值,前兩個參數估計值的比率有一個可以制表的概率分布,不管標準差的真實值是多少,只要計算這兩個樣本估計值的比率,就可以得到一個已知的分布。這就是t檢驗的由來。戈塞特先生關於t檢驗的一個重要假設前提就是:原始測量值服從正態分布。
  • 單因素方差分析超完整分析流程
    T檢驗與單因素方差分析的區別在於T檢驗只能對比兩組數據的差異。如果X和Y均為定類數據,想對比差異性,此時需要使用卡方分析。02. 格式要求在分析前首先需要按正確格式錄入、上傳才能得到有效的分析結果。方差分析的基本前提進行方差分析需要數據滿足以下兩個基本前提:各觀測變量總體要服從正態分布各觀測變量的總體滿足方差齊這是方差分析的兩個基本前提條件,理論上講,數據必須滿足以上兩個條件才能進行方差分析,如不滿足,則使用非參數檢驗。
  • 三種T檢驗的詳細區分
    獨立T檢驗(也稱T檢驗),要求因變量(y)需要符合正態分布性,如果不滿足,此時可考慮使用非參數檢驗,具體來講應該是MannWhitney檢驗進行研究。單樣本T檢驗,其默認前提條件是數據需要符合正態分布性,如果不滿足,此時可考慮使用單樣本Wilcoxon檢驗進行研究。
  • 方差-協方差法VaR計量模型選擇
    r2代替中的x就得到了方差的估計:        用兩個回報序列的積r1r2替代式中的r就是協方差的估計:      EWMA法中只有一個參數衰減因子?其協方差矩陣的正定性受限於相關係數矩陣。由於計算方便,常相關係數模型在實證研究中非常流行,但常相關係數的假定並不能被實際金融數據支持。
  • 三種T檢驗的詳細區分
    獨立T檢驗(也稱T檢驗),要求因變量(y)需要符合正態分布性,如果不滿足,此時可考慮使用非參數檢驗,具體來講應該是MannWhitney檢驗進行研究。單樣本T檢驗,其默認前提條件是數據需要符合正態分布性,如果不滿足,此時可考慮使用單樣本Wilcoxon檢驗進行研究。
  • 「spss數據分析系列」方差分析
    上一課我們講的是t檢驗,t檢驗是用於2個類別的均值對比,如果是3分類以及以上的分類的均值對比,則採用方差分析。t檢驗是用的t分布來檢驗時候接受假設,方差分析則用的F分布,如下圖。方差分析的適用條件:1、個樣本的獨立性(指每個單元格內的數據相互獨立):這樣才能保證數據變異的可加性。2、正態性:單元格內的所有總體都是從一個正太總體來面抽出來,這個時候一般由於單元格數量比較少,所以沒法直接分析和觀察,這時候一般採用殘差分析來看。
  • 精益六西格瑪管理-假設檢驗-單因子方差分析
    這類問題可以用方差分析的方法來解決。為了表述方便,這裡先給出在以後實驗設計中經常會遇到的幾個概念因子對指標有影響的因素稱為因子,通常情況下,我們約定用大寫字母來表示因子。單因子方差分析的模型假設在一個實驗中只考察一個因子A,它有r個水平,在每一水平下進行m次重複實驗,其結果用yi1, yi2,……yim(i=1,2,…..r)表示。記第i水平下的數據和為Ti,數據均值為y-bar(i),總的均值為y-bar。此時共有n=rxm個數據。常常把數據列成表格形式。
  • 方差分析F檢驗結果如何解讀?
    我們在閱讀論文時,經常看到(方差分析)F檢驗的結果,比如F(3,19)=3.4,這是什麼意思?我們自己對照描述統計結果時,如何根據SPSS輸出的方差分析表,寫出F括號中的兩個數字? 這是本篇文章要解決的問題。
  • SPSS方差分析方法與實例演練
    在數據分析過程中,為了進行兩組以上均數的比較,往往可以使用方差分析方法。那麼我們一起了解一下方差分析基本概念、 單因素方差分析、 多因素方差分析及協方差分析;同時在spss中的操作演練。方差分析通常用F統計量檢驗:SPSS會自動計算 F 統計值, F 服從 (k-1,n-k) 自由度的 F 分布(k 是水平數, n 為個案數), SPSS依據 F 分布表給出相應的相伴概率值。
  • 方差-協方差法VaR計量模型選擇
    r2代替中的x就得到了方差的估計:        用兩個回報序列的積r1r2替代式中的r就是協方差的估計:      EWMA法中只有一個參數衰減因子?其協方差矩陣的正定性受限於相關係數矩陣。由於計算方便,常相關係數模型在實證研究中非常流行,但常相關係數的假定並不能被實際金融數據支持。
  • 百篇數據分析方法合集,真是太太太全面了
    三種方法(方差、T檢驗、卡方)的結果解讀1.T檢驗三種T檢驗如何選擇(獨立樣本T檢驗、單樣本T檢驗、配對樣本T檢驗)獨立樣本T檢驗單樣本T檢驗配對樣本T檢驗>2.方差分析單因素方差分析雙因素方差分析事後檢驗:方差分析後的兩兩對比協方差分析:增加幹擾項的方差分析重複測量數據方差分析3.卡方分析
  • 正態性檢驗,這些事兒得知道(附軟體操作)
    而非一組數據的數特別多,這組數據就符合正態分布。4.3 當進行兩組及多組間的比較,需要分組檢驗正態性,而不是合併進行!只要其中一組不滿足正態性,就判斷該變量不符合正態分布。4.4 需要注意的是,當數據的樣本量較大時,正態性檢驗可能會比較敏感,更容易提示數據不符合正態分布,這時候,我們一般推薦圖示法(如直方圖、QQ圖等)來判斷數據的正態性。在直方圖中,只要數據呈現鍾型分布(中間高,兩端逐漸下降,左右兩側呈現對稱或近似對稱),可判斷數據符合正態分布或近似正態分布,可以選擇參數檢驗的方法(如t檢驗、方差分析)。
  • 精益六西格瑪管理-非參檢驗-符號檢驗的原理和過程
    一類是參數問題的假設檢驗,另一類是非參數問題的假設檢驗;參數問題的假設檢驗包括 對於均值的檢驗方差齊性的檢驗對比率的檢驗;>非參數問題的假設檢驗包括分布的正態性檢驗;這個通常在進行分析前,需要對數據進行的一個檢測。
  • 論文常用數據分析方法分類總結-3
    非參數檢驗-SPSSAU非參數檢驗用於研究定類數據與定量數據之間的關係情況。如果數據不滿足正態性或方差不齊,可用非參數檢驗。單樣本Wilcoxon檢驗用於檢驗數據是否與某數字有明顯的區別。如果X的組別為兩組,則使用MannWhitney統計量,如果組別超過兩組,則應該使用Kruskal-Wallis統計量結果,SPSSAU可自動選擇。