一篇概全:非參數檢驗思路總結

2020-12-15 SPSSAU
非參數檢驗

1. 何時使用非參數檢驗

或許你還沒有理解什麼是參數檢驗、非參數檢驗,但一定曾在無意之中使用過它們。如我們常用的方差分析、T檢驗,都屬於參數檢驗。

你可能聽說過,當在使用方差分析時,需要在分析前對數據的正態性和方差齊性進行判斷,如果服從正態性、方差齊性,才可以使用方差分析。反之,如果沒有滿足這些假設條件,則考慮使用非參數檢驗。

參數檢驗,就是假定數據服從某種分布,通過樣本信息對總體參數進行檢驗。因而在分析前,先要檢驗數據是否符合該類型的分布,如果數據無法滿足檢驗假設的情況不符合分布情況,則可以考慮選擇使用非參數檢驗。

2. 非參數檢驗和參數檢驗的對比

① 適用範圍:

非參數檢驗用作參數檢驗的替代方法,當數據不滿足正態性時,將使用非參數檢驗。因此,關鍵是要弄清楚是否具有正態分布。如果數據大致呈現"鍾型"分布,則可以使用參數檢驗。

② 檢驗效能:

如果數據滿足參數分布,應該優先選擇參數檢驗方法。願因在於參數檢驗的檢驗效能要高於非參數檢驗。尤其是在樣本數較大的情況下,參數檢驗結果較為穩健,所以即使不服從正態分布,也會選擇參數檢驗。

③ 對比指標:

參數檢驗一般用平均值反映數據的集中趨勢;但由於數據不正態或受到極端異常值影響,在非參數檢驗中如果再使用平均值描述顯然不太準確(比如常被吐槽的人均收入),此時中位數是更好的選擇。

參數檢驗

參數檢驗用平均值及標準差描述樣本分布請況。

非參數檢驗

非參數檢驗結果中使用的是中位數描述差異。

④ 圖形展示

除了使用以上指標進行分析,還可以通過圖形直觀展示數據情況。參數檢驗常用圖形有:折線圖、條形圖等,非參數檢驗可以使用箱線圖查看。

折線圖
箱線圖

3. 非參數檢驗的類型

凡是在分析過程中不涉及總體分布參數的檢驗方法,都可以稱為「非參數檢驗」。因而,與參數檢驗一樣,非參數檢驗包括許多方法。以下是最常見的非參數檢驗及其對應的參數檢驗對應方法:

單樣本Wilcoxon檢驗

單樣本Wilcoxon檢驗是單樣本t檢驗的代替方法。該檢驗用於檢驗數據是否與某數字有明顯的區別,如對比調查對象整體態度與滿意程度之間的差異。

SPSSAU-單樣本Wilcoxon檢驗

Mann-Whitney檢驗

Mann-Whitney檢驗是獨立樣本t檢驗的非參數版本。該檢驗主要處理包含等級數據的兩個獨立樣本,SPSSAU中稱為非參數檢驗。

SPSSAU-非參數檢驗

Kruskal-Wallis檢驗

Kruskal-Wallis檢驗是單因素方差分析的非參數替代方法。Kruskal-Wallis檢驗用於比較兩個以上獨立組的等級數據。

在SPSSAU中,與Mann-Whitney檢驗統稱為「非參數檢驗」,分析時SPSSAU會根據自變量組別數,自動選擇使用Kruskal-Wallis檢驗或Mann-Whitney檢驗。

SPSSAU-非參數檢驗

配對Wilcoxon檢驗

Wilcoxon符號秩檢驗是配對樣本t檢驗的非參數對應方法。該檢驗將兩個相關樣本與等級數據進行比較。

SPSSAU-配對樣本Wilcoxon檢驗

4. SPSSAU操作

案例:分析不同性別學生,學習成績是否存在差異?

正態性檢驗

正態圖

根據正態圖顯示,數據不服從正態分布,因而考慮使用非參數檢驗進行分析。

操作步驟

左側方法欄點擊【通用方法】→【非參數檢驗】;將用於分組的自變量X放入【X(定類)】框;因變量放入【Y(定量)】框;點擊開始非參數檢驗分析。

SPSSAU-非參數檢驗

結果分析

非參數檢驗分析步驟與參數檢驗步驟基本一致,建議參考SPSSAU輸出結果中的「分析建議」及「智能分析」即可。

SPSSAU分析建議
SPSSAU智能分析

5. 兩兩比較

如果涉及2組以上的數據,當結果呈現出顯著差異時,要進一步對比兩兩組別,可以在分析前勾選「Nemenyi兩兩比較」。

6. 總結

以上就是非參數檢驗的流程梳理,事實上在大部分研究中,如果可以使用參數檢驗,即使不滿足正態分布,也優先選擇參數檢驗,尤其是在樣本量較大的情況下。

相關焦點

  • 非參數中的秩和檢驗到底怎麼做的?
    文章來源: 丁點幫你微信公眾號作者:丁點helper今天,我們開始講非參數檢驗。對於非參數檢驗,大家可能主要是把它和「不符合正態分布」一起記憶的。剛開始學統計的時候,我們都知道:數據符合正態分布就用t檢驗,不符合就用非參數檢驗,更具體點,就是所謂的「秩和檢驗」。這是沒錯的,對於數據量小,而且很不符合的正態分布的情況,秩和檢驗確實是必不可少的一種方法。所以搞懂秩和檢驗還是很有必要的。
  • 非參數檢驗—兩相關樣本資料
    (無需校正),在SPSS非參數檢驗下的【相關樣本】或者舊對話框下的【2個相關樣本】中選擇McNemar檢驗。(需要校正),可在SPSS交叉表中、非參數檢驗下的【相關樣本】或者舊對話框下的【2個相關樣本】選擇McNemar檢驗。
  • 使用非參數統計檢驗進行分析的指南
    問題是沒有人告訴你如何進行像假設檢驗這樣的分析。統計檢驗用於制定決策。為了使用中位數進行分析,我們需要使用非參數檢驗。非參數測試是分布獨立的檢驗,而參數檢驗假設數據是正態分布的。說參數檢驗比非參數檢驗更加的臭名昭著是沒有錯的,但是前者沒有考慮中位數,而後者則使用中位數來進行分析。接下來我們就進入非參數檢驗的內容。
  • Kruskal-Wallis檢驗:單因素方差分析的非參數方法
    此時可以嘗試非參數檢驗方法:Kruskal-Wallis 單因素 ANOVA(k 個樣本)檢驗。現在我們收集到4種不同飼料增肥效果的實驗數據,假設4組數據嚴重偏離正態分布,請使用Kruskal-Wallis非參數方法檢驗飼料效果的差異性。菜單及參數設置,如下方GIF動圖所示:
  • 一文看懂spss-獨立樣本t檢驗,非參數檢驗
    首先對數據進行正態性檢驗,符合正態性的使用獨立樣本t檢驗;不符合正態性地使用非參數秩和檢驗。將數據導入spss中,首先正態性檢驗。分析--描述統計--探索,將指標全部放進因變量列表裡,將組放進因子列表裡,單擊 圖 ,勾選含檢驗的正態圖--繼續--確定。輸出結果,看正態性檢驗。一般情況下(樣本量比較少)看夏皮諾威爾克檢驗結果。顯著性大於0.05符合正態性。小於0.05不符合正態性。
  • 如何用非參數檢驗,分析多個相關樣本數據?
    不同的方法有不同的要求和側重,因此才出現這麼多的檢驗方法,分別針對不同的應用場景。下面就介紹幾種側重於檢驗多組相關數據的非參數檢驗方法。①Friedman檢驗Friedman檢驗,是研究多相關樣本差異性的方法,屬於非參數檢驗的一種。
  • SPSS分析技術:非參數檢驗之Wilcoxon檢驗;平均值比較不了?那就比較中位數吧!
    基礎準備非參數檢驗是與參數檢驗相對應的另一套分析方法。
  • 參數檢驗 - CSDN
    Python | KS檢驗以及其餘非參數檢驗的實現 10-26
  • 方差分析不能用,那就用多組獨立樣本的非參數檢驗
    我們一般會在文獻的統計方法部分看到這樣的描述:對於數值變量,首先進行正態性檢驗,如果各組均滿足正態性,採用均數(標準差)進行統計描述,兩組比較採用t檢驗,三組及三組以上組間組間比較採用方差分析;否則採用中位數(四分位數間距)進行統計描述,採用非參數檢驗進行組間比較。
  • R語言實現統計分析——非參數假設檢驗
  • SPSS非參數檢驗--Kruskal-Wallis 單因素ANOVA
    兩組數據的差異比較,我們已經學會採使用t檢驗和 Mann-Whitney U檢驗;對於兩組以上數據間差異的比較我們採用方差分析(ANOVA);當多組數據不滿足正態性和方差齊性時
  • 醫學科研課堂丨統計說說(八)—基本統計學方法之等級資料的非參數檢驗
    研究設計類型:獨立樣本兩組比較(夏季、冬季),樣本量不等; 3.反應變量:結果變量核黃素營養狀況屬於等級資料(三分類有程度上差別:缺乏、不足、適宜);分組變量屬於計數資料(二分類:夏季、冬季)(無序,即沒有程度上差別),形成的交叉表也稱2*3表(表1紅框)(R=2,C=3);4.反應變量是等級資料,採用非參數檢驗
  • 【2015.】交叉表卡方和非參數卡方,到底啥關係?
    其實卡方是一家,因為功效而分家,交叉卡方負責組間比,非參卡方負責單組找比例!  分析-描述統計-交叉表中的卡方:為分類變量獨立性檢驗的卡方。其用途為:多組分類找差異。就是為了比較組間差異性的。如不同性別大學生血型構成比較,主要目的尋找不同性別間的差異。
  • 手把手教你多組獨立樣本的非參數檢驗及兩兩比較
    如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • 基於R語言實現多組獨立樣本的非參數檢驗(Kruskal-Wallis秩和檢驗)及兩兩比較
    如果不服從正態分布,採用中位數(四分位數間距)進行統計描述,組間比較採用非參數檢驗(Kruskal-Wallis秩和檢驗),當組間總的有統計學差異,進一步採用Dunn法(也可以是其它方法)進行多重比較。我們想比較不同BMI組人群的年齡是否有差異,經正態性檢驗,年齡不符合正態分布,故選用非參數檢驗(Kruskal-Wallis秩和檢驗)。
  • 精益六西格瑪管理-非參檢驗-符號檢驗的原理和過程
    一類是參數問題的假設檢驗,另一類是非參數問題的假設檢驗;參數問題的假設檢驗包括 對於均值的檢驗方差齊性的檢驗對比率的檢驗;>非參數問題的假設檢驗包括分布的正態性檢驗;這個通常在進行分析前,需要對數據進行的一個檢測。
  • 參數估計與假設檢驗(七)-- 獨立雙樣本均值T檢驗
    進行獨立雙樣本均值T檢驗時,樣本必須滿足以下三個條件:圖10.18 獨立雙樣本均值T檢驗的假設條件示意圖兩個樣本方差相等的檢驗,也稱為兩樣本方差齊性檢驗,可以通過構造F統計量及F統計量的分布理論進行檢驗。這種檢驗稱為F檢驗。F檢驗的原假設H0和備擇假設H1分別如圖10.19所示。
  • 非參數貝葉斯統計:Dirichlet過程
    自此,非參數貝葉斯統計學開始蓬勃發展。1974年,Ferguson博士又應邀在Annals of stats上發文「priors on spaces of probability measures」。這又是一篇重量級的論文,此論文總結了諸多在概率空間上構造先驗的方法(簡單滴講,即概率之概率)。
  • 驗證性因子分析思路總結
    Step2:分析思路在實際研究中,驗證性因子分析常會與結構方程模型、路徑分析等方法聯繫到一起,對於不熟悉概念的研究人員容易搞混這些方法,下表對這幾種方法進行簡單說明:探索性因子分析:驗證因子與分析項的對應關係,檢驗量表效度,非經典量表通常用探索性因子分析
  • SPSS操作:多個獨立樣本的非參數檢驗及兩兩比較
    Kruskal-Wallis H檢驗(有時也叫做對秩次的單因素方差分析)是基於秩次的非參數檢驗方法,用於檢驗多組間(也可以是兩組)連續或有序變量是否存在差異。使用Kruskal-Wallis H test進行分析時,需要考慮以下3個假設。