t檢驗 方差分析 - CSDN

2021-01-19 CSDN技術社區

一.T檢驗1.T檢驗分類

T檢驗是通過比較不同數據的均值,研究兩組數據之間是否存在顯著差異。
單總體檢驗:單總體t檢驗是檢驗一個樣本平均數與一個已知的總體平均數的差異是否顯著。當總體分布是正態分布,如總體標準差未知且樣本容量小於30,那麼樣本平均數與總體平均數的離差統計量呈t分布。

獨立樣本T檢驗:雙總體t檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。雙總體t檢驗又分為兩種情況,一是獨立樣本t檢驗(各實驗處理組之間毫無相關存在,即為獨立樣本),該檢驗用於檢驗兩組非相關樣本被試所獲得的數據的差異性;一是配對樣本t檢驗,用於檢驗匹配而成的兩組被試獲得的數據或同組被試在不同條件下所獲得的數據的差異性,這兩種情況組成的樣本即為相關樣本。

配對樣本t檢驗:配對樣本t檢驗可視為單樣本t檢驗的擴展,其實質就是對差值進行單樣本t檢驗。

2.T檢驗的使用前提

正態性;(單樣本、獨立樣本、配對樣本T檢驗都需要,可以用K-S檢驗法,在SPSS中的「分析」–「非參數檢驗」—「單樣本」中;或者直接根據直方圖、P-P圖,Q-Q圖來觀察或根據偏度峰度法來分析)

獨立性;(獨立樣本T檢驗要求)

方差齊性;(獨立樣本T檢驗要求,使用Levene’s檢驗,兩樣本T檢驗中提供Levene’s檢驗,如需更詳細的檢驗結果可在「分析」–「描述統計」–「探索」中進行)

3.T檢驗的適用類型

單樣本T檢驗:比較樣本均數和總體均數
獨立樣本T檢驗:比較成組設計的兩個樣本,如比較兩個班學生的某科目成績
配對樣本T檢驗:如用藥前和用藥後的兩個人群的樣本、同一樣品用兩種方法的比較,

二.非參數檢驗1.非參數檢驗介紹

非參數檢驗(Nonparametric tests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本內容。非參數檢驗是在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法。由於非參數檢驗方法在推斷過程中不涉及有關總體分布的參數,因而得名為「非參數」檢驗。

2.非參數檢驗適用類型

連結:非參數檢驗來自百度.

兩獨立樣本的非參數檢驗

兩獨立樣本的非參數檢驗是在對總體分布不甚了解的情況下,通過對兩組獨立樣本的分析來推斷樣本來自的兩個總體的分布等是否存在顯著差異的方法。獨立樣本是指在一個總體中隨機抽樣對在另一個總體中隨機抽樣沒有影響的情況下所獲得的樣本。
SPSS中提供了多種兩獨立樣本的非參數檢驗方法,其中包括曼-惠特尼U檢驗、K-S檢驗、W-W遊程檢驗、極端反應檢驗等。

某工廠用甲乙兩種不同的工藝生產同一種產品。如果希望檢驗兩種工藝下產品的使用是否存在顯著差異,可從兩種工藝生產出的產品中隨機抽樣,得到各自的使用壽命數據。
甲工藝:675 682 692 679 669 661 693
乙工藝:662 649 672 663 650 651 646 652

曼-惠特尼U檢驗
兩獨立樣本的曼-惠特尼U檢驗可用於對兩總體分布的比例判斷。其原假設:兩組獨立樣本來自的兩總體分布無顯著差異。曼-惠特尼U檢驗通過對兩組樣本平均秩的研究來實現判斷。秩簡單說就是變量值排序的名次,可以將數據按升序排列,每個變量值都會有一個在整個變量值序列中的位置或名次,這個位置或名次就是變量值的秩。

K-S檢驗
K-S檢驗不僅能夠檢驗單個總體是否服從某一理論分布,還能夠檢驗兩總體分布是否存在顯著差異。其原假設是:兩組獨立樣本來自的兩總體的分布無顯著差異。
這裡是以變量值的秩作為分析對象,而非變量值本身。

遊程檢驗
單樣本遊程檢驗是用來檢驗變量值的出現是否隨機,而兩獨立變量的遊程檢驗則是用來檢驗兩獨立樣本來自的兩總體的分布是否存在顯著差異。其原假設是:兩組獨立樣本來自的兩總體的分布無顯著差異。
兩獨立樣本的遊程檢驗與單樣本遊程檢驗的思想基本相同,不同的是計算遊程數的方法。兩獨立樣本的遊程檢驗中,遊程數依賴於變量的秩。

極端反應檢驗
極端反應檢驗從另一個角度檢驗兩獨立樣本所來自的兩總體分布是否存在顯著差異。其原假設是:兩獨立樣本來自的兩總體的分布無顯著差異。
基本思想是:將一組樣本作為控制樣本,另一組樣本作為實驗樣本。以控制樣本作為對照,檢驗實驗樣本相對於控制樣本是否出現了極端反應。如果實驗樣本沒有出現極端反應,則認為兩總體分布無顯著差異,相反則認為存在顯著差異。

多獨立樣本的非參數檢驗
多獨立樣本的非參數檢驗是通過分析多組獨立樣本數據,推斷樣本來自的多個總體的中位數或分布是否存在顯著差異。多組獨立樣本是指按獨立抽樣方式獲得的多組樣本。
SPSS提供的多獨立樣本非參數檢驗的方法主要包括中位數檢驗、Kruskal-Wallis檢驗、Jonckheere-Terpstra檢驗。
例:希望對北京、上海、成都、廣州四個城市的周歲兒童的身高進行比較分析。採用獨立抽樣方式獲得四組獨立樣本。

中位數檢驗
中位數檢驗通過對多組獨立樣本的分析,檢驗它們來自的總體的中位數是否存在顯著差異。其原假設是:多個獨立樣本來自的多個總體的中位數無顯著差異。
基本思想是:如果多個總體的中位數無顯著差異,或者說多個總體有共同的中位數,那麼這個共同的中位數應在各樣本組中均處在中間位置上。於是,每組樣本中大於該中位數或小於該中位數的樣本數目應大致相同。

Kruskal-Wallis檢驗
Kruskal-Wallis檢驗實質是兩獨立樣本的曼-惠特尼U檢驗在多個樣本下的推廣,也用於檢驗多個總體的分布是否存在顯著差異。其原假設是:多個獨立樣本來自的多個總體的分布無顯著差異。
基本思想是:首先,將多組樣本數據混合併按升序排序,求出各變量值的秩;然後,考察各組秩的均值是否存在顯著差異。容易理解:如果各組秩的均值不存在顯著差異,則是多組數據充分混合,數值相差不大的結果,可以認為多個總體的分布無顯著差異;反之,如果各組秩的均值存在顯著差異,則是多組數據無法混合,某些組的數值普遍偏大,另一些組的數值普遍偏小的結果,可以認為多個總體的分布有顯著差異。

Jonckheere-Terpstra檢驗
Jonckheere-Terpstra檢驗也是用於檢驗多個獨立樣本來自的多個總體的分布是否存在顯著差異的非參數檢驗方法,其原假設是:多個獨立樣本來自的多個總體的分布無顯著差異。
基本思想與兩獨立樣本的曼-惠特尼U檢驗類似,也是計算一組樣本的觀察值小於其他組樣本的觀察值的個數。

兩配對樣本的非參數檢驗
兩配對樣本的非參數檢驗是對總體分布不甚了解的情況下,通過對兩組配對樣本的分析,推斷樣本來自的兩個總體的分布是否存在顯著差異的方法。
SPSS提供的兩配對樣本非參數檢驗的方法主要包括McNemar檢驗、符號檢驗、Wilcoxon符號秩檢驗等。

例:要檢驗一種新的訓練方法是否對提高跳遠運動員的成績有顯著效果,可以收集一批跳遠運動員在使用新訓練方法前後的跳遠最好成績,這樣的兩組樣本便是配對的。再例如,分析不同廣告形式是否對商品的銷售產生顯著影響,可以比較幾種不同商品在不同廣告形式下的銷售額數據(其他條件保持基本穩定)。這裡不同廣告形式下的若干組商品銷售額樣本便是配對樣本。可見,配對樣本的樣本數是相同的,且各樣本值的先後次序是不能隨意更改的。

McNemar檢驗
是一種變化顯著性檢驗,它將研究對象自身作為對照者檢驗其「前後」的變化是否顯著。其原假設是:兩配對樣本來自的兩總體的分布無顯著差異。

分析學生在學習「統計學」課程前後對統計學重要性的認知程度是否發生了顯著改變,可以隨機收集一批學生在學習「統計學」之前以及學完以後認為統計學是否重要的樣本數據(0表示「不重要」,1表示「重要」)。

應該看到:兩配對樣本的McNemar檢驗分析的變量是二值變量。因此,在實際應用中,如果變量不是二值變量,應首先進行數據轉換後方可採用該方法,因而它在應用範圍方面有一定的局限性。
符號檢驗

符號檢驗也是用來檢驗兩配對樣本所來自的總體的分布是否存在顯著差異的非參數方法。其原假設是:兩配對樣本來自的兩總體的分布無顯著差異。

首先,分別用第二組樣本的各個觀察值減去第一組對應樣本的觀察值。差值為正則記為正號,差值為負則記為負號。然後,將正號的個數與負號的個數進行比較,容易理解:如果正號個數和負號個數大致相當,則可以認為第二組樣本大於第一組樣本變量值的個數,與第二組樣本小於第一組樣本的變量值個數是大致相當的,從總體上講,這兩個組配對樣本的數據分布差距較小;相反,如果正號個數和負號個數相差較多,則可以認為兩個配對樣本的數據分布差距較大。

應該看到:配對樣本的符號檢驗注重對變化方向的分析,只考慮數據變化的性質,即是變大了還是變小了,但沒有考慮變化幅度,即大了多少,小了多少,因而對數據利用是不充分的。

Wilcoxon符號秩檢驗
Wilcoxon符號秩檢驗也是通過分析兩配對樣本,對樣本來自的兩總體的分布是否存在差異進行判斷。其原假設是:兩配對樣本來自的兩總體的分布無顯著差異。

基本思想是:首先,按照符號檢驗的方法,分布用第二組樣本的各個觀察值減去第一組對應樣本的觀察值。差值為正則記為正號,為負則記為負號,並同時保存差值數據;然後,將差值變量按升序排序,並求出差值變量的秩;最後,分布計算正號秩總和W+和負號秩和W-。
多配對樣本的非參數檢驗

多配對樣本的非參數檢驗是通過分析多組配對樣本數據,推斷樣本來自的多個總體的中位數或分布是否存在顯著差異。

例如,收集乘客對多家航空公司是否滿意的數據,分析航空公司的服務水平是否存在顯著差異;再例如,收集不同促銷形式下若干種商品的銷售額數據,分析比較不同促銷形式的效果,再如,收集多名評委對同一批歌手比賽打分的數據,分析評委的打分標準是否一致,等等。

這些問題都可以通過多配對樣本非參數檢驗方法進行分析。SPSS中的多配對樣本的非參數檢驗方法主要包括Friedman檢驗、Cochran Q檢驗、Kendall協同係數檢驗等。

Friedman檢驗
Friedman檢驗是利用秩實現對多個總體分布是否存在顯著差異的非參數檢驗方法,其原假設是:多個配對樣本來自的多個總體分布無顯著差異。

SPSS將自動計算Friedman統計量和對應的概率P值。如果概率P值小於給定的顯著性水平0.05,則拒絕原假設,認為各組樣本的秩存在顯著差異,多個配對樣本來自的多個總體的分布有顯著差異;反之,則不能拒絕原假設,可以認為各組樣本的秩不存在顯著性差異。

基於上述基本思路,多配對樣本的Friedman檢驗時,首先以行為單位將數據按升序排序,並求得各變量值在各自行中的秩;然後,分別計算各組樣本下的秩總和與平均秩。多配對樣本的Friedman檢驗適於對定距型數據的分析。

Cochran Q檢驗
通過對多個配對樣本的分析,推斷樣本來自的多個總體的分布是否存在顯著差異。其原假設是:多個配對樣本來自的多個總體的分布無顯著差異。
Cochran Q檢驗適合對二值品質型數據的分析。如二分的評價:1代表滿意,0代表不滿意。

Kendall協同係數檢驗
它也是一種對多配對樣本進行檢驗的非參數檢驗方法,與第一種檢驗方法向結合,可方便地實現對評判者的評判標準是否一致的分析。其原假設是:評判者的評判標準不一致。
有6名歌手參加比賽,4名評委進行評判打分,現在需要根據數據推斷這4個評委的評判標準是否一致。(見下頁具體分析)

如果將每個被評判者對象的分數看做來自多個總體的配對樣本,那麼該問題就能夠轉化為多配對樣本的非參數檢驗問題,仍可採用Friedman檢驗,於是相應的原假設便轉化為:多個配對樣本來自的多個總體的分布無顯著差異。但對該問題的分析是需要繼續延伸的,並非站在對6名歌手的演唱水平是否存在顯著差異的角度進行分析,而是在認定他們存在差異的前提下繼續判斷4個評委的打分標準是否一致。

如果利用Friedman檢驗出各總體的分布不存在顯著差異,即各個歌手的秩不存在顯著差異,則意味著評委的打分存在隨意性,評分標準不一致。原因在於:如果各個評委的評判標準是一致的,那麼對於某個歌手來說將獲得一致的分數,也就是說,評委給出的若干個評分的秩應完全相同,這就必然會導致各歌手評分的秩有較大的差異。

三.卡方檢驗1.卡方檢驗介紹

卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若兩個值完全相等時,卡方值就為0,表明理論值完全符合。

2.卡方檢驗的分類

(1)Pearson卡方檢驗
Pearson卡方檢驗只能告訴兩種測量結果之間是否存在關聯,但不能判斷其是否具有一致性。
(2)Kappa一致性檢驗
檢驗兩種區分同一屬性的方法給出的結果是否一致,如兩專家分別對10份作品進行差,中,好進行評價。另外,在數據分析中,比較兩種預測方法的預測結果的一致性時也可能用到一致性檢驗。
(3)配對卡方檢驗

3.卡方檢驗的的適用類型

(1)檢驗某個連續變量的分布是否與某種理論分布一致。
(2)檢驗某個分類變量各類的出現概率是否等於指定概率。

試驗中要考察的指標稱為試驗指標,影響試驗指標的條件稱為因素,因素所處的狀態稱為水平,若試驗中只有一個因素改變則稱為單因素試驗,若有兩個因素改變則稱為雙因素試驗,若有多個因素改變則稱為多因素試驗。方差分析就是對試驗數據進行分析,檢驗方差相等的多個正態總體均值是否相等,進而判斷各因素對試驗指標的影響是否顯著

正態性;(單樣本、獨立樣本、配對樣本T檢驗都需要,可以用K-S檢驗法,在SPSS中的「分析」–「非參數檢驗」—「單樣本」中;或者直接根據直方圖、P-P圖,Q-Q圖來觀察或根據偏度峰度法來分析)
獨立性;(獨立樣本T檢驗要求)
方差齊性;(獨立樣本T檢驗要求,使用Levene’s檢驗,兩樣本T檢驗中提供Levene’s檢驗,如需更詳細的檢驗結果可在「分析」–「描述統計」–「探索」中進行,如果不滿足方差齊性的話可以進行對數變換、平方根變換、平方根反正弦變換、平方變換、倒數變換)

前面所介紹的T檢驗只能對兩個總體進行檢驗,而對於多個總體進行差異性推斷的話會導致多次檢驗的誤差會疊加,所以引入方差分析,可以進行均數間的多重比較、各組均數的精細比較(可以指定要比較的兩個組,通過設定係數)

相關焦點

  • t檢驗 機器學習_機器學習 t 檢驗 - CSDN
    假設檢驗常見的假設檢驗有:T檢驗(Student’s t Test),F檢驗(方差齊性檢驗),卡方驗證等。F 檢驗在機器學習中應用scikit-learn中有2種F檢驗方法:分類: f_classif (單因素方差分析)回歸: f_regression (線性相關分析)3.1 方差分析:ANOVA零假設:劃分的不同總體的均值都相等,備擇假設:各個總體的均值不相等(說明特徵有意義)
  • t檢驗的目的_單樣本t檢驗的目的 - CSDN
    惟t檢驗須知道兩個總體的方差(Variances)是否相等;t檢驗值的計算會因方差是否相等而有所不同。為.128,表示方差齊性檢驗「沒有顯著差異」,即兩方差齊(Equal Variances),故下面t檢驗的結果表中要看第一排的數據,亦即方差齊的情況下的t檢驗的結果。
  • 回歸分析t檢驗公式_線性回歸t檢驗公式 - CSDN
    【可解釋的方差】     MSM( Mean of Squares for Model)  = SSR /DFM第五:線性回歸和方差分析1、方差分析中的分析變量實際上就是線性回歸中的因變量,方差分析中的分組變量就是線性回歸中的自變量。
  • 在回歸分析中t檢驗_回歸分析的t檢驗如何做 - CSDN
    (3)t分布(3)F分布三大分布的用途:卡方分布:常用於擬合優度檢驗t分布:       多用於比例的估計和檢驗,用於方差分析,協方差分布和回歸分析t分布:       在信息不足的情況下,只能用t分布,比如在整體方差不知道的情況下,對總體均值的估計和檢驗常用
  • r語言 t檢驗 假設 - CSDN
    假設檢驗 -T檢驗 -F檢驗 -卡方檢驗 -正太性檢驗T檢驗2兩樣本的T檢驗 -有原始數據的獨立兩樣本T檢測 -有原始數據的配對T檢測 實例如下: Wage 數據中大學學歷的收入和中學一樣嗎
  • 兩樣本t檢驗 - CSDN
    方差分析與兩樣本T檢驗。1。首先可以看到方差分析(ANOVA)包含兩樣本T檢驗,把兩樣本T檢驗作為自己的特例。因為ANOVA可以比較多個總體的均值,當然包含兩個總體作為特例。實際上,T的平方就是F統計量(m個自由度的T分布之平方恰為自由度為(1,m)的F 分布。因此,這時候二者檢驗效果完全相同。
  • 方差檢驗專題及常見問題 - CSDN
    Excel雙樣本T檢驗之等方差檢驗1 聲明本文的數據來自網絡,部分代碼也有所參照,這裡做了注釋和延伸,旨在技術交流,如有冒犯之處請聯繫博主及時處理。
  • python 檢驗方差齊性 - CSDN
    之前已經介紹的變量分析:①相關分析:一個連續變量與一個連續變量間的關係。②雙樣本t檢驗:一個二分分類變量與一個連續變量間的關係。本次介紹:方差分析:一個多分類分類變量與一個連續變量間的關係。其中分類個數大於兩個,分類變量也可以有多個。
  • batlett方差齊性檢驗 - CSDN
    傳送:隨機變量概率分布函數匯總-離散型分布+連續型分布            假設檢驗-KS檢驗            假設檢驗-W檢驗            假設檢驗-單樣本t檢驗            假設檢驗-兩服從正態分布的獨立總體均值檢驗
  • z檢驗和t檢驗 - CSDN
    Z 檢驗用於比較樣本和總體的均值是否不同或者兩個樣本的均值是否不同。檢驗統計量 z 值的分布服從正態分布。1.單樣本 Z 檢驗使用單樣本 Z 可以在知道總體的標準差時,估計總體的均值並將它與目標值或參考值進行比較。使用此分析,可以執行以下操作:確定總體均值是否不同於您指定的假設均值。計算可能包括總體均值的值範圍。
  • T檢驗、Z檢驗與ANOVA方差分析的應用比較
    關鍵來了:¢Z檢驗-方差已知的均值檢驗,考慮一個因素的影響,原假設H0:X1=X0(單樣本檢驗)或 H0:X1=X2(雙樣本檢驗)。¢T檢驗-方差未知的均值檢驗,考慮一個因素的影響,原假設X1=X0(單樣本檢驗)或H0:X1=X2¢ANOVA分析-分析不同因素的影響,用於兩個及兩個以上樣本均值差別的顯著性檢驗。
  • 回歸係數顯著性t檢驗 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係(方便檢驗計算)t 檢驗  用t 檢驗來檢驗回歸係數的顯著性。  2.F 檢驗(方差分析)  F檢驗用於檢驗回歸方程的顯著性。
  • t檢驗中t值的意義 - CSDN
    顯著性檢驗抽樣實驗會產生抽樣誤差,對實驗資料進行比較分析時,不能僅憑兩個結果(平均數或率)的不同就作出結論,而是要進行統計學分析,鑑別出兩者差異是抽樣誤差引起的,還是由特定的實驗處理引起的。
  • spss方差齊性檢驗 - CSDN
    單因素方差分析為檢驗某一個因子的不同水平是否對觀察變量有顯著差異。一、前提條件:1.正態性。2.獨立性。3.方差齊性。方差齊性為最重要的檢驗條件,若方差不齊時不能做方差分析。4.因變量為連續變量。5.自變量為分類變量。
  • T檢驗、方差分析、卡方分析傻傻分不清?
    1、聯繫和區別T檢驗、方差分析、卡方檢驗都是差異分析的方法,比較不同組數據的均值差異
  • t檢驗 機器學習專題及常見問題 - CSDN
    均值對比的假設檢驗方法主要有 Z 檢驗和 T 檢驗,它們的區別在於 Z 檢驗面向總體數據和大樣本數據,而 T 檢驗適用於小規模抽樣樣本。下面分別介紹 Z 檢驗和 T 檢驗。Z 檢驗需要事先知道總體方差,另外,如果總體不服從正態分布,那麼樣本量要大於等於 30 ;如果總體服從正態分布,那麼對樣本量沒有要求。
  • t檢驗回歸方程專題及常見問題 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係(方便檢驗計算)t 檢驗  用t 檢驗來檢驗回歸係數的顯著性。  2.F 檢驗(方差分析)  F檢驗用於檢驗回歸方程的顯著性。
  • 方差、標準差、正態分布、超幾何分布、卡方檢驗、t檢驗基礎概念
    方差方差是在概率論和統計方差衡量隨機變量或一組數據時離散程度的度量。概率論中方差用來度量隨機變量和其數學期望(即均值)之間的偏離程度。統計中的方差(樣本方差)是每個樣本值與全體樣本值的平均數之差的平方值的平均數。在許多實際問題中,研究方差即偏離程度有著重要意義。方差是衡量源數據和期望值相差的度量值.
  • 理解 t 檢驗與 F 檢驗的區別
    每一種統計方法的檢定的內容都不相同,同樣是t-檢定,可能是上述的檢定總體中是否存在差異,也可能是檢定總體中的單一值是否等於0或者等於某一個數值。至於F-檢定,方差分析(或譯變異數分析,Analysis of Variance),它的原理大致也是上面說的,但它是透過檢視變量的方差而進行的。
  • 卡方檢驗,T檢驗和F檢驗
    它屬於非參數檢驗的範疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。