T檢驗是通過比較不同數據的均值,研究兩組數據之間是否存在顯著差異。
單總體檢驗:單總體t檢驗是檢驗一個樣本平均數與一個已知的總體平均數的差異是否顯著。當總體分布是正態分布,如總體標準差未知且樣本容量小於30,那麼樣本平均數與總體平均數的離差統計量呈t分布。
獨立樣本T檢驗:雙總體t檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。雙總體t檢驗又分為兩種情況,一是獨立樣本t檢驗(各實驗處理組之間毫無相關存在,即為獨立樣本),該檢驗用於檢驗兩組非相關樣本被試所獲得的數據的差異性;一是配對樣本t檢驗,用於檢驗匹配而成的兩組被試獲得的數據或同組被試在不同條件下所獲得的數據的差異性,這兩種情況組成的樣本即為相關樣本。
配對樣本t檢驗:配對樣本t檢驗可視為單樣本t檢驗的擴展,其實質就是對差值進行單樣本t檢驗。
2.T檢驗的使用前提正態性;(單樣本、獨立樣本、配對樣本T檢驗都需要,可以用K-S檢驗法,在SPSS中的「分析」–「非參數檢驗」—「單樣本」中;或者直接根據直方圖、P-P圖,Q-Q圖來觀察或根據偏度峰度法來分析)
獨立性;(獨立樣本T檢驗要求)
方差齊性;(獨立樣本T檢驗要求,使用Levene’s檢驗,兩樣本T檢驗中提供Levene’s檢驗,如需更詳細的檢驗結果可在「分析」–「描述統計」–「探索」中進行)
3.T檢驗的適用類型單樣本T檢驗:比較樣本均數和總體均數
獨立樣本T檢驗:比較成組設計的兩個樣本,如比較兩個班學生的某科目成績
配對樣本T檢驗:如用藥前和用藥後的兩個人群的樣本、同一樣品用兩種方法的比較,
非參數檢驗(Nonparametric tests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本內容。非參數檢驗是在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法。由於非參數檢驗方法在推斷過程中不涉及有關總體分布的參數,因而得名為「非參數」檢驗。
2.非參數檢驗適用類型連結:非參數檢驗來自百度.
兩獨立樣本的非參數檢驗
兩獨立樣本的非參數檢驗是在對總體分布不甚了解的情況下,通過對兩組獨立樣本的分析來推斷樣本來自的兩個總體的分布等是否存在顯著差異的方法。獨立樣本是指在一個總體中隨機抽樣對在另一個總體中隨機抽樣沒有影響的情況下所獲得的樣本。
SPSS中提供了多種兩獨立樣本的非參數檢驗方法,其中包括曼-惠特尼U檢驗、K-S檢驗、W-W遊程檢驗、極端反應檢驗等。
某工廠用甲乙兩種不同的工藝生產同一種產品。如果希望檢驗兩種工藝下產品的使用是否存在顯著差異,可從兩種工藝生產出的產品中隨機抽樣,得到各自的使用壽命數據。
甲工藝:675 682 692 679 669 661 693
乙工藝:662 649 672 663 650 651 646 652
曼-惠特尼U檢驗
兩獨立樣本的曼-惠特尼U檢驗可用於對兩總體分布的比例判斷。其原假設:兩組獨立樣本來自的兩總體分布無顯著差異。曼-惠特尼U檢驗通過對兩組樣本平均秩的研究來實現判斷。秩簡單說就是變量值排序的名次,可以將數據按升序排列,每個變量值都會有一個在整個變量值序列中的位置或名次,這個位置或名次就是變量值的秩。
K-S檢驗
K-S檢驗不僅能夠檢驗單個總體是否服從某一理論分布,還能夠檢驗兩總體分布是否存在顯著差異。其原假設是:兩組獨立樣本來自的兩總體的分布無顯著差異。
這裡是以變量值的秩作為分析對象,而非變量值本身。
遊程檢驗
單樣本遊程檢驗是用來檢驗變量值的出現是否隨機,而兩獨立變量的遊程檢驗則是用來檢驗兩獨立樣本來自的兩總體的分布是否存在顯著差異。其原假設是:兩組獨立樣本來自的兩總體的分布無顯著差異。
兩獨立樣本的遊程檢驗與單樣本遊程檢驗的思想基本相同,不同的是計算遊程數的方法。兩獨立樣本的遊程檢驗中,遊程數依賴於變量的秩。
極端反應檢驗
極端反應檢驗從另一個角度檢驗兩獨立樣本所來自的兩總體分布是否存在顯著差異。其原假設是:兩獨立樣本來自的兩總體的分布無顯著差異。
基本思想是:將一組樣本作為控制樣本,另一組樣本作為實驗樣本。以控制樣本作為對照,檢驗實驗樣本相對於控制樣本是否出現了極端反應。如果實驗樣本沒有出現極端反應,則認為兩總體分布無顯著差異,相反則認為存在顯著差異。
多獨立樣本的非參數檢驗
多獨立樣本的非參數檢驗是通過分析多組獨立樣本數據,推斷樣本來自的多個總體的中位數或分布是否存在顯著差異。多組獨立樣本是指按獨立抽樣方式獲得的多組樣本。
SPSS提供的多獨立樣本非參數檢驗的方法主要包括中位數檢驗、Kruskal-Wallis檢驗、Jonckheere-Terpstra檢驗。
例:希望對北京、上海、成都、廣州四個城市的周歲兒童的身高進行比較分析。採用獨立抽樣方式獲得四組獨立樣本。
中位數檢驗
中位數檢驗通過對多組獨立樣本的分析,檢驗它們來自的總體的中位數是否存在顯著差異。其原假設是:多個獨立樣本來自的多個總體的中位數無顯著差異。
基本思想是:如果多個總體的中位數無顯著差異,或者說多個總體有共同的中位數,那麼這個共同的中位數應在各樣本組中均處在中間位置上。於是,每組樣本中大於該中位數或小於該中位數的樣本數目應大致相同。
Kruskal-Wallis檢驗
Kruskal-Wallis檢驗實質是兩獨立樣本的曼-惠特尼U檢驗在多個樣本下的推廣,也用於檢驗多個總體的分布是否存在顯著差異。其原假設是:多個獨立樣本來自的多個總體的分布無顯著差異。
基本思想是:首先,將多組樣本數據混合併按升序排序,求出各變量值的秩;然後,考察各組秩的均值是否存在顯著差異。容易理解:如果各組秩的均值不存在顯著差異,則是多組數據充分混合,數值相差不大的結果,可以認為多個總體的分布無顯著差異;反之,如果各組秩的均值存在顯著差異,則是多組數據無法混合,某些組的數值普遍偏大,另一些組的數值普遍偏小的結果,可以認為多個總體的分布有顯著差異。
Jonckheere-Terpstra檢驗
Jonckheere-Terpstra檢驗也是用於檢驗多個獨立樣本來自的多個總體的分布是否存在顯著差異的非參數檢驗方法,其原假設是:多個獨立樣本來自的多個總體的分布無顯著差異。
基本思想與兩獨立樣本的曼-惠特尼U檢驗類似,也是計算一組樣本的觀察值小於其他組樣本的觀察值的個數。
兩配對樣本的非參數檢驗
兩配對樣本的非參數檢驗是對總體分布不甚了解的情況下,通過對兩組配對樣本的分析,推斷樣本來自的兩個總體的分布是否存在顯著差異的方法。
SPSS提供的兩配對樣本非參數檢驗的方法主要包括McNemar檢驗、符號檢驗、Wilcoxon符號秩檢驗等。
例:要檢驗一種新的訓練方法是否對提高跳遠運動員的成績有顯著效果,可以收集一批跳遠運動員在使用新訓練方法前後的跳遠最好成績,這樣的兩組樣本便是配對的。再例如,分析不同廣告形式是否對商品的銷售產生顯著影響,可以比較幾種不同商品在不同廣告形式下的銷售額數據(其他條件保持基本穩定)。這裡不同廣告形式下的若干組商品銷售額樣本便是配對樣本。可見,配對樣本的樣本數是相同的,且各樣本值的先後次序是不能隨意更改的。
McNemar檢驗
是一種變化顯著性檢驗,它將研究對象自身作為對照者檢驗其「前後」的變化是否顯著。其原假設是:兩配對樣本來自的兩總體的分布無顯著差異。
分析學生在學習「統計學」課程前後對統計學重要性的認知程度是否發生了顯著改變,可以隨機收集一批學生在學習「統計學」之前以及學完以後認為統計學是否重要的樣本數據(0表示「不重要」,1表示「重要」)。
應該看到:兩配對樣本的McNemar檢驗分析的變量是二值變量。因此,在實際應用中,如果變量不是二值變量,應首先進行數據轉換後方可採用該方法,因而它在應用範圍方面有一定的局限性。
符號檢驗
符號檢驗也是用來檢驗兩配對樣本所來自的總體的分布是否存在顯著差異的非參數方法。其原假設是:兩配對樣本來自的兩總體的分布無顯著差異。
首先,分別用第二組樣本的各個觀察值減去第一組對應樣本的觀察值。差值為正則記為正號,差值為負則記為負號。然後,將正號的個數與負號的個數進行比較,容易理解:如果正號個數和負號個數大致相當,則可以認為第二組樣本大於第一組樣本變量值的個數,與第二組樣本小於第一組樣本的變量值個數是大致相當的,從總體上講,這兩個組配對樣本的數據分布差距較小;相反,如果正號個數和負號個數相差較多,則可以認為兩個配對樣本的數據分布差距較大。
應該看到:配對樣本的符號檢驗注重對變化方向的分析,只考慮數據變化的性質,即是變大了還是變小了,但沒有考慮變化幅度,即大了多少,小了多少,因而對數據利用是不充分的。
Wilcoxon符號秩檢驗
Wilcoxon符號秩檢驗也是通過分析兩配對樣本,對樣本來自的兩總體的分布是否存在差異進行判斷。其原假設是:兩配對樣本來自的兩總體的分布無顯著差異。
基本思想是:首先,按照符號檢驗的方法,分布用第二組樣本的各個觀察值減去第一組對應樣本的觀察值。差值為正則記為正號,為負則記為負號,並同時保存差值數據;然後,將差值變量按升序排序,並求出差值變量的秩;最後,分布計算正號秩總和W+和負號秩和W-。
多配對樣本的非參數檢驗
多配對樣本的非參數檢驗是通過分析多組配對樣本數據,推斷樣本來自的多個總體的中位數或分布是否存在顯著差異。
例如,收集乘客對多家航空公司是否滿意的數據,分析航空公司的服務水平是否存在顯著差異;再例如,收集不同促銷形式下若干種商品的銷售額數據,分析比較不同促銷形式的效果,再如,收集多名評委對同一批歌手比賽打分的數據,分析評委的打分標準是否一致,等等。
這些問題都可以通過多配對樣本非參數檢驗方法進行分析。SPSS中的多配對樣本的非參數檢驗方法主要包括Friedman檢驗、Cochran Q檢驗、Kendall協同係數檢驗等。
Friedman檢驗
Friedman檢驗是利用秩實現對多個總體分布是否存在顯著差異的非參數檢驗方法,其原假設是:多個配對樣本來自的多個總體分布無顯著差異。
SPSS將自動計算Friedman統計量和對應的概率P值。如果概率P值小於給定的顯著性水平0.05,則拒絕原假設,認為各組樣本的秩存在顯著差異,多個配對樣本來自的多個總體的分布有顯著差異;反之,則不能拒絕原假設,可以認為各組樣本的秩不存在顯著性差異。
基於上述基本思路,多配對樣本的Friedman檢驗時,首先以行為單位將數據按升序排序,並求得各變量值在各自行中的秩;然後,分別計算各組樣本下的秩總和與平均秩。多配對樣本的Friedman檢驗適於對定距型數據的分析。
Cochran Q檢驗
通過對多個配對樣本的分析,推斷樣本來自的多個總體的分布是否存在顯著差異。其原假設是:多個配對樣本來自的多個總體的分布無顯著差異。
Cochran Q檢驗適合對二值品質型數據的分析。如二分的評價:1代表滿意,0代表不滿意。
Kendall協同係數檢驗
它也是一種對多配對樣本進行檢驗的非參數檢驗方法,與第一種檢驗方法向結合,可方便地實現對評判者的評判標準是否一致的分析。其原假設是:評判者的評判標準不一致。
有6名歌手參加比賽,4名評委進行評判打分,現在需要根據數據推斷這4個評委的評判標準是否一致。(見下頁具體分析)
如果將每個被評判者對象的分數看做來自多個總體的配對樣本,那麼該問題就能夠轉化為多配對樣本的非參數檢驗問題,仍可採用Friedman檢驗,於是相應的原假設便轉化為:多個配對樣本來自的多個總體的分布無顯著差異。但對該問題的分析是需要繼續延伸的,並非站在對6名歌手的演唱水平是否存在顯著差異的角度進行分析,而是在認定他們存在差異的前提下繼續判斷4個評委的打分標準是否一致。
如果利用Friedman檢驗出各總體的分布不存在顯著差異,即各個歌手的秩不存在顯著差異,則意味著評委的打分存在隨意性,評分標準不一致。原因在於:如果各個評委的評判標準是一致的,那麼對於某個歌手來說將獲得一致的分數,也就是說,評委給出的若干個評分的秩應完全相同,這就必然會導致各歌手評分的秩有較大的差異。
三.卡方檢驗1.卡方檢驗介紹卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若兩個值完全相等時,卡方值就為0,表明理論值完全符合。
2.卡方檢驗的分類(1)Pearson卡方檢驗
Pearson卡方檢驗只能告訴兩種測量結果之間是否存在關聯,但不能判斷其是否具有一致性。
(2)Kappa一致性檢驗
檢驗兩種區分同一屬性的方法給出的結果是否一致,如兩專家分別對10份作品進行差,中,好進行評價。另外,在數據分析中,比較兩種預測方法的預測結果的一致性時也可能用到一致性檢驗。
(3)配對卡方檢驗
(1)檢驗某個連續變量的分布是否與某種理論分布一致。
(2)檢驗某個分類變量各類的出現概率是否等於指定概率。
試驗中要考察的指標稱為試驗指標,影響試驗指標的條件稱為因素,因素所處的狀態稱為水平,若試驗中只有一個因素改變則稱為單因素試驗,若有兩個因素改變則稱為雙因素試驗,若有多個因素改變則稱為多因素試驗。方差分析就是對試驗數據進行分析,檢驗方差相等的多個正態總體均值是否相等,進而判斷各因素對試驗指標的影響是否顯著
正態性;(單樣本、獨立樣本、配對樣本T檢驗都需要,可以用K-S檢驗法,在SPSS中的「分析」–「非參數檢驗」—「單樣本」中;或者直接根據直方圖、P-P圖,Q-Q圖來觀察或根據偏度峰度法來分析)
獨立性;(獨立樣本T檢驗要求)
方差齊性;(獨立樣本T檢驗要求,使用Levene’s檢驗,兩樣本T檢驗中提供Levene’s檢驗,如需更詳細的檢驗結果可在「分析」–「描述統計」–「探索」中進行,如果不滿足方差齊性的話可以進行對數變換、平方根變換、平方根反正弦變換、平方變換、倒數變換)
前面所介紹的T檢驗只能對兩個總體進行檢驗,而對於多個總體進行差異性推斷的話會導致多次檢驗的誤差會疊加,所以引入方差分析,可以進行均數間的多重比較、各組均數的精細比較(可以指定要比較的兩個組,通過設定係數)