卡方檢驗、T-test、F檢驗區別
卡方檢驗卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬於非參數檢驗的範疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。例如:在番茄中以純合的紫莖、缺刻葉植株(AACC)與純合的綠莖、馬鈴薯葉植株(aacc)雜交,F2得到454個植株,其中4種表型的計數分別為:紫莖缺刻葉247、紫莖馬鈴薯葉90、綠莖缺刻葉83、綠莖馬鈴薯葉34。判斷該實驗結果是否符合孟德爾的9:3:3:1的理論比率,可以用卡方檢驗。1、求卡方值:
2、求自由度
(行數-1)*(列數-1)=(2-1)*(4-1)=3
3、設置差異顯著性 5%查表p=0.05,df=3,卡方值是7.82
1.71< 7.82,統計學認為在5%顯著水平上差異不顯著,觀察頻數和理論頻數之間的差異屬於隨機誤差。
獨立樣本t檢驗統計量為:
S12和 S22為兩樣本方差;n1 和n2 為兩樣本容量。為了進行獨立樣本t檢驗,需要一個自(分組)變量(如性別:男、女)與一個因變量(如身高測量值)。根據自變量的特定值,比較各組中因變量的均值。如用t檢驗比較男、女身高的均值。
值得注意的是t檢驗是方差齊性檢驗,因此在使用t檢驗前需要檢驗方差齊性,方差不齊的話要進行非參數檢驗。F檢驗「F檢驗」,是R.A.Fisher發明的,又稱方差分析(Analysis of Variance,簡稱ANOVA),或「變異數分析」。F檢驗是看F分布,而F value是SSB(組間方差)/SSW(組內方差),如果我們把組間方差理解為兩組之間的差異,組內方差理解為兩組內部不同數據的差異的話,那麼簡單點說,兩個數據在有差異的前提下,究竟是組間的差異大,還是組內的差異大?如果是組間的差異大,那麼這兩組數據本身不一致的概率就非常大了,對應F值比較大。然後查表看結果(有兩個自由度:組間小df,組內大df)。通過把所得到的統計檢定值,與統計學家建立了一些隨機變量的概率分布(probability distribution)進行比較,我們可以知道在多少%的機會下會得到目前的結果。倘若經比較後發現,出現這結果的機率很少,亦即是說,是在機會很少、很罕有的情況下才出現;那我們便可以有信心的說,這不是巧合,是具有統計學上的意義的(用統計學的話講,就是能夠拒絕虛無假設null hypothesis,Ho)。相反,若比較後發現,出現的機率很高,並不罕見;那我們便不能很有信心的直指這不是巧合,也許是巧合,也許不是,但我們沒能確定。
F值和t值就是這些統計檢定值,與它們相對應的概率分布,就是F分布和t分布。統計顯著性(sig)就是出現目前樣本這結果的機率。
由於F檢驗的F值是SSB/SSW,如果兩組方差齊,即組內方差相等,如果兩組有變異,那麼全部都是由於組間差異造成的,F檢驗自然成了t檢驗。t檢驗的前提是方差齊,只有方差齊了,t檢驗的結果才反應兩組數據的是否有差異,否則如果方差不齊的話,會把組內的差異也考慮進去,所以判定的概率就更寬鬆;而F檢驗其實就是看組間差異和組內差異的比較,所以本質上和t檢驗方差齊的概念相似。但是實際上在方差不齊的時候是無法進行t檢驗的,結果不具有統計學意義。t檢驗一般適用於兩組,所以在多維的情況下,不適用t檢驗,而F檢驗可以判定多組、一組多變量和多組間有交互(單因素、協方差、雙因素無重複、雙因素有重複等),然後在通過兩兩比較進行分析,用duncan和tukey等方法去判定,F檢驗的範圍要大的多。t檢驗可以說是F檢驗的一種特殊應用方差和標準差相信很多人看到這裡還不明白什麼是方差,什麼是標準差 ,方差的算術平方根就是標準差。對象總體標準差: