卡方檢驗,T檢驗和F檢驗

2021-02-19 01說

卡方檢驗、T-test、F檢驗區別

卡方檢驗卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬於非參數檢驗的範疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變量的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。

例如:在番茄中以純合的紫莖、缺刻葉植株(AACC)與純合的綠莖、馬鈴薯葉植株(aacc)雜交,F2得到454個植株,其中4種表型的計數分別為:紫莖缺刻葉247、紫莖馬鈴薯葉90、綠莖缺刻葉83、綠莖馬鈴薯葉34。判斷該實驗結果是否符合孟德爾的9:3:3:1的理論比率,可以用卡方檢驗。

1、求卡方值:

2、求自由度

(行數-1)*(列數-1)=(2-1)*(4-1)=3

3、設置差異顯著性 5%

查表p=0.05,df=3,卡方值是7.82
1.71< 7.82,統計學認為在5%顯著水平上差異不顯著,觀察頻數和理論頻數之間的差異屬於隨機誤差。

t檢驗為了確定從樣本(sample)統計結果推論至總體時所犯錯的概率,一般是小樣本,n<30。t檢驗可分為單總體檢驗和雙總體檢驗,以及配對樣本檢驗。這裡主要舉例說明雙總體檢驗(即獨立樣本t檢驗),雙總體t檢驗是檢驗兩個樣本平均數與其各自所代表的總體的差異是否顯著。

獨立樣本t檢驗統計量為:

S12和 S22為兩樣本方差;n1 和n2 為兩樣本容量。

為了進行獨立樣本t檢驗,需要一個自(分組)變量(如性別:男、女)與一個因變量(如身高測量值)。根據自變量的特定值,比較各組中因變量的均值。如用t檢驗比較男、女身高的均值。

值得注意的是t檢驗是方差齊性檢驗,因此在使用t檢驗前需要檢驗方差齊性,方差不齊的話要進行非參數檢驗。F檢驗「F檢驗」,是R.A.Fisher發明的,又稱方差分析(Analysis of Variance,簡稱ANOVA),或「變異數分析」。F檢驗是看F分布,而F value是SSB(組間方差)/SSW(組內方差),如果我們把組間方差理解為兩組之間的差異,組內方差理解為兩組內部不同數據的差異的話,那麼簡單點說,兩個數據在有差異的前提下,究竟是組間的差異大,還是組內的差異大?如果是組間的差異大,那麼這兩組數據本身不一致的概率就非常大了,對應F值比較大。然後查表看結果(有兩個自由度:組間小df,組內大df)。

F檢驗和t檢驗的區別一般而言,為了確定從樣本(sample)統計結果推論至總體時所犯錯的概率,我們會利用統計學家所開發的一些統計方法,進行統計檢定。

通過把所得到的統計檢定值,與統計學家建立了一些隨機變量的概率分布(probability distribution)進行比較,我們可以知道在多少%的機會下會得到目前的結果。倘若經比較後發現,出現這結果的機率很少,亦即是說,是在機會很少、很罕有的情況下才出現;那我們便可以有信心的說,這不是巧合,是具有統計學上的意義的(用統計學的話講,就是能夠拒絕虛無假設null hypothesis,Ho)。相反,若比較後發現,出現的機率很高,並不罕見;那我們便不能很有信心的直指這不是巧合,也許是巧合,也許不是,但我們沒能確定。

F值和t值就是這些統計檢定值,與它們相對應的概率分布,就是F分布和t分布。統計顯著性(sig)就是出現目前樣本這結果的機率。

由於F檢驗的F值是SSB/SSW,如果兩組方差齊,即組內方差相等,如果兩組有變異,那麼全部都是由於組間差異造成的,F檢驗自然成了t檢驗。t檢驗的前提是方差齊,只有方差齊了,t檢驗的結果才反應兩組數據的是否有差異,否則如果方差不齊的話,會把組內的差異也考慮進去,所以判定的概率就更寬鬆;而F檢驗其實就是看組間差異和組內差異的比較,所以本質上和t檢驗方差齊的概念相似。但是實際上在方差不齊的時候是無法進行t檢驗的,結果不具有統計學意義。t檢驗一般適用於兩組,所以在多維的情況下,不適用t檢驗,而F檢驗可以判定多組、一組多變量和多組間有交互(單因素、協方差、雙因素無重複、雙因素有重複等),然後在通過兩兩比較進行分析,用duncan和tukey等方法去判定,F檢驗的範圍要大的多。t檢驗可以說是F檢驗的一種特殊應用方差和標準差相信很多人看到這裡還不明白什麼是方差,什麼是標準差 ,方差的算術平方根就是標準差。對象總體標準差:


相關焦點

  • 卡方檢驗、t檢驗和方差分析的區別
    如果是定類和定類,此時應該使用卡方分析;如果是定類和定量,此時應該使用方差或者T檢驗。方差和T檢驗的區別在於,對於T檢驗的X來講,其只能為2個類別比如男和女。如果X為3個類別比如本科以下,本科,本科以上;此時只能使用方差分析。
  • 統計學常用概念|T檢驗、F檢驗、卡方檢驗、P值、自由度
    5、問:所有的檢驗統計都是正態分布的嗎?答:並不完全如此,但大多數檢驗都直接或間接與之有關,可以從正態分布中推導出來,如t檢驗、F檢驗或卡方檢驗。這些檢驗一般都要求:所分析變量在總體中呈正態分布,即滿足所謂的正態假設。許多觀察變量的確是呈正態分布的,這也是正態分布是現實世界的基本特徵的原因。
  • 搞定統計學必知:P值、T檢驗、卡方檢驗、假設檢驗……
    t檢驗適用於兩個變量均數間的差異檢驗,多於兩個變量間的均數比較要用方差分析。無論哪種類型的t檢驗,都必須在滿足特定的前提條件下: 正態性和方差齊性,應用才是合理的。這是因為必須在這樣的前提下所計算出的t統計量才服從t分布,而t檢驗正是以t分布作為其理論依據的檢驗方法。t檢驗是目前醫學研究中使用頻率最高,醫學論文中最常見到的處理定量資料的假設檢驗方法。在最後結論中判斷什麼樣的顯著性水平具有統計學意義,不可避免地帶有武斷性。
  • 理解 t 檢驗與 F 檢驗的區別
    F值和t值就是這些統計檢定值,與它們相對應的概率分布,就是F分布和t分布。統計顯著性(sig)就是出現目前樣本結果的機率。統計學結果的意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變量的關聯是總體中各變量關聯的可靠指標。意即通常情況下,p值越小,對我們的假設越有利。
  • 你知道T檢驗與F檢驗嗎?
    舉一個例子,比如,你要檢驗兩獨立樣本均數差異是否能推論至總體,而行的t檢驗。兩樣本 (如某班男生和女生) 某變量 (如身高) 的均數並不相同,但這差別是否能推論至總體,代表總體的情況也是存在著差異呢?會不會總體中男女生根本沒有差別,只不過是你那麼巧抽到這2 樣本的數值不同?為此,我們進行t檢定,算出一個t檢定值。
  • 統計中重要的檢驗:T檢驗、F檢驗及其統計學意義
    本文從T檢驗、F檢驗及其統計學意義來講,主要內容涉及T檢驗和F檢驗的由來,T檢驗和F檢驗的關係等內容。
  • T檢驗與F檢驗,傻傻分不清楚?
    T 檢驗和 F 檢驗至於具體要檢定的內容,須看你是在做哪一個統計程序。舉一個例子,比如,你要檢驗兩獨立樣本均數差異是否能推論至總體,而行的 t 檢驗。兩樣本 (如某班男生和女生) 某變量 (如身高) 的均數並不相同,但這差別是否能推論至總體,代表總體的情況也是存在著差異呢?
  • 卡方合併檢驗 vs 卡方分割檢驗
    我們用兩個問到的例子來分別介紹卡方合併檢驗和卡方分割檢驗的SPSS操作。
  • 「統計檢驗」t檢驗和F檢驗
    我們今天來聊一聊t檢驗和F檢驗。t檢驗是在其他解釋變量不變時,檢驗單個解釋變量對被解釋變量的影響。F檢驗是檢驗整個方程,即所有解釋變量聯合起來對被解釋變量的影響。假設我們的模型為:t檢驗是對單個係數進行檢驗,如果解釋變量X是顯著的,那麼參數β1應該顯著地不為0。
  • 方差、標準差、正態分布、超幾何分布、卡方檢驗、t檢驗基礎概念
    方差方差是在概率論和統計方差衡量隨機變量或一組數據時離散程度的度量。概率論中方差用來度量隨機變量和其數學期望(即均值)之間的偏離程度。統計中的方差(樣本方差)是每個樣本值與全體樣本值的平均數之差的平方值的平均數。在許多實際問題中,研究方差即偏離程度有著重要意義。方差是衡量源數據和期望值相差的度量值.
  • 【寫作助手】手把手教你如何區分T檢驗與F檢驗
    它主要用於:均數差別的顯著性檢驗、分離各有關因素並估計其對總變異的作用、分析因素間的交互作用、方差齊性(Equality of Variances)檢驗等情況。4. T 檢驗和 F 檢驗的關係t 檢驗過程,是對兩樣本均數(mean)差別的顯著性進行檢驗。
  • 卡方檢驗的理解
    卡方檢驗的理論知識卡方檢驗定義:卡方檢驗是假設檢驗的一種方法
  • 如何快速搞定 SPSS 卡方檢驗?
    ,這些情況下,參數檢驗技術就未必適用了,因此我們還需要掌握一些非參數檢驗技術,其中最為常用的就是卡方檢驗,它最適合於次數分布檢驗。例如,樣本來自的總體數據不符合正態分布,此時可採用卡方檢驗完成。另外研究定類變量和定序變量之間的關係時,由於定類或者定序變量都不具有完備的運算性能,因此無法對總體某種參賽的計算,可採用非參數檢驗如卡方檢驗來完成。
  • 管理心理學之統計(24)獨立性的卡方檢驗
    卡方檢驗的目的在於確定總體間是否存在顯著的差異。例如H0:在學生的總體中,性格內向的人的顏色喜好分布於性格外向的人的顏色喜好分布之間不存在顯著差異。兩個分布有相同的形狀和相同的比例。雖然形式不同,但這兩種概念形式之間具有等價性。備擇假設H1認為總體有不同的比例。例如H1:性格內向的人的顏色喜好分布與性格外向的人的顏色喜好分布之間存在差異。
  • 手把手帶你搞定 SPSS 卡方檢驗
    ,或者無法確定其是否正態分布,由於缺乏足夠信息,總體的分布未知,這些情況下,參數檢驗技術就未必適用了,因此我們還需要掌握一些非參數檢驗技術,其中最為常用的就是卡方檢驗,它最適合於次數分布檢驗。例如,樣本來自的總體數據不符合正態分布,此時可採用卡方檢驗完成。另外研究定類變量和定序變量之間的關係時,由於定類或者定序變量都不具有完備的運算性能,因此無法對總體某種參賽的計算,可採用非參數檢驗如卡方檢驗來完成。
  • 卡方檢驗多種用途總結
    方法分類與T檢驗一樣,卡方檢驗可對包括單個樣本、兩獨立樣本、兩配對樣本等進行統計檢驗,具體方法分類如下:卡方優度檢驗卡方優度檢驗,是對一列數據進行統計檢驗,分析單個分類變量實際觀測的比例與期望比例是否一致。案例:當前收集了100份數據用於研究,其中有48名男性,52位女性。
  • 卡方檢驗在實際工作中的應用
    答案是:卡方檢驗。為什麼用卡方檢驗?定義是什麼?既然是對兩個分類變量(設計因素、高低CTR)做相關分析,卡方檢驗很適用於此案例。卡方檢驗怎麼做?思路是什麼?在基本的假設檢驗思路上,卡方檢驗與t檢驗、F檢驗等有著相似的過程:建立無效假設H0:觀察頻數與期望頻數沒有差別(即某一因素設計水平下高低點擊率廣告圖頻數與平均頻數沒有區別);在假設H0成立基礎上,計算出χ2值來表徵觀察值與理論值之間的偏離程度;根據
  • R語言檢驗獨立性:卡方檢驗(Chi-square test)
    在這篇文章中,我將展示如何計算列聯表,我將在列聯表中引入兩個流行的測試:卡方檢驗和Fisher精確檢驗。什麼是列聯表?列聯表提供關於兩個分類變量的測量的整數計數。統計檢驗用於確定來自不同組的測量值是否獨立的兩種最常見的測試是卡方檢驗(χ2χ2測試)和費舍爾的精確測試。請注意,如果測量結果配對,則應使用McNemar測試(例如,可以識別單個織機)。皮爾遜的卡方檢驗該 χ2χ2test是一種非參數測試,可應用於具有各種維度的列聯表。
  • 卡方檢驗(2x2表格)
    摘自:醫學統計園(微信公眾號)臨床上會遇到評價兩種藥物,對治療同一種疾病的不同患者,哪一種療效會更好,如下表,這時就需要用到卡方檢驗。卡方檢驗是針對計數資料的一種檢驗方法。如果卡方值越大,超出了設定檢驗水準(α=0.05)下的卡方值(χdf,0.05),則認為實際值與理論值之間偏差屬於隨機誤差的概率較小,故而拒絕H0假設;若卡方值為0,則表示觀察值與理論值完全一致。下面介紹如何使用SPSS對2x2表格,進行卡方檢驗;如前所述,對數據的預處理,是數據分析過程中花費時間最多也是最麻煩的,因此我們先講述如何將計量資料輸入SPSS。
  • 假設檢驗、Z檢驗與T檢驗
    概述假設檢驗是統計學、分析學和數據科學中的一個關鍵概念了解假設檢驗的工作原理、Z檢驗和t檢驗之間的區別以及其他統計概念介紹冠狀病毒大流行使我們大家都成了一個統計學家。我們不斷地核對數字,對大流行將如何發展做出自己的假設,並對何時出現「高峰」提出假設。