作者:丁點helper
來源:丁點幫你
今天我們開始講什麼是卡方分布及卡方檢驗。
第一個問題是,卡方為什麼有平方?
還記得我們在第一篇講兩類錯誤中談過的賭場的例子嗎,小金賭色子輸了很多錢,為了看色子是否有問題,他偷了一顆拿回家想偷偷驗證一下是否有人動手腳。
小金悶在家丟了一天,一共丟了902次,而且每一次都做了記錄(丟的是昏天黑地,可腦補這個畫面)。
下面表格就是小金記錄的獲得的點數情況,比如一共有242次(27%)出現1點,有56次(6%)出現2點……有196次(22%)出現6點。
實際情況的色子點數
小金怎樣通過」狂丟色子「來判斷其是否有問題呢?
這就需要用到卡方檢驗了,實際上也是假設檢驗的大邏輯。
我們知道小金一共丟了902次,假設這顆色子是正常均勻的,那麼每次丟色子,每一點出現的可能性都是1/6,所以理論上每一點出現的次數應該都是:150.33=902/6次。
如下表:我們把每一點實際出現的次數與理論情況下應該出現的次數做一個對比,其中實際觀察次數用A表示,理論次數用T表示:
色子點數:理論VS實際
採用假設檢驗的標準語言來驗證就是:
H0:這顆色子是均勻公平,每一點出現的可能性都為1/6;
H1:這顆色子不是均勻公平的,每一點點數出現的概率不都相同;
如果H0假設成立,那麼「觀察次數」和「理論次數」之間不會差很多;可是如果兩者的差距過大,達到我們規定的某個水平,就認為在H0假設成立的情況下是不會出現的,此時就會拒絕原假設,即認為這個色子不是均勻的。
那怎麼來計算這個差呢?
依照我們講標準差的思路,如果直接將實際情況的點數與理論情況點數相減再加和取平均數,基本會得到0的結果,沒有什麼意義,而取絕對值運算又不方便,所以還是得通過平方。這就是卡方中平方的由來。
卡方值計算
上面這個計算公式,A代表「實際頻數」,T代表「理論頻數」。
如果把這個公式應用到小金丟色子的例子,就會得到:
卡方值為274.92,其對應的P值小於0.01,也就意味著,如果原假設成立(色子沒問題),那麼「理論與現實」出現這麼大的差距的可能低於5%,我們認為這是不可能,因此,要拒絕原假設,認為「色子有問題」。
所以「十賭九輸」是有原因的。
好了,回到今天的正題,小夥伴們可能覺得上面的例子和平常用到的卡方檢驗好像不太一樣。
實際上,原理完全一致。
卡方檢驗最常用的是檢驗兩個率是否一致,對照上述「丟色子」的例子,我們會先假設這兩個率(注意是指總體率)相等,通過相等的總體率,再反推理論發生的頻數,然後計算實際的觀察頻數與理論頻數的卡方值來判斷差距是否足夠大,從而決定假設是否可以被拒絕。
下面以新冠肺炎為例,說明一下卡方檢驗的應用。
為比較A、B兩個城市新冠肺炎病例的檢出情況,分別隨機抽取A地377人,B地301人,進行核酸檢測。結果見下表(數據純屬虛構),現判斷兩個城市的新冠肺炎檢出率是否相同?
如上表,A地的檢出率是19.89%;B地的檢出率是32.89%,卡方檢驗就要來判斷這兩個樣本率所代表的總體率是否相等。
現在我們假設它們相等,那怎麼計算理論頻數呢?
此時就需要用到「合計檢出率——25.66% 「來算,這個數據就相當於上述色子例子中的1/6,是一個標準。
所以,如果兩城市新冠肺炎檢出率沒有區別,且大概都為25.66%,那理論上A地會檢出多少例呢?96.75(377*25.66%),而未檢出的就為280.25(377-96.75)。
同理,B地會檢出77.25(301*25.66%),未檢出的就為223.75(301-77.25)。
現在我們就得到了各城市檢出與未檢出的理論頻數,從而就能計算卡方值。
該卡方值對應的P值小於0.05,所以可以認為A、B兩個城市新冠肺炎的檢出率不一致,B檢出率更高,感染情況更嚴重。