作者 | CDA數據分析師
假設(hypothesis),又稱統計假設,是對總體參數的具體數值所作的陳述。假設檢驗(hypothesis test) 是先對總體參數提出某種假設,然後利用樣本信息判斷假設是否成立的過程。
假設檢驗的特點就是採用邏輯上的反證法和依據統計上 的小概率原理。小概率事件在單獨一次的試驗中基本上不會發生,可以不予考慮。在假設檢驗中,我們做出判斷時所依據的邏輯是:如果在原假設正確的前提下,檢驗統計量的樣本觀測值的出現屬於小概率事件,那麼可以認為原假設不可信,從而否定它,轉而接受備擇假設。
假設檢驗步驟
一個完整的假設檢驗過程,包括以下幾個步驟:
(1)提出假設;
(2)構造適當的檢驗統計量,並根據樣本計算統計量的具體數值;
(3)規定顯著性水平,建立檢驗規則;
(4)做出判斷。
假設檢驗的類型
(1)對陳述正確性的檢驗
在這種情況下,原假設通常是基於假定的陳述是正確的。然後建立備擇假設,為拒絕提供統計證據,從而證明這個假定的陳述是錯誤的。
(2)對研究性假設的檢驗
在研究性假設檢驗的調查研究中,應該建立原假設和備擇假設,並用備擇假設來表示研究性假設,這樣如果拒絕,將支持樣本所得出的結論以及應該採取某些行動。
(3)對決策情況下的檢驗
在決策情況下的檢驗研究中,決策者必須從兩種措施中挑選其中一種,無論是接受還是拒絕,都必須採取一定的措施。
對假設檢驗問題做出判斷可依據兩種規則
(1)P值規則
所謂P值,實際上是檢驗統計量超過(大於或小於)具體樣本觀測值的概率。如果P值小於所給定的顯著性水平,則認為原假設不太可能成立;如果P值大於所給定的標準,則認為沒有充分的證據否定原假設。
(2)臨界值規則
假設檢驗中,還有另外一種做出結論的方法:根據所提出的顯著性水平標準(它是概率密度曲線的尾部面積)查表得到相應的檢驗統計量的數值,稱作臨界值,直接用檢驗統計量的觀測值與臨界值作比較,觀測值落在臨界值所劃定的尾部(稱之為拒絕域)內,便拒絕原假設;觀測值落在臨界值所劃定的尾部之外(稱之為不能拒絕域)的範圍內,則認為拒絕原假設的證據不足。這種做出檢驗結論的方法,我們稱之為臨界值規則。
假設檢驗中的兩類錯誤
第Ⅰ類錯誤 (type Ⅰ error)
又稱棄真錯誤,當原假設為真時拒絕原假設。犯第Ⅰ類錯誤的概率通常記為α 。
第Ⅱ類錯誤(type Ⅱ error)
又稱取偽錯誤,當原假設為假時沒有拒絕原假設。犯第Ⅱ類錯誤的概率通常記為β。
在統計實踐中,進行假設檢驗時一般先控制第Ⅰ類錯誤發生的概率,並確定犯第Ⅰ類錯誤的概率最大值,稱為檢驗的顯著性水平。在樣本容量n不變的條件下,犯兩類錯誤的概率常常呈現反向的變化,要使α和β 都同時減小,除非增加樣本的容量。因此,統計學家奈曼與皮爾遜提出了一個原則:即在控制犯第一類錯誤的概率情況下,儘量使犯第二類錯誤的概率小。
在實際問題中,我們往往把要否定的陳述作為原假設,而把擬採納的陳述本身作為備擇假設,只對犯第一類錯誤的概率加以限制,而不考慮犯第二類錯誤的概率。
假設檢驗基本方法
檢驗形式
(1)雙側檢驗
雙側檢驗屬於決策中的假設檢驗。也就是說,不論是拒絕H0,還是接受H1 ,都必需採取相應的行動措施。
(2)單側檢驗
單側檢驗又可分兩種形式:
a、檢驗研究中的假設
將所研究的假設作為備擇假設H1,將認為研究結果是無效的說法或理論作為原假設H0。或者說,把希望(想要)證明的假設作為備擇假設。再做這類假設檢驗時應先確立備擇假設H1。
b、檢驗某項聲明的有效性
將所作出的說明(聲明)作為原假設,對該說明的質疑作為備擇假設,在做這類單側檢驗時,應先確立原假設H0。除非我們有證據表明「聲明」無效,否則就應認為該「聲明」是有效的。
單樣本假設檢驗
以均值為例進行如下分析分析,看適合哪種檢驗。
雙樣本假設檢驗
以均值差為例進行如下分析分析,看適合哪種檢驗。
以上就是我總結的假設檢驗的內容,希望能對你的知識梳理起到幫助。