假設檢驗的基本步驟
假設檢驗的基本思想是:根據所獲樣本,運用統計分析方法,對總體X的某種假設 做出接受或拒絕的判斷。具體做法如下:
1.建立假設
: =1.40
這是原假設,在本例中的含義是:「與設計值一致」即「當日生產正常」。要使當日生產化纖的纖度的均值與1.40毫無差別是辦不到的,若差異僅是由隨機誤差引起的,則可認為 成立;若由其他特殊因素引起的,則認為差異顯著,則應拒絕 .與 相反的假設是:
: 1.40
這是備擇假設,它是在原假設被拒絕時而應接受的假設。在這裡,備擇假設還可能有兩種設置形式,它們是:
: <1.40或 : >1.40
備擇假設的不同將會影響下面拒絕域的形式,今後稱
對 的檢驗問題是雙側假設檢驗問題
對 的檢驗問題是單側假設檢驗問題
對 的檢驗問題也是單側假設檢驗問題
註:若假設是關於總體參數的某個命題,稱為參數的假設檢驗問題,比如:
都是參數假設檢驗問題。
2.選擇檢驗統計量,給出拒絕域的形式
這個假設檢驗問題涉及正態均值 .因此選用樣本均值 是妥當的。從圖1.5-1上看出,把 作為 分布均值更容易把 與 區分。 在 已知和原假設 成立下,有
這裡的u就是今後使用的檢驗統計量,其中 =1.40, ,n=25.
考察這個統計量,可以看出:
愈小, 愈接近 ,應傾向接受 ,
愈大, 離 愈遠,應傾向拒絕 .
我們把注意力放在導致拒絕 的拒絕域(樣本空間某子集)上,設c為區分拒絕 與接受 的臨界值。若用W表示拒絕域,則有:
W={( ): >c} ={ >c}
這就是本例中拒絕 的拒絕域,如何確定c呢·下面來研究這個問題。
我們為什麼把注意力放在拒絕域上呢·用一個樣本(相當一個例子)證實一個命題,其理由是不充分的,但用一個樣本推翻一個命題,其理由是充分的。因此我們把注意力放在拒絕域方面,建立拒絕域。其實在拒絕域和接受域之間還有一個模糊域,如今把它併入接收域 .
3.給出顯著性水平 在作判斷時會犯錯誤,要允許犯錯誤,我們的任務是控制犯錯誤的概率。在假設檢驗中,錯誤有兩類
第一類錯誤(拒真錯誤):原假設 為真,但由於抽樣的隨機性,樣本落在拒絕域W內,從而導致拒絕 ,其發生概率記為 ,又稱為顯著性水平;
第二類錯誤(取偽錯誤):原假設 不真,但由於抽樣的隨機性,樣本落在 內,從而導致接受 ,其發生概率為 .
理論研究表明:
(1)在相同樣本量下,要使 小,必導致 大;
(2)在相同樣本量下,要使 小,必導致 大;
(3)要使 、 皆小,只有增大樣本量n才可達到,這在實際中有時並不可行。
折中方案是:控制 ,但不使 過小,在適當控制 中制約 ,常選 =0.05,有時也用 =0.10或0.01.
把第一類錯誤發生概率控制在 的意思是:在 為真(即 )的情況下,樣本點落在拒絕域W的概率為 ,即:
P(W)= 或:
P( >c)= 由此概率等式可確定c .
4.確定臨界值c,給出拒絕域形
由標準正態分布 的分位數性質知 與 互為相反數,即 =- ,從而可得拒絕域。
W= {u< 或u> }
={ > }
比如,在本例中 =0.05,則可查得:
=1.96
故本例的拒絕域為:
:{ >1.96}
5.判斷
當根據樣本計算的檢驗統計量落人拒絕域 ,則拒絕 ,即接受 .
當根據樣本計算的檢驗統計量未落人拒絕域 內,則接受 .
如今 =1.38, =1.40, =0.04,n=25
可得:
由於
=2.5>1.96= 故拒絕 ,接受 .
結論:在 =0.05時,當日纖度均值與1.40間有顯著差異。其含意是:當日生產過程與沒計值 =1.40有顯著差異,應調節生產設備,使其生產過程恢復正常。