作者:薛定餓了麼
連結:https://www.zhihu.com/question/30272097/answer/472809487
來源:知乎
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。
後文將對該三個問題作出解釋,最後推薦一個CrashCourse的統計學掃盲課程
一.什麼是顯著性檢驗?
在統計學中,顯著性檢驗是「統計假設檢驗」(Statistical hypothesis testing)的一種,顯著性檢驗是用於檢測科學實驗中實驗組與對照組之間是否有差異以及差異是否顯著的辦法。「統計假設檢驗」這一正名實際上指出了「顯著性檢驗」的前提條件是「統計假設」,換言之「無假設,不檢驗」。在使用顯著性檢驗之前必須在心裡明白自己的統計假設(無效假設,也稱為零假設)是什麼,否則顯著性檢驗就是「水中月,鏡中花」。
一般來說顯著性檢驗會先對科研數據做一個無效假設,然後用檢驗來檢查作出的假設是否正確。
無效假設:數據結果之間本身不存在顯著性差異。(差異:我不是,我沒有,你看錯了)
若原假設為真,而檢驗的結論卻勸你放棄原假設。此時,我們把這種錯誤稱之為第一類錯誤。通常把第一類錯誤出現的概率記為α
若原假設不真,而檢驗的結論卻勸你採納原假設。此時,我們把這種錯誤稱之為第二類錯誤。通常把第二類錯誤出現的概率記為β
通常只限定犯第一類錯誤的最大概率α, 不考慮犯第二類錯誤的概率β。我們把這樣的假設檢驗稱為顯著性檢驗,概率α稱為顯著性水平。顯著性水平是數學界約定俗成的,一般有α =0.05,0.01的情況。代表著顯著性檢驗的結論錯誤率必須低於5%或1%
在目前的統計學中,通常將(閾yǜ值)發生機率小於5%的事件稱之為「不可能事件」,在不同的領域內該閾值(P)有其特定的統計意義和不同的取值
(以上解釋了顯著性檢驗與統計假設檢驗的關係)
統計假設檢驗是什麼?
所謂統計假設檢驗就是事先對總體(隨機變量)的參數或總體分布形式做出一個假設,然後利用樣本信息來判斷這個假設是否合理。而把只限定第一類錯誤概率的統計假設檢驗就稱之為顯著性檢驗。在上例中,我們的假設就是一種顯著性檢驗。因為方差檢驗不適用於估計參數和估計總體分布,而適用於檢驗試驗的兩個組間是否有差異。而方差檢驗正是用於檢測我們所關心的是這兩個集合(兩個分布)的均值是否存在差異。
二.為什麼要做顯著性檢驗?
為了方便接下來的解釋,這裡假設一個問題場景。
王先森開了一家公司,該公司分別在北京和杭州開設了分公司。現在存在下列數據作為兩個分公司的銷售額,樣本集合中的每一個數代表著一年中各個月的公司銷售額。
(一共12個月的數據,強迫症不用數了)
北京分公司B = {23,25,26,27,23,24,22,23,25,29,30,32}
杭州分公司H = {24,25,23,26,27,25,25,28,30,31,29,28}
王先森想要知道兩個公司的銷售額是否有存在明顯的差異(即是否存在北京分公司銷售額>杭州分公司銷售額,抑或反之)以便對接下來公司的戰略業務調整做出規劃。下屬們知道王老闆的難處,紛紛建議「只需要求平均值就知道哪個分公司的銷售額更大了」。但是作為擁有高學歷的王先森知道「我們生活在概率的世界之中」。那也就意味著,平均值並不能夠說明什麼問題,即便杭州分公司的銷售額平均值大於北京分公司的銷售額平均值仍然不能說明杭州分公司的銷售額一定就大於北京分公司的銷售額,因為「這樣一種看似存在的大於關係實質上是偶然造成的而並不是一種必然」。
(有數學直覺的人都知道平均數並不像以前小學老師講的那樣能簡單粗暴解決這個大問題)
三.怎麼做顯著性檢驗?
王先森根據零假設的定義,作出「兩個分公司的銷售額沒有顯著差異」的假設,最後王先森計算得出,方差檢驗的p 值= 0.459,那也就意味著,雖然杭州分公司的年平均銷售額26.75大於北京分公司的銷售額25.75,但是實質上,兩個分公司的銷售額並沒有明顯的差異。
銷售額統計
分公司 個案數 平均值 標準差 標準誤差平均值
1 12 25.75 3.166 .914
2 12 26.75 2.491 .719
(相信此時的你心中有萬千草泥馬奔過:p值是什麼東西?為什麼p=0.459意味著銷售額沒有明顯差異?方差檢驗是怎麼做到的?不要急,不要慌,我們一手一個慢動作)
由於王先森想要知道兩個公司的銷售額是否有存在明顯的差異 ,所以他的無效假設就是「樣本集B(北京分公司)和樣本集H(杭州分公司)不存在顯著性差異,換言之這兩個集合沒有任何區別(銷售額間沒有區別)!」。那麼問題來了,為什麼王先森要假設這兩個樣本集之間不存在任何區別,而不是假設這兩個樣本集存在區別。因為這個假設(Hypothesis)正是方差檢驗的原假設(null hypothesis)。問題又來了,什麼是原假設。所謂原假設是數學界為了方便討論而默認的「原始的假設」。沒有什麼reason可言,這是約定好的。
無效假設:是對研究總體提出一個假想目標,所謂「無效」是指處理效應與假設值之間沒有真實差異,試驗結果所得的差異乃誤差所致。國內多譯作零假設
具體求解該過程需要利用到方差分析的方法。
方差分析(Analysis of Variance,簡稱ANOVA),又稱「變異數分析」,是R.A.Fisher發明的,用於兩個及兩個以上樣本均數差別的顯著性檢驗。
其中方差分析的結果中將給出p值,p值是衡量控制組與實驗組差異大小的指標。
在顯著性水平α =0.05的情況下,p>0.05接受原假設,p值<0.05拒絕原假設。我們的原假設是樣本集B和樣本集H間不存在顯著性差異,但是由於p=0.459>0.05,所以接受原假設,即樣本集B和樣本集H間不存在顯著性差異。如果這裡的p值小於0.05,那麼就要拒絕原假設,即集合B和集合H間存在顯著性差異。
對於p的另一種角度:這個情境下的p=0.459,意思就是說偶然因素導致數據發生這種差異的概率是0.459,跟0.05一比大好多。那麼就是說偶然因素很有可能導致了這種差異,所以數據本身之間是不存在差異的。【引申到比如p=0.02<0.05,偶然因素導致差異的概率是0.02,不太可能是偶然因素使得壞,所以得出結論是數據本身之間存在差異】
在這個問題下可以根據顯著性水平α和0.05的關係由法則"大同小異"得出是否存在顯著差異。
"大同":顯著性水平α>0.05,王先森的兩家分公司銷售額大致相同,不存在顯著性差異。
"小異":顯著性水平α<0.05,王先森的兩家分公司銷售額不相同,存在顯著性差異。
https://www.bilibili.com/video/av20624185?p=22www.bilibili.com