在醫學研究中,統計學檢驗是驗證研究目的的重要手段。
0.05是常用的顯著性水平。P<0.05,是「萬眾期待」的結果。在差別性分析中,這通常說明我們達成了驗證目標。
那麼,p值未低於顯著性水平的檢驗結果,又告訴我們什麼呢?
這需要從檢驗假設說起:
以t檢驗為例。在驗證兩組正態分布數據的平均水平不同時(例如男性和女性身高是否存在差異),就會採用如下假設:
假設檢驗是在假定原假設成立的角度完成的,當P<0.05(差異有統計學意義)時,我們就認為原假設成立的可能性很小,於是拒絕原假設,接受備擇假設,認為二者平均水平不同。
從直觀上很容易想到,「既然P<0.05說明他們不同,那麼與之相反的,就是她們相同唄」
因此臨床研究中常見的錯誤就是:基於差異無統計學意義的統計結果做出相等性的結論。
假設檢驗的「核心思想」來自「反證」。通過明確驗證目標,並將他的反面設定為原假設。假設檢驗中先設定他的對立面是成立的,並完成統計計算,當對立面成立的可能性足夠小的時候就拒絕他,接受備擇假設,也就驗證了我們的目標。
基於這一點,我們拒絕原假設所需要的p值水平是嚴格公認的「足夠小」
這麼一來,我們很容易看到:p>0.05實際包括了五彩繽紛的實際情況。
但言而總之一句話:我可沒辦法說他們一定一樣喔,我只是說:我還沒理由拒絕它啊!
只有當p<0.05,出現如下情況時,
我們才理直氣壯的結束了戰鬥!
綜上,假設檢驗從根本上限定了:我們能夠驗證的只有備擇假設,而永遠無法驗證原假設成立。因為檢驗是基於原假設成立的角度做出的,p值>0.05,包含了多種實際情況 ,他們僅僅說明現有信息尚不足以拒絕原假設。
那麼,如果想驗證二者相同該怎麼辦呢?
首先,要驗證的結論必須站在備擇假設上。同時,需要通過驗證兩組間的差異小於可接受的差異範疇加以證明。
他有一個好聽的名字「等效性檢驗」