在上一期的假設檢驗內容中,我們提到要記住 p<0.05 這個節點。那麼問題來了,各種檢驗中都有的 p 值究竟是什麼?當 p<0.05 時,統計結果蘊藏著怎樣的玄機?歡迎走進今天的「隨手學統計」,丁香調查帶你認識這個繞不過的 p 值。
首先,毋庸置疑,p 值是個概率。其真實的含義是當假設情形為真時,出現超出假設中的極端觀察結果的概率。
還沒完全看懂這個定義是在說什麼?沒關係,我們繼續用上期品茶女士的例子來說明,沒看過上一期的朋友們,可在微信中回復「品茶」進行查看。
原假設:我們認為品茶女士沒有品茶能力
觀察結果:品茶女士把 8 杯茶都品了出來
p 值:0.014
這裡 p 值代表的含義是:如果品茶女士沒有品茶能力,那麼她品出 8 杯茶的概率是0.014。
對,這個 p 值(概率)很小很小!所以根據小概率原理,Fisher 君毫無顧慮地把原假設推翻了。小概率原理簡單的說就是,一個事件如果發生的概率很小的話,那麼它在一次試驗中是幾乎不可能發生的,但在多次重複試驗中幾乎是必然發生的。統計學上一般認為,事件發生概率 p < 0.05 即為小概率事件。
當你為自己終於搞懂了什麼是原假設、什麼是 p 值而高興時,我們必須要在這個時候對你說一個很殘酷的事實,這麼多年來你也許把 p 值用錯了!
誤區一:誤把 p 值大小等同於差異大小
我用你的對照組也完成了一個對照試驗,我的 p 值 <0.01 誒,哈哈,我的 p 值比你小,說明我的藥效比你強!B 藥你說錯了哦,這裡的 p 值大小不能表示兩種藥效差異大小,只能表明你們與對照組的差異均有統計學上的顯著性。如果要知道你們之間藥效是否差異,還需要單獨將你們倆作統計比較。
提示:不同實驗中 p<0.05 的意義不表示各實驗結果差異的大小,它只反映各實驗中原假設在統計學上不被認可的概率。
誤區二:沉迷統計學結果 忽視專業判斷
老師,我這次測量兩組患者的收縮壓分別為(126.0±3.1)mmHg、(133.0±2.9)mmHg,經統計檢驗後發現兩者的差異有統計學意義(p<0.05)。哈哈,這一次終於可以把文章發出去了!且慢!讓我們再仔細看一看你的數據。126mmHg 和 133mmHg 這兩組收縮壓完全在正常範圍內!你要用正常血壓之間差異的統計學顯著性來說明什麼問題呢?這個 p 值有實際的意義嗎?提示:顯著性檢驗只是統計結論,判斷差別還要根據專業知識。這個過程在統計分析中是關鍵性的一步,但往往被很多醫生朋友們所忽略。
誤區三:當p>0.05 時,誤將結論絕對化
一般認為動脈血氧含量能影響氧運輸量,而本研究結果顯示吸 NO 前後血氧飽和度(SpO2)差異的 p>0.05,那我可以認為「動脈血氧含量對患者氧運輸量增加沒有影響」嗎?
這樣理解是不對的。這裡 p>0.05 並不代表「吸了 NO 前後的 SpO2 就一定無變化」, 只是尚且不能拒絕「動脈血氧含量對患者氧運輸量增加沒有影響」這個假設。
本研究沒有在統計學上觀察到動脈血氧含量對患者氧運輸量有影響,很可能是樣本量不足等原因導致統計效率低下。這就涉及到其他的統計學知識。
提示:p>0.05 時,差異無統計學意義,根據統計學原理可知,我們只是不能拒絕原假設,但並不認為原假設肯定就是百分百沒問題的。
本次「隨手學統計」主要闡述了 p 值的含義。簡而言之,p 值表示結果可以由抽樣誤差解釋的可能性。在醫學統計檢驗中,我們不僅要看 p 值,更需要關注真實差異是否足夠大,是否具有專業意義。同時,樣本量也是決定 p 值的關鍵因素,因為篇幅,不再贅述。
小結:
p 值只反映差異有無統計學意義;
下結論時應將統計學結果和專業情況結合起來;
p>0.05 時,說明統計學結果不能拒絕原假設,但並不認為原假設肯定成立。