2016年3月18日 訊 /生物谷BIOON/ --最近一篇關於p值檢驗的總數統計總結了1990至2015以來的多篇生物醫學文獻,發現被錯誤理解的統計數據越來越多,報導p值時沒有同時報導應效應量和置信區間指標。
史丹福大學醫學院的研究人員做了一項針對數百萬計的期刊文章的研究統計。研究表明,文章作者報告p值的越來越多,但他們誤解了p值的含義。p值是報告科學結論是否真實的統計學意義的概率值。
研究人員發現,因為p值常被誤用,對p值使用的增多並不代表生物醫學研究或數據分析水平的提高。
"研究人員通常對p值的使用技術不佳,用有偏見的方式使用,因此變得非常具有誤導性。"斯坦福Meta-聯合創新中心主任、疾病預防和健康教授、醫學博士John Ioannidis說。這項研究將發表在3月15日JAMA雜誌中。
研究小組用自動搜索文本挖掘搜索生物醫學資料庫MEDLINE和PubMed Central,尋找數百萬計文章摘要中的p值檢驗,並手動篩查1000份摘要和100份全文。搜索的文章都是1990年到2015年發表的。
p值的普遍濫用--經常給可信的研究帶來錯誤--逐漸在學術界變為一件尷尬的事情,包心理學和生物醫學等領域。
比如對Nature,STAT和FiveThirtyEight的聲明就報導了p值的漏洞。3月7號,美國統計協會發表了一份聲明警告他們的濫用。其中聲明附帶的一則評論是波士頓大學流行病學家Kenneth Rothman的,他說:"這些問題很是致命的,可以肯定正因為科學家(和編輯、監管機構、記者和其他人)用顯著性檢驗解釋實驗結果,並因此沒有得到最有幫助的東西。"
研究小組從數百萬生物醫學文章摘要中統計得出,p值的報導從1990年的7.3%上升到2015年的15.6%。醫學核心期刊文章摘要中有33%使用p值,而隨機對照臨床試驗的一部分中,這個數據竟達到將近55%。
P值的含義?
P值是用來說明一個基本統計學問題。假設一個臨床試驗比較兩種藥物的治療效果,藥物A似乎比藥物比的療效高10%。這可能是因為藥物A確實更有效10%。或者在那次試驗中讓藥物A顯得更加有效。簡單來說,是藥物A幸運而已。那你怎麼知道到底是哪種情況?
P值評估的是"由於零假設是真,還得來這樣的數據"的可能性有多大--在這個例子中,零假設為真即藥物A和B的藥效沒有區別。所以舉例來講,如果藥物A和B的藥效相同,而你進行研究比較它們,得到p值是0.05,意思就是說藥物A有5%的可能性比藥物B的藥效強10%或更多。
"P值的確切定義是",該小組研究人員Ioannidis說,"如果零假設是正確的,觀察到這次實驗結果或一些更好結果的可能性。不幸的是,許多研究人員都誤以為p值代表零假設不正確的可能性或結果是真實的可能性。"
P值<真相
"P值並不是告訴你某些事情是否是真實的。如果你得到的p值為0.01,意思並不是說某些東西不真實的可能性有1%",Ioannids補充說,"p值為0.01可以代表結果20% 的真實性、80%的真實性或者0.1%的真實性--所有這些都可以有相同的p值。僅僅p值本身並不能告訴你結果的真實性。如果想真正評估結果的真偽性,應該用錯誤發現率和貝葉斯因子計算。
"
儘管p值的使用很受限,現在它竟然成為一個好的實驗設計的標誌。Ioannids與他的團隊發現,事實上摘要中的p值被武斷地定義為"統計顯著性"--通常設定為小於0.05。團隊發現96%的有p值的摘要都至少有一個這樣的"統計顯著性"p值。
Ionnidis說:"這表明選擇壓力傾向於更好的結果。事實上有這麼多顯著性結果是完全不現實的,不可能96%的檢驗假設都是顯著性的"。
有多大影響?
雖然報導實驗結果具有統計性顯著的文章越來越多,但很少有文章報導治療效果與空白對照組或安慰劑組有多大差別。比如假設有10000名患者服藥後在病症上跟另外10000名未服藥的患者有平均提高,但只提高了1%,那麼從p值得來的統計性顯著就沒有什麼實際意義。
796篇手動審查的論文中,只有111篇報導了效應量,18篇報導了置信區間(衡量效應大小的不確定性)。沒有文章報導貝葉斯因子或錯誤發生率,這兩個值是Ionnidis說更適合告訴我們是否觀察到的是否真實的指標。不到2%的摘要同時報導了效應量和置信區間。
在隨機抽取的99篇全文文章中,有55篇至少報導了一個p值,但只有4篇報導了所有效應量的置信區間,沒有一篇使用貝葉斯方法,只有一篇使用了錯誤發生率。
Ioannidis主張用更嚴格的方法分析數據,"改進的方式,是p值應該更選擇性地使用。使用時同時報導應效應量和置信區間。使用貝葉斯方法或錯誤發現率回答問題是一個很好的注意,比如'這個結果是真實的可能性有多大?'"(生物谷Bioon.com)
本文系生物谷原創編譯整理,歡迎轉載!點擊 獲取授權 。更多資訊請下載生物谷APP.
生物谷推薦英文原文報導:Misleading p-values showing up more often in biomedical journal articles