乾貨|統計學的P值危機

2021-01-20 斐然智達SCI學術服務

A、P值經常被誤解,統計的顯著性不等於實際的顯著性。今年3月份Nature發表了三個統計學家的一封公開信《科學家們起來反對統計學意義》(Scientists rise up against statistical significance),標題如戰鬥檄文令人振奮。在文章發出來後不到24h就得到250多人籤名,一星期後,共收到800多份籤名,籤名者包括來自50多個國家的統計學家、臨床和醫學研究人員、生物學家和心理學家,除南極洲沒人以外,所有大洲都有人籤名。

他們提出:「我們永遠不應該僅僅因為P值大於0.05之類的閾值而得出「沒有差異」或「沒有關聯」 ,或者等價,因為置信區間包括零。我們也不應該斷定兩項研究之間存在衝突,因為一項研究結果具有統計學意義,另一項則沒有。這些錯誤會浪費研究工作並誤導政策決策。」

此外,為了更好的重複性問題,也有學者通過複雜的統計模擬(主要是貝葉斯思想),建議將目前的顯著性「significant」閾值降到0.005,而之前的0.05隻有提示意義「suggestive」。那目前已發表的論文當中,那將近三分之一將要歸為「僅有提示意義」。。。

然而,似乎多數人是熱烈歡迎這樣的改變,在過去的2017年7月,Nature就把顯著性水平從P<0.05降到P<0.005對受訪者進行調查時,發現竟有69%人的表示支持!2018年,由72位科學家組成的小組在《自然·人類行為》上發表了一篇名為《重新定義統計意義》的評論文章,贊同將統計顯著性的閾值從0.05調整到0.005。這篇文章的主要作者班傑明認為:「這是一個不完美的短期解決方案,但可以立即實施。我擔心的是,如果我們不立即做這事,我們將失去變革的動力,而我們最終將花費所有的時間爭論理想化的解決方案。」當然有支持有反對,反對的聲音主要有兩點:第一、顯著水平降低會極大增加研究所需的樣本量,增加研究成本;第二,科學研究應該是多元化,不應該用單一p值評論研究的價值。

發表公開信的三位統計學家也強調,他們不是在呼籲禁止P值。不是說P值不能在某些特定的應用程式中用作決策標準,而是他們與過去幾十年的許多其他研究結果一樣,呼籲停止以傳統的二分法使用P值——來決定結果是反駁還是支持一項科學假設。

避免這種「二分法」的一個原因是,所有的統計數據,包括P值和置信區間,都會隨著研究的不同而自然地發生變化,並且往往變化非常大

B、傳統方法最大的問題是:研究結果不顯著,通通都沒有報告。在英文有個詞叫 ,摘櫻桃。什麼叫摘櫻桃?摘水果,水果熟的才摘,把熟的水果送到水果攤上,大家在水果攤上看到的水果,都是漂亮的水果,其實有很多糟糕的水果都不見了。我們在統計上也是,大家看到的都是顯著的結果,不顯著的結果沒有人看到。研究者因為結果必須顯著,期刊才會刊登,所以只挑選顯著的結果報導,這就是cherry-picking。所以美國統計學會ASA 曾在2016年發表的聲明中第四點:正確的統計推論,必須要「full reporting and transparency」。

相關焦點

  • 統計學中的P值與顯著性的意義
    一、P值是什麼?
  • 你真的懂p值嗎? 說人話的統計學
    ►辛辛苦苦做了實驗收了數據,正想大步邁向SCI高分文章,你是否不知數據分析該如何下手? ►投出了文稿,卻等來了審稿人對統計方法似是而非的挑刺,你是否不清楚該如何應對?►別擔心,你不是一個人在戰鬥!►在本系列中,我們將和你一起,探討最實用、最關鍵的統計學知識和方法。我們將指出常見的統計學誤區和陷阱,回答那些你一直想問但不好意思問的問題。
  • StatQuest生物統計學 - 線性擬合的R2和p值
    R2是擬合所能解釋的數據波動的比例p值是擬合只是隨機變異的可能性大小上一節StatQuest生物統計學 - 擬合基礎已經講過線性擬合
  • 當統計學遇上大數據——P值消亡
    有一天,我走進統計學的神殿 ,將所有謊言都裝進原假設的盒子裡,        「P值為零」,        一個聲音傳來,        「但你已經不能再拒絕,因為,P值已經死了」
  • 統計學常用概念|T檢驗、F檢驗、卡方檢驗、P值、自由度
    F值和t值就是這些統計檢定值,與它們相對應的概率分布,就是F分布和t分布。統計顯著性(sig)就是出現目前樣本這結果的機率。2,統計學意義(P值或sig值) 結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。
  • 【統計學】讓人糾結的P值
    關於統計學的爭議最多的就是P值,就是這個大寫斜體的P值。無數文章曾經都寫過這個「無效假設檢驗」話題。無效假設檢驗是統計學的基本原理和基石,是指根據於某種實際需要,對未知的或不完全知道的統計總體提出一些假設。然後由樣本的實際結果,經過一定的計算,作出在概率意義上應當接受那種假設的測驗。一般的描述是,你假設兩組處理是不同的,然後用檢測數據進行統計學計算(經常說分析)。
  • 美國宣布禁用p值,原來p值很危險,如何取代p值?
    今天談的當然是不一樣的題目,雖然它是一個很重要、很嚴肅的題目,但我希望大家可以輕鬆一點,所以也要放兩部電影片段給大家看,一部是《玉蘭花》,另一部則是《班傑明的奇幻旅程》,這兩部電影都有助於我們來了解今天要談論的主題:p 值的陷阱。  科學的統計學危機:p 值有什麼問題?  為什麼要談論 p 值的問題?
  • P值之死|當統計學遇上大數據
    有一天,我走進統計學的神殿 ,將所有謊言都裝進原假設的盒子裡,「P值為零」,一個聲音傳來,「但你已經不能再拒絕
  • 統計學中p值的含義和顯著差異性分析
    統計學意義(p值)結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變量的關聯是總體中各變量關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關聯有5%的可能是由於偶然性造成的。
  • 統計學基礎遭質疑! p值、信賴區間為何被數百科學家連名反對?
    顯著性這一概念是支撐統計學發展的大廈。統計學課本中寫到:沒有統計顯著性則不能「證明」零假設(關於兩組之間無差或者兩個實驗組和對照組的假設)。同時,統計顯著性也不「證明」其他假設。三位統計學教授主張:反對統計學意義、停用 p 值為判斷標準。
  • Nature評論:800名科學家聯名反對統計學意義,放棄P值「決定論」
    這篇公開信名為《科學家們起來反對統計學意義》(Scientists rise up against statistical significance)。正如標題所言這三位號召科學家放棄追求「統計學意義」,並且停止用統計學中常見的P值作為判斷標準。
  • 驚爆| 美國頂級學術期刊宣布禁用p值【連載1】
    據說,一直以來,關於p值的爭論不斷,長文《看電影學統計:p值的陷阱》是2016年6月6日美國德州大學奧斯汀校區政府系林澤民教授在臺灣政大社科院的演講稿,他說,為何我們使用的各種藥物,都是經過這麼嚴格的 p 值檢定出來、具有顯著性,可是在真正臨床上,卻不見得很有用。其實很多對 p 值的質疑,都是從這裡出來的。
  • 800名科學家聯名主張廢除p值!斯坦福教授:沒有p值將充滿廢話
    【新智元導讀】統計顯著性和p值是衡量研究可靠性的重要標準。這個標準是怎麼來的?今年3月Nature上一篇主張廢除p值的文章,為何獲得800位科學家聯名支持?如果沒有p值門檻,研究質量會出現大滑坡嗎?戳右邊連結上 新智元小程序 了解更多!每年,全球有數百萬學生修讀統計學課程。隨著世界上的數據量越來越大,統計學已成為越來越受歡迎的話題。
  • 隨手學統計:繞不過的 p 值
    原假設:我們認為品茶女士沒有品茶能力觀察結果:品茶女士把 8 杯茶都品了出來p 值:0.014這裡 p 值代表的含義是:如果品茶女士沒有品茶能力,那麼她品出 8 杯茶的概率是0.014。對,這個 p 值(概率)很小很小!
  • 怎樣理解 p=0.06 的統計學意義?
    統計學問題一直是個充滿爭議和討論空間的話題。下面長青藤編輯與大家分享的是,由P=0.06引發的一場關於marginal association的討論。
  • 怎樣理解p=0.06的統計學意義?
    統計學問題一直是個充滿爭議和討論空間的話題。下面長青藤編輯與大家分享的是,由P=0.06引發的一場關於marginal association的討論。
  • 當統計學遇上大數據——P值消亡 | 網際網路數據資訊網-199IT | 中文...
    有一天,我走進統計學的神殿 ,將所有謊言都裝進原假設的盒子裡,        「P值為零」,        一個聲音傳來,        「但你已經不能再拒絕,因為,P值已經死了」        從此,這個世界上充斥著謊言
  • 二、統計檢驗與p值
    所以在統計學上,假設都是以「無罪假設」出現,稱之為零假設(null hypothesis),假設是關於總體參數的論斷,而零假設總是「無罪「論斷,如沒有差別,沒有效果,沒有變化,沒有關係等,而備擇假設總是」有罪「論斷。我們以零假設為基礎,計算概率(p值),做出統計推斷。如果p值小於閾值,則拒絕零假設,接受備擇假設。
  • 九成以上研究者或無法正確理解p值
    2014年2月,ASA論壇上曾出現過一位美國統計學教授的疑問:「為什麼大學和研究院在教p < .05的規則 —— 因為科學界和雜誌都在用。」「那為什麼科學界和雜誌都在用p < .05的規則 —— 大學和研究院在教。」短短的兩句話,道出目前科學界對於p值使用及教育過程中的死循環。
  • 統計學需要一場變革
    這本書的書名在當時看起來並不會「暢銷」,但實際上這本書卻取得了巨大的成功,而且還使菲舍爾成為現代統計學之父。在這本書中,他著眼於研究人員如何將統計檢驗理論應用於實際數據,以便基於數據得出他們所發現的結論。當使用某個統計假設來做檢驗時,該檢驗能夠概述數據與其假設的模型之間的兼容性,並生成一個p值。