【微言茶話】小白學統計系列之三:P值到底是個什麼東西

2021-01-21 中華圍產醫學雜誌

前一段時間看了一個小文章說,P值已死。為什麼?因為P值根本起不到我們期望的作用,甚至更絕望地說,P值根本就起不到這個作用。

那麼,P值到底是幹什麼的?只是上帝派來玩弄我們的嗎?它到底是真有用還是我們想的太多了?本文簡單談一下自己的一些小看法。

簡單說一下P值的歷史,P值是由統計學界最牛的人Fisher老先生(相當於物理領域的牛頓級別人物)提出並推動的,這來源於他以及以後由奈曼和皮爾遜發展的假設檢驗思想(假設檢驗會在以後文中專門介紹)。簡單地說,如果你有一個50人的班級,已經知道你們班上50人的身高平均是170cm,如果現在給你1個人,身高是190cm,那麼讓你來判斷,這個人是不是你們班的人?

對於這個問題,你會怎麼判斷呢?很明顯,兩種答案,要麼是,要麼不是。通常我們會假定他是這個班上的人,因為即使是平均身高170cm,但也不是所有人都170cm,肯定有高有矮,高的人是有可能達到190cm的。但是我們不得不承認,對於一個平均身高是170cm的50人來說,出現一個190cm高的人,這種機率是相當低的。這個「機率」就是P值。

換句稍微專業一點的術語來說,對於一個均值是170cm的總體,有人的身高比均值高20cm,如果這個人真的是這個群體中的,那麼出現20cm這麼大的差異的概率有多大?這個概率就是P值。如果這個概率很小(如P值=0.01),那就可以說,出現這麼大的差異的概率只有百分之一。對於這麼小的概率,我們認為它不大可能出現,也就是說,這個人不大可能是屬於這個群裡中的,更大的可能是屬於其他群體中的。

現在還面臨一個問題,P值到底小於多少,我們才能下結論認為這個人不大可能屬於這個群體呢?換句說話,小於多少才算「不大可能」?現在我們通用的標準是0.05,也就是說,概率小於5%,就認為「不大可能」。那這個0.05是怎麼來的呢?這個0.05也是Fisher老先生提出來的,可是他沒有對此做任何解釋,只是說他突然想起來了,或許覺得0.05是他的幸運數字吧,然後就用0.05了,然後我們就一直沿用了。

不管0.05是Fisher老先生的一個偶然想法還是怎麼樣,起碼我們真的就有了一個標準了。只要能統一,始終是好事的,尤其在以前的時候。不過在當前計算機已經超級發達的時代,有這麼一個標準就不一定是好事了。很多人都曾有過這種經歷,P值正好等於0.049或0.052之類的。等於0.049的,感覺神都在眷顧他;等於0.052的,恨不得一頭去撞牆。也有人問過我,我的P值等於0.052,我可不可以四捨五入到0.05?

實際上,對於P值等於0.052之類的問題,也不用太煩惱。現在的雜誌一般都要求提供具體的P值,而不是簡單寫為P<0.05等。為什麼呢?因為P值僅僅告訴你,根據你的數據所得出的結論,有多大的犯錯風險。P值是對已有的(注意是已經有了的)結果的判斷,而不是反映了結果大小。比如剛才例子中,結果已經有了,就是差值是20cm,P值的作用是判斷出現這麼大的值到底有多大可能。對於0.052來說,比0.05多了千分之二的可能性,難道你覺得增加這千分之二的可能性可以讓你推翻你的結論嗎?我相信大多數人都不會這麼認為。所以你大可不必糾結於想方設法非要改成小於0.05的事情,大大方方地把自己的P值放上,我想讀者會有自己的判斷的。如果一個雜誌因為你的P值=0.052而拒絕承認你的結論,我想這個雜誌也不值得發表。

目前仍有人認為P值代表了差異大小,認為P值越小,差異越大,因此力求一個小的P值。而事實上,P值跟差別大小沒什麼太大關係,真正有關的反而是其他因素,比如例數的多少,這是個很重要的因素。例數少的話,就容易出現一個大的P值。以前就有臨床大夫質疑統計學,說:你看你們統計學,20個數據P值就大於0.05,我原封不動地複製成200個,P值就小於0.05,有統計學意義了。這不是在玩數字遊戲嗎?

我要說:你說的恰恰相反,20個數據時,P值大於0.05,不讓你有統計學意義,是在給你一個提醒,說明你的數據不足以支持你的結論。就像是你治療了20個人,即使都治好了,你如果宣稱治癒率100%,估計沒人會相信你。但是200個人就變成P值小於0.05,這正好說明了結論更可靠了,如果你對200個人治療還是都治好了,那你這時候說治癒率100%,我相信一定會有更多的人相信你。所以,好好想想P值吧,它是有現實意義的。統計學不是數字遊戲,而是讓你的結論更有說服力。靠什麼來體現你的結論的說服力呢,P值。

相關焦點

  • 統計學 P值到底是個什麼東西
    那麼,P值到底是幹什麼的?只是上帝派來玩弄我們的嗎?它到底是真有用還是我們想的太多了?本文簡單談一下自己的一些小看法。 簡單說一下P值的歷史,P值是由統計學界最牛的人Fisher老先生(相當於物理領域的牛頓級別人物)提出並推動的,這來源於他以及以後由奈曼和皮爾遜發展的假設檢驗思想。
  • 隨手學統計:繞不過的 p 值
    當 p<0.05 時,統計結果蘊藏著怎樣的玄機?歡迎走進今天的「隨手學統計」,丁香調查帶你認識這個繞不過的 p 值。首先,毋庸置疑,p 值是個概率。其真實的含義是當假設情形為真時,出現超出假設中的極端觀察結果的概率。還沒完全看懂這個定義是在說什麼?
  • 小白學數據小抄放送 Python,R,大數據,機器學習
    大數據文摘作品,轉載要求見文末 作者 | Elaine,田桂英,Aileen 導讀:前段時間小白學數據專欄出了一期Python小抄表,後臺反應強烈(點擊查看大數據文摘小白學數據系列文章)。幫我們這樣的小白介紹一下有什麼Python方面的小抄吧? 答:入門的話有兩張表必須強推: 1.
  • 美國統計學會權威發布:P值應該這麼用,學界有錯須改正
    (P-values can indicate how incompatible the data are with a specified statistical model.) R:部分原則看起來非常直白,但我對第二條有點疑問。我常常聽說P值可用來估計數據是否僅由隨機過程產生,為什麼這是一種錯誤的想法?W:讓我們設想一個簡單的情境來解釋這樣的想法意味著什麼。假設出現了一種針對某嚴重疾病的新療法,研究者宣稱這比已有的療法更有效。
  • 你真的懂p值嗎? 說人話的統計學
    ►辛辛苦苦做了實驗收了數據,正想大步邁向SCI高分文章,你是否不知數據分析該如何下手? ►投出了文稿,卻等來了審稿人對統計方法似是而非的挑刺,你是否不清楚該如何應對?►別擔心,你不是一個人在戰鬥!►在本系列中,我們將和你一起,探討最實用、最關鍵的統計學知識和方法。我們將指出常見的統計學誤區和陷阱,回答那些你一直想問但不好意思問的問題。
  • 咖啡和茶,有什麼相似之處?
    又過了10年,又有新的化學家研究發現,原來這兩者是一個東西!沒辦法,按照先來後到的禮儀,這東西是先在咖啡中發現的,哪怕茶葉中含量更高,也只能命名為咖啡鹼!科學發現有時候是這麼偶然和有趣。不過,茶鹼這種物質也是真實存在的。目前,在茶葉中發現的生物鹼主要有咖啡鹼、可可鹼、茶鹼。
  • 二、統計檢驗與p值
    我們以零假設為基礎,計算概率(p值),做出統計推斷。如果p值小於閾值,則拒絕零假設,接受備擇假設。有時候會有學生找我說,幫忙算個p值,我就會問,你的零假設是什麼?這句話等同於問「你想幹嘛?」,神奇的是,有些時候有些人就真的不知道自己想幹嘛!
  • 統計︱P值-0.05就發表,不然就去死!
    但實際上,統計量落在拒絕域不同的地方,實際上的顯著性有較大的差異。因此,隨著計算機的發展,P值的計算不再是個難題,使得P值變成最常用的統計指標之一。P值就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。如果P值很小,說明這種情況的發生的概率很小,而如果出現了,根據小概率原理,我們就有理由拒絕原假設,P值越小,我們拒絕原假設的理由越充分。總之,P值越小,表明結果越顯著。
  • 臺灣烏龍茶系列之初識
    茶是世界上被喝的最多的飲料,僅次於水。據國際茶葉委員會最新統計數據顯示,2017年,全球茶葉產量568.6萬噸,比2017年增加12.5萬噸,增幅2.2%。2017全球茶葉總產量其中,90%是全發酵的紅茶,8%是不發酵的綠茶,剩下的2%是所謂「不發酵茶」,就是我們統稱的「烏龍茶」。除了近年在越南和印尼有少量新闢的茶園之外。主要產區集中在福建、廣東以及臺灣。
  • 美國統計協會關於統計顯著性和p值的說明
    ⼀個結論不會在分界線的⼀側突然變真,在另⼀側突然變假。為了得出科學的論斷,研究者需要利⽤好多種背景因素,這包括研究的設計,測量的質量,所研究現象的外部證據,以及作為數據分析基礎的假設的效度。務實的考慮通常需要二元的、「是或否」的決策,但這並不意味著僅靠p值就可以確定⼀個決策的正確與否。
  • 【統計】p值和FDR
    那麼我們通常所說的p值的計算公式可以簡單寫成:p值衡量的是一個原本應該是𝐻0的判斷被錯誤認為是𝐻1(𝑟𝑒𝑗𝑒𝑐𝑡𝐻0)的比例,所以它是針對單次統計推斷的一個置信度評估。FDR衡量的是在進行多次統計推斷後,在所有被判定為顯著性的結果裡,有多大比例是誤判的。FDR的公式可以簡單寫成:
  • 小白學數據28張小抄放送 Python,R,大數據,機器學習
    我們這一期小白學數據專欄篩選了28份小抄,根據覆蓋面、清晰度和內容實用性,分別涵蓋了機器學習、數據科學、概率、SQL和大數據的領域。裡面包括了你所需要的工具、流程、各種包和語言。 數據科學專場:Python小抄表 小白:我們先來回顧一下之前聊過的Python。幫我們這樣的小白介紹一下有什麼Python方面的小抄吧?
  • 山色空濛出好茶,被尊稱為「茶中之王」的大紅袍,究竟有多好喝
    丨本文由小青話茶原創丨首發於百家號:小青話茶丨作者:小青1、武夷大紅袍,素來就有「茶中之王」的讚譽,乃巖茶之中的王者,堪稱國之珍寶。精細的制茶工藝,優越的先天條件,得天獨厚的地理環境,物種豐富的生態系統。造就了如今的大紅袍,可以說大紅袍本身就是集天地之精華的所在。
  • 作為一名數據科學從業者,你應該知道的P值
    維基百科(Wikipedia)對p值的定義讓那些統計和數據科學領域的任何新手都感到望而生畏。關於p值的典型對話是這樣的:而且你只知道一些公式和約定,卻沒有如何系統的解釋什麼是P值的想法。那麼,我們如何一勞永逸地學習p值,並將其根深蒂固地牢記在心?
  • 被Nature科學家封殺的P值,到底有什麼意義?
    最近以探測到「上帝粒子」—希格斯玻色子(Higgs boson)而為大眾所熟知),那時候大多數人還在談論著希格斯玻色子的發現,即使已經確認希格斯玻色子的發現滿足5個標準差閾值。(即P值為0.0000003)然而,那時候我對p值、假設檢驗甚至統計顯著性都一無所知。接下來的事你猜對了。
  • 小白學統計|你會有被統計支配的恐懼嗎?
    如定量資料關注的是其均數,對應的有z檢驗、t檢驗、方差分析等;與之對應的分類資料則關注其率,對應的有近似z檢驗、卡方檢驗等。需要提醒的是:對這些概念的認識,剛開始可以只是了解,隨著大家學習的深入,要不斷建立對其全面、深入的理解,同時將之應用於新的章節的學習中。比如,二項分布、泊松分布和正態分布是在描述總體分布形態時提出的三種常見分布;而t分布、卡方分布及F分布則是描述樣本統計量的常見分布,常用於假設檢驗中。這其中所對應的就是,緒論中提及的總體與樣本的概念。
  • 數據挖掘常見的 p-value 解讀
    在統計的世界裡經常聽到 p-value,那什麼是 p-value 呢?Well Done, Wikipedia, 這下連大人都徹底不懂 p-value 了。但希望下面極簡的講解能讓小孩懂什麼是 p-value。
  • 茶王樹之死的秘密!那些年我們究竟對「茶王樹們」做了什麼?
    茶王樹之死的秘密說起來也是很讓人遺憾,近些年各個茶區的茶王樹們近幾年陸續死傷不在少數,那麼為什麼這些古樹沒被發現之前能活幾百年,而被人類發現後,陸陸續續就開始受傷死亡呢?除了過度採摘,這中間還有什麼故事呢?今天泠泠就帶大家來聊聊,茶王樹之死的秘密!
  • 俗話說「人睡三覺,命比紙薄」,這句話是什麼意思?
    可以看出不失眠,睡眠質量高,對於身體健康非常重要,但是睡覺是一門學問,並不是睡得越多越好,俗話說「人睡三覺,命比紙薄」,這是什麼意思?一、俗話說「人睡三覺,命比紙薄」這句話是什麼意思?1、吃飯立即入睡飯飽神虛,許多人在進食後會感到非常睏倦,因為我們攝入食物後,血液集中在腸道和胃中以幫助消化食物,這將使得我們的大腦在短時間內變得缺氧感到睏倦。
  • 驚爆| p值不是什麼?【連載3】
    點擊查看 【引言】昨日轉載美國德州大學奧斯汀校區政府系林澤民教授2016年在臺灣政大社科院的演講《看電影學統計:p值的陷阱》,他首先講的p值是什麼?今天刊出的是p值不是什麼?由於這部分的文字比較長,將分三期刊出。