怎樣理解p=0.06的統計學意義?

2021-01-09 丁香園

統計學問題一直是個充滿爭議和討論空間的話題。下面長青藤編輯與大家分享的是,由P=0.06引發的一場關於marginal association的討論。

丁香園戰友發帖求助:

我的論文是關於幾個SNPs和肺癌鉑類化療敏感性的相關性的文章,投稿返修回來,審稿人提到了我的文章的結果未進行多重檢驗校正,其實我自己不是沒做多重檢驗校正,關鍵是我進行校正後,都沒有陽性結果,只有一個 Genomic-control corrected有其中一個點是0.04多,其他的校正方法最小都是0.06了,不知道那樣可以不?

 

長青藤編輯對此提出了自己的觀點,也吸引了有不少熱心網友的關注和討論。節選片段如下:

 

網友:

0.06說明有marginal association,問題也不是特別大。

 

長青藤:

美國北卡羅萊納大學前心理學系主任曾明確說過,「marginally significantly的意義就相當於NOT significant。」如果作者拿marginally significantly p=0.06作為統計學意義的證據說事,那麼0.07行不行?如果0.07行,0.1行不行?從國際學術界的主流觀點看,Marginal association做統計就沒有意義。

 

網友:

心理系的主任,對統計學不一定特別了解吧。Nature的文章裡也有marginally significant的字眼。

 

長青藤:

在美國,最懂統計學的人除了專門做統計研究的,就是心理學專家和醫生研究者。確實在Nature發表的文章也可能出現marginally significant,這好比皇帝的女兒有再大的缺陷也能找到好婆家。別人的研究夠出色,即使有點小毛病也能忍了。而對於我們大多數醫生來說,論文如果不是驚天動地的成果,那還是嚴謹一點為妙。

 

網友:

P值等於0.05是大家通常的做法,至於為什麼選0.05,眾說紛紜。在不同的研究中,也可以選0.10作為標準,比如初步篩選中,有時候甚至可以選擇0.20. P值的大小,同時也取決於樣本量的大小。

 

長青藤:

p值等於0.05作為一個分水嶺,的確沒有什麼科學道理,但這是大家公認「約定俗成」的東西。要麼不去做統計,做了就必須尊重統計學得出的結論。

 

科學上把p值高於0.05的結果說成「marginally significant」,反之,p=0.04的結果為什麼沒有人說「marginally non-significant」?是的,在不同的研究中,(比如初步篩選中),有時候p值甚至可以選擇0.20。但初步篩選不是用來確定差別或者關聯的,而是「初步篩選」,而這一個步驟的關鍵在於不要漏掉了可能的因素。

 

事實上,差別(或者關聯等)統計學有顯著意義,不能等同於科學或臨床意義。舉個例子,美國哈佛大學醫學院Baldessarini教授曾經拒絕在美國神經精神藥理學院的聲明上簽字(聲明內容是抗抑鬱症藥不增加青少年自殺風險)。原因就是自殺風險雖然在服用和不服用抗抑鬱症患者中沒有統計學顯著差別,但自殺這件事情不可以完全用統計學意義來判斷。所以,話需要說明白,不可以對結果在統計學上偷換概念。

 

 

【長青藤編輯】於2007年在中國設立編輯部,依託美國兼職MD/PhD編輯團隊為中國醫生學者提供SCI醫學論文編輯修改服務,並創立中國醫學編輯新標準:編輯>潤色。了解更多SCI寫作發表資訊,歡迎關注新浪微博@長青藤編輯,丁香客@長青藤編輯,訂閱微信公眾號【長青藤編輯】。官網:www.theivyediting.com


相關焦點

  • 怎樣理解 p=0.06 的統計學意義?
    統計學問題一直是個充滿爭議和討論空間的話題。下面長青藤編輯與大家分享的是,由P=0.06引發的一場關於marginal association的討論。
  • 統計學中的P值與顯著性的意義
     二、統計學意義結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變量的關聯是總體中各變量關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。
  • P接近0.05,可以有100種英文描述方法?!
    嘗試了各種合適的統計學方法,P值依然穩穩地略高於0.05,你應該得出結論「無統計學意義(non-significant)」,並這樣寫到文章裡。然而,對於很多作者來說,這並不是他們想尋找的答案:因為感覺發布「陰性結果」的文章要比「陽性結果」的文章難呀。很多人的解決方案就是採用由來已久的迂迴策略,將無統計學意義的結果裝扮地更有趣。
  • Nature評論:800名科學家聯名反對統計學意義,放棄P值「決定論」
    這篇公開信名為《科學家們起來反對統計學意義》(Scientists rise up against statistical significance)。正如標題所言這三位號召科學家放棄追求「統計學意義」,並且停止用統計學中常見的P值作為判斷標準。
  • 你真的懂p值嗎? 說人話的統計學
    所以他認為,要是這塊鋼蹦兒不均勻,就只可能偏向正面。在這種情況下,「與樣本相同的結果」就只有5次正面這一種。►所以,如果鋼蹦兒是均勻的,連拋5次得到都是正面的概率就是0.5的5次方,也就是0.03125,這就是我們所說的p值。換句話說,這種結果得玩兒32次才會出現1次。即使不做這樣的計算,藍精靈從日常生活的經驗中,也能感覺到,對於一塊均勻的鋼蹦來說,得到這樣的結果實在不太可能了。
  • 更加嚴苛的統計學顯著性閾值來了,p<0.05好像要說再見了
    兩天前,Science網站上登了一篇來自Kelly Servick的評論,根據最新的一篇有72個作者將發表在Nature Human Behavior雜誌的文章,過去統計學顯著性閾值
  • 大學統計學白上了?800多科學家聯名反對「統計學意義」,P值該廢了
    本文經授權轉載自公眾號: 新智元(ID:AI_era),作者:新智元統計學白學了?最新一期Nature雜誌發表了三位統計學家的一封公開信,他們號召科學家放棄追求「統計學意義」,並且停止用統計學中常見的P值作為判斷標準。一般認為P≤0.05或者P≤0.01就有顯著性差異,研究就有統計意義。
  • P<0.05為何無統計學意義:多重性比較了解一下(上篇)
    關於多重性比較的定義,筆者舉個慄子可能會更加容易理解。比如最終得到的P值為0.03,說明犯I類錯誤(即得到假陽性結果)的概率為0.03,低於預設的0.05,由此認為本次試驗的陽性結果不太可能是假陽性;相反,如果P值等於0.1,高於預設的顯著性水準,則認為本次的陽性結果是由於抽樣誤差等原因導致的假陽性結果,由此認為研究失敗。
  • 隨手學統計:繞不過的 p 值
    當 p<0.05 時,統計結果蘊藏著怎樣的玄機?歡迎走進今天的「隨手學統計」,丁香調查帶你認識這個繞不過的 p 值。首先,毋庸置疑,p 值是個概率。其真實的含義是當假設情形為真時,出現超出假設中的極端觀察結果的概率。還沒完全看懂這個定義是在說什麼?
  • 被Nature科學家封殺的P值,到底有什麼意義?
    我們也不應該斷定兩項研究之間存在衝突,因為一項研究結果具有統計學意義,另一項則沒有。這些錯誤會浪費研究工作並誤導政策決策。"(註: α 顯著性水平,是接受或拒絕原假設的概率分界點,如果p<α,就認為在1-α的置信水平下,樣本觀測值與總體假設值之間的差異是顯著的,從而不能接受原假設,即拒絕原假設。
  • 統計學基礎遭質疑! p值、信賴區間為何被數百科學家連名反對?
    顯著性這一概念是支撐統計學發展的大廈。統計學課本中寫到:沒有統計顯著性則不能「證明」零假設(關於兩組之間無差或者兩個實驗組和對照組的假設)。同時,統計顯著性也不「證明」其他假設。三位統計學教授主張:反對統計學意義、停用 p 值為判斷標準。
  • StatQuest生物統計學 - 線性擬合的R2和p值
    R2是擬合所能解釋的數據波動的比例p值是擬合只是隨機變異的可能性大小上一節StatQuest生物統計學 - 擬合基礎已經講過線性擬合
  • 乾貨|統計學的P值危機
    今年3月份Nature發表了三個統計學家的一封公開信《科學家們起來反對統計學意義》(Scientists rise up against statistical significance),標題如戰鬥檄文令人振奮。
  • 九成以上研究者或無法正確理解p值
    這可能使得研究者一直糾結於自己研究的p值是否小於0.05,從而造成所謂的p值操縱(p-hacking)、發表偏見(publication bias)等一系列負面現象。但事實上,相比統計顯著性或是p值是否小於0.05,對於研究本身而言還有需要更為重要的指標,包括但不限於置信區間(Confidence Interval,CI)、統計效力(power)、效應量(effect size)等等。
  • 統計學中p值的含義和顯著差異性分析
    統計學意義(p值)結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變量的關聯是總體中各變量關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關聯有5%的可能是由於偶然性造成的。
  • 大學統計學白讀了?科學家聯名反對「統計學意義」
    一般認為P≤0.05或者P≤0.01就有顯著性差異,研究就有統計意義。統計學上無顯著的結果並不能「證明」零假設;統計上顯著的結果也沒有「證明」某些其他假設。事實真的是這樣嗎?他們的這篇文章名為《科學家們起來反對統計學意義》。
  • 統計︱P值-0.05就發表,不然就去死!
    ⑴P的意義不表示兩組差別的大小,P反映兩組差別有無統計學意義,並不表示差別大小。⑵ P>α時,差異無顯著意義,根據統計學原理可知,不能否認無效假設,但並不認為無效假設肯定成立。⑶統計學主要用三種α值來與P值比較(0.1;0.05;0.01),也可以計算出確切的P值,也有人用P <0.001,至於選擇哪個要看檢驗的應用領域。⑷顯著性檢驗只是統計結論。判斷差別還要根據專業知識。
  • 聽說P界值要從0.05降到0.005?不,這不是真的不是真的
    Ioannidis, 2018)鑑於對p值存在廣泛的誤解,誤用和過度信任,為了控制假陽性結果的誕生,建議降低檢驗水準到0.005你這是不想讓研究生畢業的節奏啊!所以,目前我們通用的標準是0.05,當P 這裡,0.05是我們能夠接受假陽性的水準,因為,它們二者的差異仍有微小的可能來自抽樣誤差,只是已經小到我們可以接受的水平。所以p值本來是個界於0-1之間的數值,但是為了作出明確判斷,我們賦予了它一個界值。
  • P<0.05就萬事大吉了嗎?別天真了!統計功效你造嗎?
    然而,要從數據中得到一個有說服力的結論,並不僅是追求p<0.05就可以了,我們還要考慮統計功效(Statistical Power),其中樣本量就是很重要的一個因素。低功效的實驗更容易得出虛假的結果,也就是說,你那個P<0.05沒啥卵用。統計功效是個什麼鬼?
  • 800名科學家聯名主張廢除p值!斯坦福教授:沒有p值將充滿廢話
    【新智元導讀】統計顯著性和p值是衡量研究可靠性的重要標準。這個標準是怎麼來的?今年3月Nature上一篇主張廢除p值的文章,為何獲得800位科學家聯名支持?如果沒有p值門檻,研究質量會出現大滑坡嗎?戳右邊連結上 新智元小程序 了解更多!每年,全球有數百萬學生修讀統計學課程。隨著世界上的數據量越來越大,統計學已成為越來越受歡迎的話題。