畫說統計 P>0.05 你到底要告訴我啥?

2021-03-01 熙成治學

     在醫學研究中,統計學檢驗是驗證研究目的的重要手段。

      0.05是常用的顯著性水平。P<0.05,是「萬眾期待」的結果。在差別性分析中,這通常說明我們達成了驗證目標。

      那麼,p值未低於顯著性水平的檢驗結果,又告訴我們什麼呢?

這需要從檢驗假設說起:

      以t檢驗為例。在驗證兩組正態分布數據的平均水平不同時(例如男性和女性身高是否存在差異),就會採用如下假設:


        假設檢驗是在假定原假設成立的角度完成的,當P<0.05(差異有統計學意義)時,我們就認為原假設成立的可能性很小,於是拒絕原假設,接受備擇假設,認為二者平均水平不同。

       

      從直觀上很容易想到,「既然P<0.05說明他們不同,那麼與之相反的,就是她們相同唄」

       因此臨床研究中常見的錯誤就是:基於差異無統計學意義的統計結果做出相等性的結論。


      假設檢驗的「核心思想」來自「反證」。通過明確驗證目標,並將他的反面設定為原假設。假設檢驗中先設定他的對立面是成立的,並完成統計計算,當對立面成立的可能性足夠小的時候就拒絕他,接受備擇假設,也就驗證了我們的目標。

        基於這一點,我們拒絕原假設所需要的p值水平是嚴格公認的「足夠小」

        這麼一來,我們很容易看到:p>0.05實際包括了五彩繽紛的實際情況。


但言而總之一句話:我可沒辦法說他們一定一樣喔,我只是說:我還沒理由拒絕它啊!

        只有當p<0.05,出現如下情況時,


我們才理直氣壯的結束了戰鬥!

       綜上,假設檢驗從根本上限定了:我們能夠驗證的只有備擇假設,而永遠無法驗證原假設成立。因為檢驗是基於原假設成立的角度做出的,p值>0.05,包含了多種實際情況 ,他們僅僅說明現有信息尚不足以拒絕原假設。

      那麼,如果想驗證二者相同該怎麼辦呢?

      首先,要驗證的結論必須站在備擇假設上。同時,需要通過驗證兩組間的差異小於可接受的差異範疇加以證明。

       他有一個好聽的名字「等效性檢驗


相關焦點

  • P<0.05就萬事大吉了嗎?別天真了!統計功效你造嗎?
    做統計,無非就是要看看我們的實驗得出的結果是否是一個真正的新發現,選取的樣本能在多大程度上代表整體。然而,要從數據中得到一個有說服力的結論,並不僅是追求p<0.05就可以了,我們還要考慮統計功效(Statistical Power),其中樣本量就是很重要的一個因素。低功效的實驗更容易得出虛假的結果,也就是說,你那個P<0.05沒啥卵用。
  • 統計︱P值-0.05就發表,不然就去死!
    .如果0.01<P值<0.05,說明較弱的判定結果,拒接假定的參數取值。.如果P值>0.05,說明結果更傾向於接受假定的參數取值。 可是,那個年代,由於硬體的問題,計算P值並非易事,人們就採用了統計量檢驗方法,也就是我們最初學的t值和t臨界值比較的方法。
  • 更加嚴苛的統計學顯著性閾值來了,p<0.05好像要說再見了
    兩天前,Science網站上登了一篇來自Kelly Servick的評論,根據最新的一篇有72個作者將發表在Nature Human Behavior雜誌的文章,過去統計學顯著性閾值(p&
  • 你真的懂p值嗎? 說人話的統計學
    ►辛辛苦苦做了實驗收了數據,正想大步邁向SCI高分文章,你是否不知數據分析該如何下手? ►投出了文稿,卻等來了審稿人對統計方法似是而非的挑刺,你是否不清楚該如何應對?►別擔心,你不是一個人在戰鬥!►在本系列中,我們將和你一起,探討最實用、最關鍵的統計學知識和方法。我們將指出常見的統計學誤區和陷阱,回答那些你一直想問但不好意思問的問題。
  • 隨手學統計:繞不過的 p 值
    當 p<0.05 時,統計結果蘊藏著怎樣的玄機?歡迎走進今天的「隨手學統計」,丁香調查帶你認識這個繞不過的 p 值。首先,毋庸置疑,p 值是個概率。其真實的含義是當假設情形為真時,出現超出假設中的極端觀察結果的概率。還沒完全看懂這個定義是在說什麼?
  • 美國宣布禁用p值,原來p值很危險,如何取代p值?
    以上就是我們傳統講的 p 值的概念。  我們得到 p 值以後,要作統計檢定。我們相約成俗地設定一個顯著水準,叫做 α,α 通常都是 0.05,有時候大家會嚴格一點用 0.01,比較不嚴格則用 0.10。如果我們的 α = 0.05,則若 p < 0.05,我們就可以拒絕虛無假設,並宣稱這個檢定在統計上是顯著的,否則檢定就不顯著,這是傳統的 p 值檢定方法。
  • 為什麼做科研都追求結果達到顯著性水平(p值小於0.05)?
    - 來源 / 南心網數據統計分析博客 -- 編輯 / 三倉小編 -在科學研究中,人們都希望結果達到顯著性水平,即p值小於0.05,例如希望兩組結果具有顯著性差異,兩個變量存在顯著性相關,回歸係數達到顯著性水平,等等。在做研究假設時,我們絕大多數也是在做p值顯著的假設。那麼,人們為什麼那麼熱衷p值達到顯著性?
  • 聽說P界值要從0.05降到0.005?不,這不是真的不是真的
    P不過最近,p值得日子也不好過,質疑的聲音真是此起彼伏。首先,兩年前美國統計協會(ASA)發表了關於p值的聲明:看到了吧,我怎麼覺得他是想說:p值啥也幹不了啊。Ioannidis, 2018)鑑於對p值存在廣泛的誤解,誤用和過度信任,為了控制假陽性結果的誕生,建議降低檢驗水準到0.005你這是不想讓研究生畢業的節奏啊!
  • 【統計】p值和FDR
    那麼我們通常所說的p值的計算公式可以簡單寫成:p值衡量的是一個原本應該是𝐻0的判斷被錯誤認為是𝐻1(𝑟𝑒𝑗𝑒𝑐𝑡𝐻0)的比例,所以它是針對單次統計推斷的一個置信度評估。(2)對於給定的統計顯著性值𝛼∈(0,1)(通常是0.05,在某些情況下,可以放大到0.1),找到最大的k,使得:
  • p 值是什麼?數據科學家用最簡單的方式告訴你
    本文是 TowardDataScience 的一篇博文,作者條理清楚地解釋了 p 值的相關內容,並給出了一個簡單的例子,適合讀者參考。還記得我作為暑期實習生第一次在 CERN 海外實習時,大多數人都在討論,要超過「5-sigma」閾值(這意味著 p 值為 0.0000003)才能確認發現了希格斯玻色子。
  • 被Nature科學家封殺的P值,到底有什麼意義?
    大家對0.05的顯著性水平比較認可,把p<0.05作為了一種比較公認的判斷標準,因而符合p<0.05的研究結果就比較容易得到發表)同時,文章指出,當區間估計包括嚴重的風險增加時,得出結論認為統計上不顯著的結果「無關聯」是荒謬的。聲稱這些結果與顯示相同觀察效果的早期結果形成對比同樣荒謬。
  • 二、統計檢驗與p值
    要證明一個假設是比較困難的,比如想證明「暨大圖書館前面的廣場上有鳥」,一隻鳥都沒有看到,是不夠的,它有可能就藏在某個樹叢中。相反要推翻一個假設,卻是相對要容易些,要推翻「暨大圖書館前面的廣場上沒有鳥」,我們沒找到鳥,當然沒有足夠的證據去推翻它,但是但凡發現有一隻鳥,這個假設就可以被推翻。
  • P接近0.05,可以有100種英文描述方法?!
    嘗試了各種合適的統計學方法,P值依然穩穩地略高於0.05,你應該得出結論「無統計學意義(non-significant)」,並這樣寫到文章裡。然而,對於很多作者來說,這並不是他們想尋找的答案:因為感覺發布「陰性結果」的文章要比「陽性結果」的文章難呀。很多人的解決方案就是採用由來已久的迂迴策略,將無統計學意義的結果裝扮地更有趣。
  • JAMA:p值檢驗,你用對了嗎?
    那你怎麼知道到底是哪種情況?P值評估的是"由於零假設是真,還得來這樣的數據"的可能性有多大--在這個例子中,零假設為真即藥物A和B的藥效沒有區別。所以舉例來講,如果藥物A和B的藥效相同,而你進行研究比較它們,得到p值是0.05,意思就是說藥物A有5%的可能性比藥物B的藥效強10%或更多。
  • 美國統計學會權威發布:P值應該這麼用,學界有錯須改正
    (Scientific conclusions and business or policy decisions should not be based only on whether a p-value passes a specific threshold. )為了給某種科學主張或論斷提供佐證而把數據分析或科學評估[我懷疑「還原」
  • 驚爆| 美國頂級學術期刊宣布禁用p值【連載1】
    因為在近十多年來,不只是政治學界,而是很多學門,特別是在科學領域,有很多文章討論傳統統計檢定方法、尤其是 p 值統計檢定的問題,甚至有位很有名的統計學者,Andrew Gelman 寫了篇文章,叫作《科學的統計學危機》(The Statistical Crisis in Science),說是危機一點都不言過其實。這就是為何我說:今天要討論的其實是很嚴肅的問題。
  • 驚爆| p值不是什麼?【連載3】
    我們可以用這個表來呈現有關虛無假設是對或者不對,是被拒絕或者被接受的四種可能性,其中兩種是作出錯誤統計推論的情況。第一個情況,虛無假設是對的,但統計檢定是顯著的,因此虛無假設被推翻了。這種情況叫做Type I error,我們保留了α= 0.05的機率容許它存在。第二個情況,如果虛無假設是錯誤的,但統計檢定不顯著,所以它沒有被推翻,這個情況叫做Type II error。
  • 作為一名數據科學從業者,你應該知道的P值
    我無法告訴你數據科學家(甚至是成熟的科學家)在涉及到如何解釋p值時是多麼的手足無措。實際上,可以花點時間回答以下問題:如何解釋p值?P值有多麼的重要?現在,你可能已經遇到了將p值與alpha值進行比較以得出結論的經驗法則。因此,讓我們研究一下alpha值。P值的統計意義:輸入– Alpha值到目前為止,我已經提到過幾次alpha值,alpha值也被稱為顯著性水平。
  • p-value到底是什麼?
    (1)p-value: 在原假設顯著性檢驗中,p值是在假設原假設是正確的情況下,獲得至少與實際觀察結果一樣極端的檢驗結果的概率。(from wikipedia)(2)Null Hypothesis(H0):又叫零假設,指進行統計檢驗時預先建立的假設。我們可以這樣理解,零假設即是指不同組別或處理之間無差異。
  • 質量統計中,「P」為什麼飽受爭議?
    老早就有一篇爭議挺大的公眾號文章說「P值已死」,立馬就有人反駁「別鬧了,P值沒死」。其實, Nature雜誌在14年2月份時就刊發了一篇文章,對統計效度的金標準「P值」提出了質疑,認為P值並沒有統計學家所認為的那樣可信。我們暫且把這個問題擱置一下,替P值君問一句:「為什麼受傷的總是我呀?是我是我還是我」真要說起個問題,咱們得從統計學的框架說起。