審稿人說,你的數據是偏態分布的,統計方法不對?怎麼辦?

2021-03-02 醫學人士

經常地,有人諮詢我,鄭老師,論文雜誌單位返修時,審稿人說我的數據的偏態的,怎麼辦 呀?

鄭老師的第一反映是,你是不是又不分正態偏態,統統拿過來進行t檢驗了吧?這一點,確實該受到批評。這年頭,秩和檢驗方法又不是什麼難以通過SPSS實現的方法,你就不試試?
一般出於兩點情況,第一,有些變量,理論上就是偏態分布的。第二,標準差特別大,在觀察值都是正值的情況下,標準差比均數還要大。比如,下面的例子,病程的標準差比均數還要大,那麼就可以懷疑是偏態分布。
一般是先做一下正態性檢驗,若正態性檢驗P<0.05,則可以按照審稿人意見來修改。他們最大,別惹惱了。
這是數據分析階段要考慮的問題時,正態性檢驗P<0.05時,一定要採用秩和嗎?不盡然。對於成組設計的t檢驗,一般存在著兩種觀念。第一,各組樣本均來自於正態分布的總體。一般可通過正態性檢驗來進行判斷,比如採用Shapiro-Wilk檢驗方法,如果至少一組P<0.05,則被認為正態性不符合,差異性比較採用秩和檢驗;第二,根據中心極限定理,無論樣本來自何種分布,只要樣本量足夠大(一般認為樣本量大於50即為足夠大),其樣本均值均近似服從正態分布。因此樣本量較大時,完全可以忽視正態性問題,仍然可以採用參數檢驗方法。上述兩個觀念相互矛盾,令統計分析人員非常困惑。實際上,這兩種說法都不太正確。鄭老師認為,在實踐中,正態性檢驗的方法是一種參考的方法,但它並不能扮演決定性角色,應結合直方圖或者Q-Q圖進一步的分析。兩者方法結合,可以將數據分為正態、近似正態與嚴重偏態三種形態。實際統計策略方面,諸位可以將數據分布分為三類:正態分布、近似正態分布數據和嚴重偏態分布數據。第2類:正態分布不符合,P<0.05,但直方圖還是呈現大致的中間多兩邊少,無嚴重極端值;第1類和第2類,均可以採用均數描述,採用t、F檢驗第3類:正態分布不符合,P<0.05,數據嚴重偏態,或者存在明顯極端異常值,應採用中位數和四分位數間距來描述,採用非參數秩和檢驗

新版Pubmed最全實用教程(超全收藏版)

提高SCI論文寫作效率的三個免費工具

SCI投稿不會選刊?Web of science這個功能很強大,選刊輕鬆搞定!

讀研究生,應該如何高效的閱讀文獻

SCI再添新成員,首個影響因子近8分,還不快快收藏!

發表高影響因子SCI論文的八個關鍵技巧

如何撰寫SCI論文題目:絕對值得收藏

相關焦點

  • 數據的分布形態:偏態係數與峰態係數
    集中趨勢和離散程度是數據分布的兩個重要特徵,尤其是均值和標準差。對於正態分布,只要知道了均值和標準差,就可以確定其分布。但對於未知的分布,要想全面了解數據分布的特點,我們不僅要掌握數據的集中趨勢和離散程度,還需要知道數據分布的形狀是否對稱、偏斜的程度以及分布的扁平程度等,統稱為分布的形態。偏態和峰態就是對分布形態的測度。
  • 正態分布的常用數據 - CSDN
    #尋找真知派#如上一篇文章所述,樣本所屬總體服從正態分布是數據分析和數據挖掘等數據處理的重要前提。如果我們採集的樣本並不能確認其總體是否服從正態分布,那麼數據處理的結果就是不可靠的。因此,對樣本數據進行正態分布檢驗十分必要。
  • 這到底是左偏啊還是右偏?私授你偏態分布的正確讀取方式
    小兵我是跨專業學統計的半吊子昏析獅,常常分不清楚正態分布的左偏和右偏,好不容易自認為分得清楚了,隔一大段時間再猛然遇到偏態時,照樣是傻乎乎的心痛
  • 【教育統計答疑】如何理解正態分布、均值分布、χ^2分布、t分布和F分布
    首先,「為什麼要學習這幾個分布」可能是許多人糾結的問題,明明已經在電腦中裝了SPSS軟體了,那麼複雜而繁瑣的公式不應該直接內置在軟體之中就可以了嗎?為什麼還要花費功夫去學習它們呢?我只能說,在你對這部分內容不甚了解的情況下,你很難意識到其重要性。
  • 【專題】判斷正態分布的那些方法,以及如何進行正態轉換
    當我們應用統計方法對數據進行分析時,會發現許多分析方法,例如常用的T檢驗、方差分析、相關分析等,都要求數據服從正態分布或者近似正態分布。
  • SPSS教程|手把手教你如何判斷數據是否服從正態分布
    利用統計推斷的方法、去估計樣本總體的參數信息,我們耳熟能詳的統計方法太多了:t檢驗,方差檢驗,U檢驗,F檢驗……但這些檢驗方法你真的用對了嗎?        在進行統計推斷前,你一定要首先了解數據分布,否則得到的統計結論就是無效的!比如,T檢驗、方差檢驗的前提假設都是數據呈正態分布,如果你的數據不滿足正態分布,則需要轉化成正態分布或使用非參數檢驗方法。小編今天帶大家了解一下,如何判斷數據是否服從正態分布呢?!
  • 如果數據分布是非正態的怎麼辦?用切比雪夫不等式呀!
    正態分布/超自然分布你覺得這是個玩笑?讓我告訴你,這不是笑料。這是嚇人的,真正的萬聖節精神!在數據科學的圈裡,數據科學家非常喜歡這個分布。一方面是因為,符合這個分布的現象在自然界隨處可見。在概率統計方面,中心極限定理撐起了一片天,而中心極限定理的最重要的一個假設是數據的分布符合中心極限定理。
  • ...的重要工作之一就是對資料進行統計描述。對偏態分布的統計資料...
    單選題 統計的重要工作之一就是對資料進行統計描述。對偏態分布的統計資料進行集中趨勢統計描述的常用指標是( )。 A、算術平均數 B、幾何平均數 C、中位數 D、加權平均數   本文是建設工程教育網原創文章,轉載請註明來自建設工程教育網。
  • 測量值不服從正態分布該怎麼辦?
    在統計過程控制中,為什麼數值不服從正態分布,如果不服從正態分析,我們又該怎麼處理?問:在統計過程控制的活動中,計量型特徵值不服從正態分布是怎麼回事?答:正態分布是我們基於樣本信息,對其背後虛構的總體中數值的分布情況進行描述用的,當樣本數據證明背後的總體不服從正態分布時,我們應該先考慮數據的來源。1、在統計過程控制中,為什麼特徵值不服從正態分布?
  • 偏度與峰度的正態性分布判斷
  • 正態分布的應用——基於描述性統計與分布的推論
    分布的類型:上期主要給大家介紹了正態分布,其實除了正態分布,還有很多的分布類型,今天就給大家科普一下。標準的二分布、均勻分布這樣的古典概型產生的分布,在這裡就不給大家介紹了。本次介紹的分布,也是統計中較為常用的類型。
  • 【乾貨】統計學×數據分析|信度|卡方|施測|統計量|正態分布_網易...
    一、描述統計  描述統計是通過圖表或數學方法,對數據資料進行整理、分析,並對數據的分布狀態、數字特徵和隨機變量之間關係進行估計和描述的方法。描述統計分為集中趨勢分析和離中趨勢分析和相關分析三大部分。  集中趨勢分析  集中趨勢分析主要靠平均數、中數、眾數等統計指標來表示數據的集中趨勢。 例如被試的平均成績多少? 是正偏分布還是負偏分布?
  • [道贏·科技] | 鋰電生產製程數據不服從正態分布,正常嗎?
    在日常工作中,正態分布是我們最為常見的數據分布類型。但很多時候,我們會發現自己的數據分布樣式 」千奇百怪「 ,與正態分布相比相去甚遠。那麼,一組數據不服從正態分布,正常嗎?如果不服從正態分布的數據暗示著某些異常的話,發生的又是什麼問題呢?為了回答這些問題,先要從正態分布的產生原理說起......正態分布是如何產生的?
  • R與生物專題 | 第六講 R-數據正態分布檢驗
    在「R與生物統計專題」中,我們會從介紹R的基本知識展開到生物統計原理及其在R中的實現。
  • SPSS詳細操作:正態轉換的多種方法
    詳見:SPSS教程:判斷數據正態分布的超多方法!當數據分布呈現非正態時,我們可以將原始數據作某種函數的轉換,使偏態資料正態化,從而滿足T檢驗或其他統計分析方法對資料的要求,這一節內容我們將向大家介紹如何對數據資料進行正態轉換。
  • 神說,要有正態分布,於是高斯就創造了正態分布 - 徐曉亞然
    人們迫切地想要知道高斯如何處理數據的方法,但是高斯本人拒絕透露。在他看來這些都還是一些不太成熟的小技巧,雖然在實際上有很大用途,但是發表一個不成熟的結論是不太配得上自己身位的,於是高斯的方法被當做秘技一樣不傳。直到8年之後的1809年,高斯認為此項研究已經成熟,於是公布了他的方法,這個分析工具就是最小二乘法。
  • 30天學會醫學統計與SPSS公益課程(Day 2-2):定量數據統計描述
    我將每天推送視頻和文字教程,講授基於醫學數據的各種統計分析策略。諸位可以結合課程視頻、文字版教程進行學習。如果你能跟得上節奏,我相信在一個月後,您將會掌握醫學數據分析方法。1. ,這一不同體現在統計描述和統計比較(專業來說是統計推斷),統計比較內容後期逐步展開,今日首先介紹下定量數據正態和偏態分布的的統計描述方法、SPSS操作和統計表格繪製。
  • Python+統計學 | 探索常用的數據分析統計分布
    本文用Python統計模擬的方法,介紹四種常用的統計分布,包括離散分布:二項分布和泊松分布,以及連續分布,指數分布和正態分布,最後查看人群的身高和體重數據所符合的分布。該方法又稱為「蒙特卡洛方法(Monte Carlo method)」,起源於二戰時美國研製原子彈的曼哈頓計劃,它的發明人中就有大名鼎鼎的馮·諾依曼。蒙特卡洛方法的名字來源也頗為有趣,相傳另一位發明者烏拉姆的叔叔經常在摩洛哥的蒙特卡洛賭場輸錢,賭博是一場概率的遊戲,故而以概率為基礎的統計模擬方法就以這一賭城命名了。
  • 對付審稿人「強迫引用」,新方法來了!—新聞—科學網
    投稿時,你是否遭遇過審稿人要求引用他的論文?在學術界,大家對這種「強迫引用」行為深惡痛絕,但經常又無可奈何。
  • 「正態分布」碎思
    1.正態分布原本是一個概率統計的概念,用以描述連續隨機變量的分布情況。最簡單的描述就是「中間大,兩頭小」。正態分布大致長這樣:標準正態分布的平均數為0,標準差為1。自然界以及人類社會中許多現象在分布上都體現了正態分布的形態,但不同現象的具體分布形態會因隨機變量的平均數、標準差的大小與單位不同而有所不同。