經常地,有人諮詢我,鄭老師,論文雜誌單位返修時,審稿人說我的數據的偏態的,怎麼辦 呀?
鄭老師的第一反映是,你是不是又不分正態偏態,統統拿過來進行t檢驗了吧?這一點,確實該受到批評。這年頭,秩和檢驗方法又不是什麼難以通過SPSS實現的方法,你就不試試?
一般出於兩點情況,第一,有些變量,理論上就是偏態分布的。第二,標準差特別大,在觀察值都是正值的情況下,標準差比均數還要大。比如,下面的例子,病程的標準差比均數還要大,那麼就可以懷疑是偏態分布。
一般是先做一下正態性檢驗,若正態性檢驗P<0.05,則可以按照審稿人意見來修改。他們最大,別惹惱了。
這是數據分析階段要考慮的問題時,正態性檢驗P<0.05時,一定要採用秩和嗎?不盡然。對於成組設計的t檢驗,一般存在著兩種觀念。第一,各組樣本均來自於正態分布的總體。一般可通過正態性檢驗來進行判斷,比如採用Shapiro-Wilk檢驗方法,如果至少一組P<0.05,則被認為正態性不符合,差異性比較採用秩和檢驗;第二,根據中心極限定理,無論樣本來自何種分布,只要樣本量足夠大(一般認為樣本量大於50即為足夠大),其樣本均值均近似服從正態分布。因此樣本量較大時,完全可以忽視正態性問題,仍然可以採用參數檢驗方法。上述兩個觀念相互矛盾,令統計分析人員非常困惑。實際上,這兩種說法都不太正確。
鄭老師認為,在實踐中,正態性檢驗的方法是一種參考的方法,但它並不能扮演決定性角色,應結合直方圖或者Q-Q圖進一步的分析。
兩者方法結合,可以將數據分為正態、近似正態與嚴重偏態三種形態。實際統計策略方面,諸位可以將數據分布分為三類:正態分布、近似正態分布數據和嚴重偏態分布數據。第2類:正態分布不符合,P<0.05,但直方圖還是呈現大致的中間多兩邊少,無嚴重極端值;
第1類和第2類,均可以採用均數描述,採用t、F檢驗第3類:正態分布不符合,P<0.05,數據嚴重偏態,或者存在明顯極端異常值,應採用中位數和四分位數間距來描述,採用非參數秩和檢驗
新版Pubmed最全實用教程(超全收藏版)
提高SCI論文寫作效率的三個免費工具
SCI投稿不會選刊?Web of science這個功能很強大,選刊輕鬆搞定!
讀研究生,應該如何高效的閱讀文獻
SCI再添新成員,首個影響因子近8分,還不快快收藏!
發表高影響因子SCI論文的八個關鍵技巧
如何撰寫SCI論文題目:絕對值得收藏