多種判斷正態性的方法詳細說明

2020-12-12 SPSSAU

數據服從正態分布是很多分析方法的前提條件,在進行方差分析、獨立樣本T檢驗、回歸分析等分析操作前,首先要對數據的正態性進行分析,確保方法選擇正確。如果不滿足正態性特質,則需要考慮使用其他方法或對數據進行處理。

檢測數據正態性的方法有很多種,以下為幾種常見方法:圖示法、統計檢驗法、描述法。

01. 正態圖

正態分布圖可直觀地展示數據分布情況,並結合正態曲線判斷數據是否符合正態分布。

操作步驟:SPSSAU→可視化→正態圖

操作步驟:選擇【正態圖】分析方法,拖拽分析項到右側分析框內,點擊「開始正態圖分析」即可得到結果。

若數據基本符合正態分布,則會呈現出中間高、兩側低、左右基本對稱的「鐘形」分布曲線。若數據為定類數據或數據量較少,一般很難呈現出標準的正態分布,此時建議只要圖形呈現出「鐘形」也可接受數據服從正態分布。若數據分布完全偏離正態,則說明數據不符合正態分布。

02. P-P圖/Q-Q圖

P-P圖和Q-Q圖,都是通過散點與正態分布的預測直線法重合程度來說明數據是否服從正態分布。

SPSSAU-P-P圖

P-P圖是將實際數據累積比例作為X軸,將對應正態分布累積比例作為Y軸作散點圖,反映實際累積概率與理論累積概率的符合程度。

Q-Q圖是將實際數據作為X軸,將對應正態分布分位數作為Y軸,作散點圖,反映變量的實際分布與理論分布的符合程度。

無論是P-P圖還是Q-Q圖,如數據服從正態分布,則散點分布應近似呈現為一條對角直線。反之則說明數據非正態。兩種圖的功能完全一致,使用時沒有區別。

03.正態性檢驗

利用統計圖分析正態性,往往是依靠分析者的主觀判斷進行。因而容易產生結果偏差。因此需要結合其他方法,對數據的正態性指標進行統計描述。

正態性檢驗是用於分析定量數據是否具有正態分布特質。

操作步驟與上述一致,選擇【正態性檢驗】分析方法,拖拽分析項到右側分析框內,點擊「開始正態性檢驗」即可得到結果。

分析結果

如果樣本量大於50,則應該使用Kolmogorov-Smirnov檢驗結果,反之則使用Shapro-Wilk檢驗的結果。

上圖中,樣本量為300,因而選擇K-S檢驗。P值=0.149>0.05,說明數據服從正態分布。

04. 描述法

描述法即通過描述數據偏度和峰度係數檢驗數據的正態性。

SPSSAU-描述性分析

偏度和峰度可通過描述性分析得到,也可在正態性檢驗中直接查看。

理論上講,標準正態分布偏度和峰度均為0,但現實中數據無法滿足標準正態分布,因而如果峰度絕對值小於10並且偏度絕對值小於3,則說明數據雖然不是絕對正態,但基本可接受為正態分布。

其他說明

(1)檢驗數據正態性的方法有很多,其中統計檢驗法對於數據的要求最為嚴格,而實際數據由於樣本不足等原因,即使數據總體正態但統計檢驗出來也顯示非正態,實用性上不如圖示法直觀,接受程度高,因此一般情況下使用圖示法相對較多。

(2)當正態圖和正態性檢驗結果出現矛盾,如正態圖顯示數據分布對稱而正態性檢驗結果P<0.05,此時建議不要追求絕對的正態,如數據基本滿足正態性即可接受服從正態分布。

(3)另外,正態性檢驗要求嚴格通常無法滿足,如果峰度絕對值小於10並且偏度絕對值小於3,則說明數據雖然不是絕對正態,但基本可接受為正態分布。

(4)若想將非正態性數據轉化為正態性數據,可將數據取對數、開根號等處理,使數據更加接近正態分布

相關焦點

  • 偏度與峰度的正態性分布判斷
    上一篇文章用Q-Q圖來驗證數據集是否符合正態分布,本文首先介紹了偏度與峰度的定義,然後用偏度與峰度檢測數據集是否符合正態分布,最後分析該檢測算法的適用條件以及SPSS的結果分析。若偏度大於0,則分布右偏,即分布有一條長尾在右;若偏度小於0,則分布為左偏,即分布有一條長尾在左(如下圖);同時偏度的絕對值越大,說明分布的偏移程度越嚴重。
  • 【專題】判斷正態分布的那些方法,以及如何進行正態轉換
    為了保證數據滿足這些統計方法的應用條件,對原始數據進行正態性檢驗是十分必要的。(註:以下藍色標題都可以直接點擊,打開文章查看詳情) 樣本量大於30,就可以認為是正態了嗎? 很多人都問過這樣一個問題:樣本量大於30或50是不是就不用做正態性檢驗了?
  • SPSS詳細操作:正態轉換的多種方法
    詳見:SPSS教程:判斷數據正態分布的超多方法!當數據分布呈現非正態時,我們可以將原始數據作某種函數的轉換,使偏態資料正態化,從而滿足T檢驗或其他統計分析方法對資料的要求,這一節內容我們將向大家介紹如何對數據資料進行正態轉換。
  • 用 BOX-COX 變換進行數據正態性處理
    筆者之前寫了題為《用Python講解偏度和峰度》的文章,在那篇文章裡,筆者介紹了偏度、峰度以及如何基於二者進行數據正態性的判斷,而今天筆者將介紹一下如何將數據進行正態性轉換。在我們進行數據分析時,遇到的數據往往不是呈正態分布的,而如果數據不是正態性的,那麼在部分情況下會帶來一些問題。
  • 第三節 正態性檢驗與兩方差的齊性檢驗
    (4)查附表6得P值,作出推斷結論,按n查得W(n,α),α是檢驗前指定的檢驗水準,若W>W(n,α)則在α水準上按受H0,資料來自正態分布總體,或服從正態分布;若W≤W(n,α),則在α水準上拒絕H0,接受H1,資料非正態。
  • SPSS教程|手把手教你如何判斷數據是否服從正態分布
    比如,T檢驗、方差檢驗的前提假設都是數據呈正態分布,如果你的數據不滿足正態分布,則需要轉化成正態分布或使用非參數檢驗方法。小編今天帶大家了解一下,如何判斷數據是否服從正態分布呢?! 今天我們邀請「SPSS」,幫助我們判斷數據是否服從正態分布:    假設我們有一組數據,列是不同的樣本,行是每個樣本的免疫細胞浸潤得分,想判斷DataSet1這個樣本的免疫細胞浸潤程度是否服從正態分布。方法一.
  • 正態分布的常用數據 - CSDN
    (8該方法將樣本順序編排,然後根據以下公式計算統計量W的值,該值越接近於1,且顯著水平大於0.05時,就可以接受樣本所屬總體服從正態分布的假設。如果統計量小於某項閾值,則表示在對應顯著水平下可以判定總體服從正態分布。如上例,說明在0.05,0.025,0.01水平下,可以判定總體服從正態分布,而0.15,0.1顯著水平下,不能確定總體是否服從正態分布。5.lilliefors檢驗Lilliefors檢驗將KS檢驗改進為專門的正態分布檢驗。
  • SPSS正態分布以及方差齊性檢驗以及Wilcox檢驗
    第二篇關於三種t檢驗的適用情況說明(單一樣本t檢驗,配對樣本t檢驗,獨立樣本t檢驗),是我幾天前看到採集而來,一併放到這裡做個簡單的匯總。t檢驗要求數據正態分布以及方差齊性。一般來說一些常見的表型數據符合正態分布以及方差齊性的要求。但對於其他類型的數據,就不一定滿足這兩點了。所以在進行t檢驗之前,首先要進行數據的正態檢驗以及方差齊性檢驗。
  • 正態分布的應用——基於描述性統計與分布的推論
    分布的類型:上期主要給大家介紹了正態分布,其實除了正態分布,還有很多的分布類型,今天就給大家科普一下。標準的二分布、均勻分布這樣的古典概型產生的分布,在這裡就不給大家介紹了。本次介紹的分布,也是統計中較為常用的類型。
  • R與生物專題 | 第六講 R-數據正態分布檢驗
    在「R與生物統計專題」中,我們會從介紹R的基本知識展開到生物統計原理及其在R中的實現。
  • 正態分布圖形的編輯
    需要說明的是,這個地方用到的是目標值的範圍,當目標值<=75的時候,你的圖形應當是這樣的,那麼橘色部分則是,你的X所在的區域.這個時候,你可以選擇分布密度的整個系列,插入一個堆積面積圖,則會得到:然後我們需要在這個面積圖的基礎之上,再給它一個面積堆積,達到自由切換的效果,而上圖藍色的部分則是基於我們的基本數據給出來的底層正態模型,自己切換或者變化的面積也必須要在這個藍色的面積範圍以內.
  • SPSS數據分析—描述性統計分析
    描述性統計分析是針對數據本身而言,用統計學指標描述其特徵的分析方法,這種描述看似簡單,實際上卻是很多高級分析的基礎工作,很多高級分析方法對於數據都有一定的假設和適用條件
  • 「正態分布」碎思
    1.正態分布原本是一個概率統計的概念,用以描述連續隨機變量的分布情況。最簡單的描述就是「中間大,兩頭小」。正態分布大致長這樣:標準正態分布的平均數為0,標準差為1。自然界以及人類社會中許多現象在分布上都體現了正態分布的形態,但不同現象的具體分布形態會因隨機變量的平均數、標準差的大小與單位不同而有所不同。
  • 審稿人說,你的數據是偏態分布的,統計方法不對?怎麼辦?
    鄭老師的第一反映是,你是不是又不分正態偏態,統統拿過來進行t檢驗了吧?這一點,確實該受到批評。這年頭,秩和檢驗方法又不是什麼難以通過SPSS實現的方法,你就不試試?一般出於兩點情況,第一,有些變量,理論上就是偏態分布的。第二,標準差特別大,在觀察值都是正值的情況下,標準差比均數還要大。比如,下面的例子,病程的標準差比均數還要大,那麼就可以懷疑是偏態分布。
  • 正態分布
    狄莫弗(De Moivre Abraham,1667—1754)中心極限定理的出現給予了正態分布一種極限分布的感覺。後來人們不斷發現,在現實世界中,很多東西都符合正態分布,後世的一些學者如魁特奈特、高爾登、埃其渥斯諸君更是以正態主義者自居。但是真正使正態分布登上王座的的卻不是因為這個,而是因為誤差!在前文中,我們說過,統計學是研究不確定性的科學。
  • 光學偏振態的判斷以及偏振態之間的轉換
    大千世界無奇不有,一些物質的存在形式往往用肉眼是沒有辦法感知的,只能將他們的形態進行轉換,轉換為現實世界可以被感知的物理量,比如說光強,在通過人們的邏輯思維進行推演,進而區別不同的形態,比如說判斷光的偏振態的問題
  • 測量值不服從正態分布該怎麼辦?
    在統計過程控制中,為什麼數值不服從正態分布,如果不服從正態分析,我們又該怎麼處理?問:在統計過程控制的活動中,計量型特徵值不服從正態分布是怎麼回事?答:正態分布是我們基於樣本信息,對其背後虛構的總體中數值的分布情況進行描述用的,當樣本數據證明背後的總體不服從正態分布時,我們應該先考慮數據的來源。1、在統計過程控制中,為什麼特徵值不服從正態分布?
  • 思維模型17 - Normal distribution | 正態分布
    在不確定的世界裡尋找確定性除了大數定律之外,另一個重要的思維模型就是正態分布。生活中影響事物的因素可能太多太多,儘管這些事物的根本原因可能是未知的,但很多事物都近似的服從正態分布。正態分布正態分布又稱高斯分布,是一個常見的連續概率分布,它的樣子類似於寺廟裡的大鐘,因此人們又經常稱之為鐘形曲線。正態分布曲線的樣子就像下圖,說名字可能不清楚,但很多同學一看到圖就恍然大悟,原來這就是正態分布啊。
  • STATA:一次性實現變量的9種正態變換
    開學的這幾天,已經有好幾位萌新來問我數據不正態該怎麼辦?今天我們就一起來看一看可以怎麼辦。1.為什麼要進行正態檢驗?我們經常使用的參數檢驗,方差分析,線性回歸分析等統計方法只有在變量服從正態分布時才能表現最佳,所以保證變量的正態性是非常重要的,這也是進行統計分析的重要步驟。2.如何檢驗數據正態與否?
  • 統計學:如何檢驗方差齊性?
    那如果方差不一致,也就意味著值的波動程度是不一樣的,如果此時均值之間存在顯著差異,不能夠說明一定是不同組間處理帶來的,有可能是大方差帶來大的波動;如果方差一樣,也就意味著值的波動程度是一樣的,在相同波動程度下,直接去比較均值,如果均值之間存在顯著差異,那麼可以認為是不同組間處理帶來的。方差齊性檢驗是對兩組樣本的方差是否相同進行檢驗。