一般在進行統計分析與建模之前,經常需要對數據做一些描述性的工作。在描述性分析中,通過各種統計圖表及數字特徵量可以對樣本來自的總體特徵有比較準確的把握,從而選擇正確的統計推斷方法。
SPSS的許多模塊都可完成描述性統計分析,但專門為該目的而設計的幾個模塊則集中在descriptive statistics(描述性統計)菜單中,它們通過計算各種統計量或繪製統計圖來實現描述功能, 包括頻數分析Frequencies、描述性分析Descriptives 、探索性分析 Explore 等幾個過程。
頻數分析法是描述性統計方法的常用方法之一。SPSS中的「頻率」分析過程不僅能夠輸出詳細的頻數分析表格,而且還能按照用戶的需求輸出特定的百分位點及各種統計圖形。
在進行頻數分析前,首先要了解幾個基本的統計概念與數據類型,不同的數據類型在進行頻數分析時選擇的統計量也不相同。具體詳見下表:
集中趨勢
集中趨勢
分布情況
均值
Mean
標準差
Sta.deviatiom
偏度
Skewness
中位數
Median
方差
Variance
峰度
Kurtosis
眾數
Mode
極小值
Minimun
和
Sum
極大值
Maximum
全距
Range
均值的標準差
S.E.mean
集中趨勢分析——中心趨勢的數值度量
反映一組數據向某一位置聚集的趨勢,主要的統計量有均數(mean)、中位數(median)、眾數(mode)、總和(sum)以及分位數。均數適用於正態分布和對稱分布的數據,中位數適用於所有類型。如果各個數據之間差異程度較小,用平均值就有很好的代表性;而如果數據之間的差異程度較大,特別是有個別的極端值的情況下,用中位數或眾數有較好的代表性
離散趨勢分析——變異的數值度量圍繞中心波動的度量
反映一組數據背離分布中心值的特徵。主要的統計量有標準差(Std.Deviation)、方差(Variance)、極差(range)、最大值(maximum)、最小值(minimum),標準差和方差適用於正態分布。
分布特徵分析——主要統計量有偏度係數和峰度係數。
偏度係數(Skewness) :描述數據某變量取值分布的對稱性。0為正態分布;大於0為正偏或右偏,長尾在右邊;小於0為負偏或左偏,長尾在左邊;
峰度係數(Kurtosis) :描述其變量所有取值分布形態的陡峭程度。0為正態分布,大於0為陡峭,小於0為平坦。一般情況下,如果樣本的偏度接近於0,而峰度接近於3,就可以判斷總體的分布接近於正態分布
SPSS分析案例:
1、對分類變量的頻數分析
通過調研獲得了一些學生的心理素質的得分,通過頻數分析來研究了解男女學生的比例情況。性別屬於分類變量,對分類變量的頻數分析操作方法如下:
因為性別屬於分類變量,不需要測量其統計量
在圖表中選擇了餅圖百分比,可直觀的觀察男女分布的比例
最終得到SPSS輸出的結果如下圖,從表和餅狀圖可以發現男女學生的分布情況:
性別
頻率
百分比
有效百分比
累積百分比
有效
男
7
50.0
50.0
50.0
女
7
50.0
50.0
100.0
總計
14
100.0
100.0
2、對連續變量的頻數分析
依次點擊菜單:分析——描述統計——頻率,將心理測試得分錄入到變量窗口中,點擊統計,可以選擇四分位數、平均數、中位數、標準差、偏度與峰度,來考察這些學生的得分分布情況
在圖表中懸著直方圖,顯示正態曲線
最終結果如下圖:
統計量
心理測試得分
N
有效
14
缺失
0
平均值
79.7857
中位數
80.0000
標準偏差
4.09838
偏度
.203
標準偏度誤差
.597
峰度
-.711
標準峰度誤差
1.154
百分位數(P)
25
76.7500
50
80.0000
75
82.7500