描述性統計主要關注數據的三大內容:
1.集中趨勢
2.離散趨勢
3.數據分布情況
描述集中趨勢的指標有均值、眾數、中位數,其中均值包括截尾均值、幾何均值、調和均值等。
描述離散趨勢的指標有頻數、相對數、方差、標準差、標準誤、全距、四分位間距、四分位數、百分位數、變異係數等。
注意:連續型變量和離散型變量的指標有所不同。
由於很多統計分析都有一個正態分布的假設,因此我們經常也會關注數據的分布特徵,常用峰度係數和偏度係數來描述數據偏離正態分布的程度,也可以使用Bootstrap方法計算出結果與經典統計學方法計算出的結果進行對比,如果差異明顯,則說明原數據呈偏態分布或存在極值
SPSS用於描述性統計分析的過程大部分都在分析—描述統計菜單中,另有一個在比較均值—均值菜單,雖然這幾個過程用途不同,但是基本上都可以輸出常用的指標結果。
此過程可以輸出連續型變量集中趨勢和離散趨勢的主要指標,還可以輸出判斷分布的直方圖、峰度值
和偏度值,此外,該過程最主要的作用是輸出頻數表,結果舉例如下:
看起來似乎這個過程才是正統的描述統計分析過程,實際上該過程輸出的內容並不多,也沒有統計圖可以調用,唯一特別的是該過程可以對數據進行標準化變換,並保存為新變量。
探索性分析是對原有數據進行描述性統計的基礎上,更進一步的描述數據,和前兩種過程相比,它能提供更詳細的結果。
該過程主要用於對兩個連續變量間的比率進行描述分析
輸出的結果比較簡單,只是指標的匯總表格,在此略去
分類變量的描述性統計比較簡單,主要就是看頻數分布和構成比,基本用交叉表一個過程就可以完成,該過程雖然放在描述統計中,但是由於功能豐富,也經常被用來做列聯表的推斷分析。
該過程在比較均值菜單中,但是大部分輸出結果都是描述性統計指標
from http://www.cnblogs.com/xmdata-analysis/p/5539927.html