統計學是通過數據去發現規律(數據具有同質性,即規律),在這裡,數據是指統計學上變量的數值體現。
科學家最近採用彩色編碼地圖,標記出全球222個國家人口的平均壽命分布情況。從上至下依次為大於80、大於77.5、大於75、大於72.5、大於70、大於67.5、大於65、大於60、大於55、大於50、大於45、大於40和小於40。
1
計量變量
資料的自然分布形態,稱為規律。
趨勢:集中和分散
1
集中趨勢
均數:算數平均數,所有變量值得和除以樣本量。
中位數:按從小到大排序,位置在中間的那個數。
幾何平均數:描述等比資料(後面取值是前面數據的倍數),變量值的乘積後,開n次方。
眾數:出現頻數最多的那個數。
1
離散趨勢
極差:數據分布的最大區間——最大值減去最小值。
四分位數間距:數據四等分,上四分之一與下四分之一之差;百分位數,位次居於第百分多少位的數。
方差:離均差平方和除以樣本量。
標準差:對稱或正態分布數據離散趨勢的描述。
變異係數:標準差除以均值;描述單位不一樣或單位一樣但均數相差較大的資料的離散趨勢。
1
等級變量
可用中位數、秩均值和眾數描述。
秩均值(按數值大小排序,提取每個數據的位次,即秩次,求秩次的均值),常用語非參數檢驗
1
計數變量
反映數據間的互不相容的屬性和類別,指標有率、構成比和想對比。
率:在一定範圍內,某現象實際發生的數與可能發生某現象的總數之比。應用意義:用於判定某種現象發生的強度與頻率。
構成比:局部除以總體,應用意義為說明事物內部各部分所佔的比重或分布。
相對比:兩個有關的指標之比,應用意義為說明兩個指標的對比水平。
編 者 說
對於成對稱分布的計量數據,通常採用均值加減標準差來表示,而對於偏態分布數據常用中位數(四分位數間距);計數數據,率和構成比應用較多,常可以進行卡方檢驗。
本文摘自武松《SPSS實戰與統計思維》