全距
全距(range)是一組分數中最大值(Xmax)與最小值(Xmin)之差,是一群分數變異情形最粗略的指標。全距容易計算,實用性高,可以應用在名義變量與順序變量,來求出變量當中類別的多寡。但是它的缺點是不精確也不確定,無法反映一個分配的每個數值的狀態。
以九個學生統計成績50、55、60、60、60、65、66、70、90為例,最大值為90,最小值為50,全距為40.計算式如下:
四分差
四分差(semi-interquartile range;QR)的定義是一組數據當中的第三四分位數(區隔高分端的前25%的分數,簡稱Q3)與第一四分位數(區隔低分端的後25%的分數,簡稱Q1)距離的一半,也就是中間百分之五十的樣本分數差距的二分之一。
四分差的計算,首先將一群分數依大至小或依小至大排列後,以人數個數平均分成四段,每一段各佔25%的個數,位居三個分段點的分數稱為第一四分位數(Q1)、第二四分位數(Q2)與第三四分位數(Q3)。四分差即是取第三四分位數與第一四分位數差的一半。四分差越大,代表分數的分散情形越大。
以前面的統計分數分配為例,第一四分位數為(55+60)/2=57.5,第三四分位數為(66+70)/2=68,四分差則為(68-57.5)/2=5.25。
以離均差為基礎的變異量數
標準差(standard deviation)與變異數(variance)是變異量數的一對雙胞胎,標準差的平方即為變異數,這兩個量數都是利用離均差(deviation score)作為變異指標的計算基礎。
離均差
離均差反映的是一組數據中,各分數與平均數的距離,通常以小寫的x來表示,是一個非常簡單的變異指標,但是在統計上是一個非常重要的概念:
當離均差為正值時,表示分數落在平均數的右方;離均差為負值時,表示分數落在平均數的左方。而平均數是每一個分數加總後的平均值,為一組分數的重心位置,因此離均差的正值與負值的總合相等,離均差的和為0:
由於離均差的和為0,在使用上無法作為整體數據變異的指標,為解決正負值相抵的問題,可以取離均差的絕對值後相加,除以觀察值個數後,所得到數值稱為平均差(mean deviation)。