標準差(standard deviation, SD)和標準誤(standard error of the mean, SEM)之間的區別與聯繫主要有以下幾點:
1. SD量化的是樣本數據彼此之間的差異性,分散性;
2. SEM量化的是對總體數據真實均值估計的精確度,它同時考慮了SD和樣本量;
3. SD和SEM的單位都和樣本數據的單位相同;
4. 根據計算公式可知,SEM肯定是小於SD的;
5. 樣本量越大,SEM越小。這是肯定的,因為大樣本的平均值肯定比小樣本的平均值更加接近總體真實的均值。樣本量足夠大,即使數據非常分散,也可以非常精確地知道均值。
6. 而對於SD而言,並不是說大樣本量的SD就一定大於或者小於小樣本量的SD。SD不像SEM那樣,發生可預測的變化(樣本量越大,SEM越小;樣本量越小,SEM越大)。SD不會發生可預測的變化,從樣本中計算的SD就是對總體SD的最佳估計,只能說樣本量越大,對總體SD的估計越精確吧。
那麼什麼情況下選擇報告標準差,什麼情況下選擇報告標準誤呢?
其實根據SD和SEM的定義,對其各自的適用性也大概有一定的了解了。
1. 比如樣本中的每個值代表一個不同的個體,這時我們可能想要顯示值之間的差異,這時就應該選擇報告SD。比如,下面這個圖中,是為了顯示變異程度的,那麼自然就選擇報告SD。
2. 如果我們的目的是利用均值進行t檢驗或者方差分析,或者顯示我們的數據與模型預測之間的接近程度,那麼與顯示數據之間的變異性相比,我們更感興趣的是顯示樣本數據定義均值的準確性,那麼在這種情況下,我們就報告SEM。如下所示,進行ANOVA分析,所以報告SEM。
科研菌學術討論群,在群內可以用自己的暱稱,廣告一律踢;其他公眾號的宣傳也不發,就算是要發,提前和小編商量和確認,不然也是一律踢哈。
歡迎添加小編微信↑↑↑
請大家加我的時候就備註好「學術討論群」以及自己的「單位+專業+姓名」