SD(Standard deviation) 和SE (Standard error)是數據分析中最常用的概念之一,但也是很多人時常感到迷惑的兩個概念。今天我們就和大家討論下這兩個概念到底在意義和使用上有何不同。首先,想必大家都知道,SD和SE存在數量上的關係,對於一組樣本量為n的數據來說,則
但如果二者僅僅是數值上有差別,且可以方便的彼此轉換,那麼我們構造一個指標不就可以了麼?何必要構造兩個指標呢?在實際應用中,為甚麼有時候我們表示均值的置信區間是, 有的時候又是呢?
這就涉及到二者的在意義上的本質區別了,二者不僅僅是倍的轉換這麼簡單。
1) 假設我們從一個大樣本中,抽取n個數據,那麼這n個數據的標準差就是SD。
2) 假設我們從一個大樣本中,進行多次抽樣,每次抽n個數據,且對每次抽到的數據都求其均值,也就是得到mean1, mean2, mean3…, 那麼我們得到的這些均值的標準差是多少呢?理論上,這個標準差就是,沒錯,這就是SE。
所以SE從本質上,是一系列均值的標準差。而SD,則只能代表你目前得到的那組數據的標準差。 下一步,我們就要必須要感謝這世界上有中心極限定理這個規律了(大學時代大家其實應該都學過這個東西,只是那個時候可能無法理解其深遠的應用價值)。如果中心極限定律不成立(理論上這個規律100%成立,但現實中不一定,因為你每次抽樣的樣本量可能不太夠),那麼我們對參數估計的精確度就不好描述了。
按照中心極限定理,不管你的總體數據是什麼分布(正態也好,二項也好,泊松也好,gamma也好, 具有零膨脹也好,過度離散也可以…, 總之,一切分布都無所謂)。只要我們不斷的從這個總體裡進行樣本量為 n(當然n越大越好)的隨機抽樣,然後不斷的對這些抽樣來求平均值,那麼,這些抽樣的均值一定會符合正態分布。
所以也許我們有時很難以用一個分布去描述某個抽樣數據,但我們一定可以描述其均值的分布,因為理論上,任何隨機抽樣的均值都是符合正態分布的。所以根據正態分布的概率密度規律,我們便可以用來表述其均值的95%置信區間。
正是因為這樣,我們才可以在在頻率統計中,對參數估計的精確性進行度量(貝葉斯中統計中,那就不一樣了,有時間我們另當別論)。
到這裡我們再說參數估計。根本上說,每個模型對參數的估計其實都是對均值和置信區間的估計。所以這就為為什麼幾乎我們所有的模型(線性模型,廣義線性模型,非線性模型等等)的參數估計,都會給出均值和置信區間(或均值和SE)。因為這個參數,代表是樣本的均值,必定符合正態分布,這就是中心極限定理最大的應用價值。否則,我們只能對參數估計一個點,而對於其精確性,我們便無從談起,或者,只能通過隨機化來求其置信區間。
好了,到這裡想必大家都明白SD和SE的意義了,那麼二者用法上到底有何不同呢?
1) 如果想描述你的原始數據的變異程度,那麼,毫無疑問,是最佳選擇。
2) 如果你想描述你的原始數據的均值的變異程度(雖然事實上你只有一個均值,但根據上面講的原理,我們同樣可以給出這個均值的變化範圍),那麼就是正確答案。
3) 對於參數估計來講,要毫不猶豫的採用作為其置信區間。這個時候就不要自作聰明再去把SE轉化為SD了,因為SE本身就是均值的SD。
理論上,SD對樣本量n的大小,沒有依賴性。但SE卻強烈的依賴於樣本量,樣本量越大,SE越小。這也是為什麼我們經常看到很多擬合圖裡面,數據點明明分布的很散,而擬合線的置信區間卻很窄的原因(如下圖),一方面數據點越多的地方,SE當然越小;另一方面,這個置信區間表述的是X軸某個位置所對應的Y值的均值的波動範圍,而不是其原始數據的波動範圍。所以其均值的波動範圍,當然就比原始數據要小的多了。
圖片來源(Song et al. 2019)
Song,J., S. Wan, S. Piao, A. K. Knapp, A. T. Classen, S. Vicca, P. Ciais, M. J.Hovenden, S. Leuzinger, C. Beier, P. Kardol, J. Xia, Q. Liu, J. Ru, Z. Zhou, Y.Luo, D. Guo, J. Adam Langley, J. Zscheischler, J. S. Dukes, J. Tang, J. Chen,K. S. Hofmockel, L. M. Kueppers, L. Rustad, L. Liu, M. D. Smith, P. H. Templer,R. Quinn Thomas, R. J. Norby, R. P. Phillips, S. Niu, S. Fatichi, Y. Wang, P.Shao, H. Han, D. Wang, L. Lei, J. Wang, X. Li, Q. Zhang, X. Li, F. Su, B. Liu,F. Yang, G. Ma, G. Li, Y. Liu, Y. Liu, Z. Yang, K. Zhang, Y. Miao, M. Hu, C.Yan, A. Zhang, M. Zhong, Y. Hui, Y. Li, and M. Zheng. 2019. A meta-analysis of1,119 manipulative experiments on terrestrial carbon-cycling responses toglobal change. Nature Ecology & Evolution
3:1309-1320.