標準差的公式中分母為何用n-1而不用n?

2021-02-08 統計211網

標準差,我們都不陌生,它表示一組數據的變異性,實際的含義是與平均值的平均距離。標準差越大,每一個數據點與數據分布的均值的平均距離越大。標準差的計算公式為:

公式中可以看到每一個數值和均值之間的差(),每一個差的平方,並且計算所有平方值的總和。然後用平方和除以樣本規模(減去1),最後求平方根。

大家可能會注意到,為什麼公式中的分母要減去1呢?為什麼我們除以n-1而不只是n呢?這是個很好的問題,那我們就探討一下為什麼除以n-1而不除以n的道理。

我們知道的是標準差是總體標準差的估計值,只有我們用n-1的情況下才是無偏估計。我們把分母減去1會使得標準差大於實際的大小。為什麼我們要這樣做呢?因為最優秀的科學家一般都是保守的。保守的含義是,如果我們不得不出錯,我們出錯也是由於過高估計了總體的標準差。除以較小的分母可讓我們做到這一點。因此我們除以n-1而不是n。從另外一個角度上來說,n-1稱為偏差平方差和的自由度。其含義是:在確定後,n個偏差,,...,中只有n-1個偏差可以自由變動,而第n個則不能自由取值,因為


但如果你的目的是描述樣本的特徵,有偏估計也可以。但如果你想用樣本的估計總體參數,最好要計算無偏統計值。

為了大家能夠更加清晰的了解有偏估計和無偏估計的差異。看看下面的數據表,你就會明白其中的道理。

樣本規模

公式中分子的值

總體標準差的有偏估計(除以n)

總體標準差的無偏估計(除以n-1)

有偏估計和無偏估計的差異

10

500

7.07

7.45

0.38

100

500

2.24

2.25

0.01

1000

500

0.7071

0.7075

0.0004

從上表的數據中不難看出,樣本的規模越大,標準差的有偏估計和無偏估計的差異越小。而樣本規模越小,標準差的有偏估計和無偏估計的差異比較大。這個時候為了保守起見,應該採用標準差的無偏估計值來估計總體的標準差。那麼其中的規律是什麼呢?顯然,當你計算樣本的標準差用於估計總體的參數值時,樣本規模越接近總體規模,估計就會越準確。





相關焦點

  • 樣本標準差的公式中為什麼是n-1
    很多統計學書上都提到,在樣本標準差的計算公式中,平方根中的分子是 ,而總體標準差則是 。其理由是為了校正樣本變異性而做出的調整,這是對總體標準差的無偏估計。但是,為什麼說這是一種無偏估計,很多書中並沒有提及,或者說是只用了很粗略的語言簡單地說了一下,其實也沒必過於糾結這個問題,記住就行。
  • 為什麼樣本方差的分母是 n-1?
    先說結論,樣本標準差的分母寫成n-1,是為了對自由度進行校正,這叫貝塞爾校正(Bessel's Correction)[1]。注意這個貝塞爾不是貝塞爾曲線(Bézier curve)那個貝塞爾。為了讓中學水平的讀者就能理解,我儘量不用公式,用淺顯的語言和生活中的案例,來敘述這個問題的來龍去脈。
  • 【小課堂】Excel標準差公式的區別
    在SPC中大量要用到標準差,比如Ppk,Pp的計算,一般都會使用Excel公式計算,在輸入公式時,你用對了嗎?
  • 第二講 n次方差公式
    本探究答案由楊彥清同學提供1、背景分析與知識串聯:n次方差公式在課本中是沒有要求掌握的
  • x的n次方-1的因式分解及應用
    下面公式為初等數學中常用的2個在初高中大部分老師對於第二個公式都是直接讓記住,但如果不經常使用,勉強記住不僅容易記錯而且很容易忘記,還是理解了再記憶更加容易。今天小編介紹的是x的n次方-1的通用分解因式和他的證明,以及公式在等比數列前n項和and某個高等數學等價無窮小的證明中的使用。先上公式那麼這個公式有什麼用呢?
  • 求數列「1/n(n+m)」的前n項和匯總
    然而不是所有的數列都是「1/n(n+1)」,有的是「1/n(n+2)」,有的是「1/n(n+3)」,有的是「1/n(n+4)」……那它們是不是都是這樣計算呢?它們之間又有什麼不同呢?數列「1/n(n+2)」前n項和與「1/n(n+1)」前n項和的區別我們仔細觀察發現這個數列比「1/n(n+1)」的前n項和多了1/2,而1/2的由來與分母相乘的兩個數有關。
  • 統計學中算變異量為什麼要除以n-1?什麼是「自由度」?
    這個公式的分子是所謂「差方和」(sum of squared deviations) , 還不算太難懂。真正難懂的地方是分母:如果要求 「平均差方」(mean squared deviations),應該把差方和除以n,為什麼要除以n-1?
  • 林澤民 | 統計學中算變異量為什麼要除以n-1?什麼是「自由度」?
    這個公式的分子是所謂「差方和」(sum of squared deviations) , 還不算太難懂。真正難懂的地方是分母:如果要求 「平均差方」(mean squared deviations),應該把差方和除以n,為什麼要除以n-1?
  • 怎用「a(n+1)」^2=3(an)^2+2an·a(n+1)導出遞推公式?常用方式兩種
    求出an的遞推公式要想求出數列an的遞推公式,就要從給出的[a(n+1)]^2=3(an)^2+2an·a(n+1)式子入手,那這個式子該如何轉變成數列an的遞推公式呢?第一種方法,直接因式分解。對於給出的式子[a(n+1)]^2=3(an)^2+2an·a(n+1),要麼將a(n+1)和an化成之差形式向等差數列靠近,要麼就是將a(n+1)和an化成之比的形式向等比數列靠近。式子[a(n+1)]^2=3(an)^2+2an·a(n+1)無法化成a(n+1)和an之差形式,所以只能將其化成之比的形式。
  • 標準差還是標準誤?
    標準差( standard deviation) 作為隨機誤差( 或真差) 的代表,是隨機誤差絕對值的統計均值 。大白話解釋,就是衡量一組數據的離散程度。在國家計量技術規範中,標準差的正式名稱是標準偏差,簡稱標準差,用符號 σ表示:式中 xi 為一組樣本變量( 從總體中抽取的一部分個體的集合)。
  • 標準差的計算公式是什麼?
    標準差公式是一種數學公式。標準差也被稱為標準偏差,或者實驗標準差,公式如下所示:兩種證券形成的資產組合的標準差=(W12σ12+W22σ22+2W1W2ρ1,2σ1σ2)開方,當相關係數ρ1,2=1時,資產組合的標準差σP=W1σ1+W2σ2;當相關係數ρ1,2=-1時,資產組合的標準差σP=W1σ1-W2σ2。
  • 方差的計算公式 方差和標準差公式等
    >方差的計算公式 平方差及方差和標準差公式例1 兩人的5次測驗成績如下:X:50,100,100,60,50 ,平均成績為E(X )=72;Y:73, 70, 75,72,70 ,平均成績為E(Y )=72。
  • 方差的計算公式 平方差及方差和標準差公式
    方差的計算公式 平方差及方差和標準差公式例1 兩人的5次測驗成績如下:X:50,100,100,60,50 ,平均成績為E(X )=72;Y:73, 70, 75,72,70 ,平均成績為E(Y )=72。
  • 為什麼樣本方差要除以n-1?
    首先,學過統計學的童鞋,都學過這樣1個公式,就是樣本方差我相信肯定有讀者和我一樣問過,為啥代表樣本的方差分母是n-1?我也相信你肯定被回答過,這是因為自由度的緣故。樣本方差主要因為樣本均值已知,所以只要知道了n-1個樣本後,利用樣本均值,就可求出最後1個樣本。這樣一來n個樣本只有n-1個可以自由變化的樣本了。
  • wps如何求標準差? 手把手教你如何在WPS表格中求標準差
    wps如何求標準差? 手把手教你如何在WPS表格中求標準差時間:2017-08-08 14:42   來源:系統天堂   責任編輯:沫朵 川北在線核心提示:原標題:wps如何求標準差? 手把手教你如何在WPS表格中求標準差 wps如何求標準差?怎麼求一系列數據的標準方差呢?
  • 【Python與統計學】經常容易錯的N與N-1的探討,惡魔在細節之中
    沒錯,這就是我們今天要探討的是一個統計學書上經常沒有講到,大家實操中也會經常會忽視的一點:什麼時候用N,什麼時候用N-1?我們先從公式入手:注意,這個X是抽樣,其中Variance分母為n-1。好了那麼問題來了,為啥是n-1?我們用Python做一下模擬:
  • 類型二:由a(n+1)/an=f(n)求通項?歸類內容,常考類型,方法須知
    一般出現在大題的第一問中,也會出現在選擇題和填空題中。遞推公式的類型很多,但是一般分為七種模型,上一節中詳細地講解了類型一,這節中詳細講解類型二的轉化方法和注意事項。使用累乘法的具體步驟:先給遞推公式a(n+1)/an=f(n)(n∈N+)中的n從1開始賦值,一直到n-1;得到n-1個式子,即a2/a1=f(1),a3/a2=f(2),a4/a3=f(3
  • wps如何求標準差? WPS表格求標準差圖文教程
    wps如何求標準差? WPS表格求標準差圖文教程時間:2017-07-16 14:56   來源:三聯   責任編輯:沫朵 川北在線核心提示:原標題:wps如何求標準差? WPS表格求標準差圖文教程 wps如何求標準差?下面為大家帶來了WPS表格求標準差的方法,供大家學習噢! 這裡標準偏差的計算使用n-1方法。
  • 求數列n(an+1)的前n項和?關鍵要求出an+1——這是常用的方法
    要想求出這道題不僅要知道錯位相減法等常用的求前n項和數列的方法,還要知道通過數列的前n項和如何求出數列an+1的通項公式的方法,這也是常用的方法。所以要想求出這道題要分為兩步:第一步是先求出數列an+1通項公式;第二步是求出數列「n(an+1)」的前n項和Tn。
  • 時間複雜度 O(log n) 意味著什麼?
    不管你是計算機科班出身還是想有效解決最優化問題,如果想要用自己的知識解決實際問題,你都必須理解時間複雜度。先從簡單直觀的 O(1) 和 O(n) 複雜度說起。O(1) 表示一次操作即可直接取得目標元素(比如字典或哈希表),O(n) 意味著先要檢查 n 個元素來搜索目標,但是 O(log n) 是什麼意思呢?你第一次聽說 O(log n) 時間複雜度可能是在學二分搜索算法的時候。二分搜索一定有某種行為使其時間複雜度為 log n。我們來看看是二分搜索是如何實現的。