描述性統計分析之標準差

2021-03-02 小杜聊科研

標準差(standard deviation, SD)用來衡量一組數據的變異性或分散性,單位與該組數據的單位相同。

 

標準差的表示方法有兩種:

1. 平均值±標準差,並且聲明後面這個值就是標準差。例如下圖:

2. 有人認為,由於標準差是單個值,因此不應該跟隨正負號,應該單獨表示。例如下圖:

標準差的計算步驟如下:

1. 計算每個值與樣本均值之差的平方;

2. 將這些值加起來;

3. 將總和除以N-1(此時稱為方差);

4. 取平方根求得標準差。

 

在第三步中,為什麼是除以N-1而不是N?

 

因為我們想通過樣本來推斷整體,得出一般性的結論,也就是說我們想知道的是總體的SD,除以N-1算出來的是對總體標準差的最佳估測。在步驟1中,計算每個值與平均值之間的差,這裡的平均值是樣本的平均值,總體的平均值是不知道的,樣本的均值與真實的總體均值是有差異的;在第2步中算出的值要比使用真實的總體均值要小(不可能大),所以除以N-1而不是除以N。

 

當然,如果只是量化一組特定數據的變化,並不打算進行推斷以得出更廣泛的結論,這個時候就除以N,得出的SD就是這組特定數據的SD。比如,在量化考試成績之間的差異時,全年級全部人的考試成績都用來分析。

GraphPad中計算SD是基於N-1的,excel中函數STDEV ()是基於N-1,函數STDEVP ()是基於N的。

 

當數據來自高斯分布時,約有68%的數據分布在平均值±一個標準差之內,約有95%的數據分布在平均值±兩個標準差之內。如下圖所示:

當數據來自非高斯分布時,至少75%的值在平均值±兩個標準差之內,至少89%的值在平均值±三個標準差之內。

相關焦點

  • 描述性統計分析
    本文繼續引用微信公眾號中案例數據中的pgdat數據集,手把手教你學會使用R實現基本的描述性統計分析
  • 簡單統計分析—描述性統計分析
    最近有粉絲留言需要描述分析的代碼,本節將介紹如何利用R的函數獲取計量資料和計數資料的統計量,描述性統計分析是任何統計分析最關鍵的一步,描述性統計分析同時也是後續統計推斷重要的環節
  • SPSS數據分析—描述性統計分析
    描述性統計分析是針對數據本身而言,用統計學指標描述其特徵的分析方法,這種描述看似簡單,實際上卻是很多高級分析的基礎工作,很多高級分析方法對於數據都有一定的假設和適用條件
  • Excel進行描述性統計分析
    點擊上方公眾號名稱,繼續點擊右上角「設為星標」可搶先一步閱讀推送文章哦     Excel容易上手、直觀展示,工作中遇到的大部分數據,初期可採用用Excel進行描述統計分析
  • 用Excel進行數據分析:描述性統計分析
    在數據分析的時候,一般首先要對數據進行描述性統計分析(Descriptive Analysis),以發現其內在的規律,再選擇進一步分析的方法。描述性統計分析要對調查總體所有變量的有關數據做統計性描述,主要包括數據的頻數分析、數據的集中趨勢分析、數據離散程度分析、數據的分布、以及一些基本的統計圖形,常用的指標有均值、中位數、眾數、方差、標準差等等。》》接下來我們講講在Excel2007中完成描述性統計分析。
  • 帶你一文了解描述性統計分析
    所以啊,學好描述性統計是數據分析師的基礎,魚粉們還不趕緊學起來吖!本文將對描述性統計的重要名詞進行解釋,後續幾篇會為各個描述性統計的指標用Python進行展示及應用,期待下吧~~一、    常用的描述性統計知識:描述性統計分析要對調查總體所有變量的有關數據做統計性描述,主要包括數據的頻數分析、數據的集中趨勢分析、數據離散程度分析、數據的分布、以及一些基本的統計圖形。
  • SPSS中的數據分析—描述性統計分析【1】
    今天小白先從描述性統計分析開始給大家介紹,話不多說,直接進入主題。在工作和生活中,我們有的時候無法得到研究對象的全部數據,我們只能夠得到總體中抽取出來的一部分,在數據分析中,我們稱這個部分叫做樣本。數據分析就是通過樣本的數據來推斷研究總體的數據,在這個過程中我們使用的方法可以分為兩種:描述性統計分析以及推斷性統計分析。
  • 如何在Python中進行描述性統計分析?
    在進行數據分析時,一般要先對數據進行描述性統計分析,以發現其內在的規律,再選擇進一步分析的方法。描述性統計分析要對調查總體所有變量的有關數據做統計性描述,主要包括數據的頻數分析、數據的集中趨勢分析、數據離散程度分析、數據的分布以及一些基本的統計圖形。
  • [理論+spss實戰]一組數據的描述性統計分析
    第一部分:理論部分一組數據的描述性統計分析集中趨勢的度量集中趨勢是指一組數據向某一中心值靠攏的程度,它反應了一組數據中心點的位置所在眾數     :(一組數據中出現次數最多的變量值)標準差:S變異係數:標準差 除以  平均數
  • R描述性統計
    這裡就是描述性統計分析,下面看看描述性統計分析在R中的實現。」      導入數據,這裡我通過choose.files()命令調出複選框選擇我存在電腦中的mydata.csv文件,colClasses是對數據框列類型進行設置,這裡我設置mydata數據前4列為字符型,後8列為數值型。
  • 描述性統計分析,掌握常用指標,進入數據分析大門
    那麼,我們又該如何對統計到的數據進行統計分析呢?今天,我將跟大家分享一下既基礎又重要的統計分析策略——描述性統計分析。什麼是描述性統計分析?我們在做了相關的數據統計之後,將會收集到一系列複雜的數據信息,在這種情況下,僅僅單靠「看」數據,會讓人一臉茫然。
  • SAS統計分析系列:描述性統計分析 (三)-- 描述性統計量
    描述性統計量。本文介紹描述數據分布形態的描述性統計量。在進行統計分析時,通常需要假設樣本服從某種分布。所以在進行分析之前有必要對數據的分布形態進行初步的了解,檢查數據是否大致服從某種分布,然後再運用統計理論去進行假設檢驗。描述數據分布形態有兩種基本方法,一種是計算統計量,一種是作圖。百分位數是一種位置指標。
  • 描述性統計分析(一):算術平均值
    在描述統計中我們常用的統計指標主要包括均值、方差、標準差、中位數、眾數、峰度、偏度等。使用Excel數據分析功能可以非常方便地得到這個結果。集中趨勢指一組數據向中心值靠攏的傾向和程度。測度集中趨勢就是尋找數據水平的代表值或中心值,不同類型的數據應當使用不同的集中趨勢測度值。值得注意的是,低層次數據的測度值適用於高層次的測量數據,但高層次的測度值並不適用於低層次的測量數據。
  • SPSS | 快速掌握描述性統計分析及統計各類圖形!
    一、SPSS數據分析—描述性統計分析二、spss常見統計圖形SPSS用於描述性統計分析的過程大部分都在分析—描述統計菜單中
  • SPSS+Excel統計分析技巧篇——醫學數據的描述性統計分析
    我們進行描述性統計分析主要運用的軟體是SPSS,但是SPSS對數據的要求比較高,必須為數字類型的數據,那麼我們在使用SPSS之前,必須對原始數據進行格式化的整理,如果這個工作沒做好,將會直接導致後續的工作都白費。對原
  • 【python數據分析】:描述性統計分析之離散程度(極差、方差、標準差)
    方差與標準差方差與標準差a_std = sta.loc['std']b_std = stb.loc['std']a_var = data['A_sale'].var()b_var = data['B_sale'].var()print('A銷售額的標準差為:%.2f, B銷售額的標準差為:%.2f' % (a_std,b_std))print('A銷售額的方差為:%.2f, B銷售額的方差為:%.2f' % (a_var,b_var))fig = plt.figure(figsize = (16,6))ax1 = fig.add_subplot
  • SPSS必學 | 快速掌握描述性統計分析及統計各類圖形!
    一、SPSS數據分析—描述性統計分析二、spss常見統計圖形SPSS用於描述性統計分析的過程大部分都在分析—描述統計菜單中
  • 《R語言實戰》自學筆記40-描述性統計分析
    7.1.1 方法雲集對於基礎安裝,你可以使用summary()函數來獲取描述性統計量。,n為樣本量,m為平均值,s為標準差,skew為偏度,kurt為峰度。sapply(df[5:8], mystats) # sapply函數描述性統計。
  • 如何做好描述統計分析
    寫在前面什麼是描述性統計分析,這不僅是數據分析面試中最常見的問題,也是我們日常分析中必過的一道關卡。要把握數據的分布特徵,需要從3個方面進行描述:集中趨勢、離散程度和分布形狀。四分位差對於數值型數據,四分位差可以來描述數據的離散程度,四分位差就是上下四分位數的差。反映了中間50%數據的離散程度,四分位差越小,說明中間的數據越集中,極差極差就是最大值與最小值的差,容易受極值的影響。平均差各變量與其平均數離差絕對值的平均數,反映了每個數與平均數的差異程度,Excel裡用avedev計算平均差。
  • 圖解統計學:簡單易懂的基礎概率&描述性統計
    今天這篇文章就簡單說一下我近期學習到的統計學中的描述性統計分析以及基礎概率知識。統計性描述分析是作為統計分析的第一步,在日常的數據分析中其實我們經常使用一些特徵值,尤其是我們做周報或者月報的分析時,這些描述性的統計分析特徵值對於我們有一定的幫助,描述性統計分析是進行正確的統計推斷的先決條件。