誤差與標準誤差

2021-02-19 化學分析計量

你問我答 第2期

繼上次小怡童鞋後臺留言想要看「ICP-AES」之後,又有幾位同學留言想要看新內容。小析一個個來檢索資料、編輯排版、發布回饋哈。今天分享的話題是一組極易混淆的概念,即「標準差與標準誤差」,提問人是龍馬負圖,和網球小王子同姓,所以送出一首曾經出現在動漫中的同名歌曲吧。

昨天與機械社高教分社聯和舉辦的贈書活動受到很多朋友的喜歡,活動仍在繼續,截止到明早8:30。感謝朋友的關注與支持,我們將在未來帶來更多的系列活動。科普,我們持續在路上!

△龍馬也是我的小男神哦

什麼是標準差(standard deviation)呢?根據國際標準化組織(ISO)的定義:標準差σ是方差σ2的正平方根;而方差是隨機變量期望的二次偏差的期望,這個就不用解釋了。

什麼是標準誤差(standard error)呢?看了些文獻,有的還是大牛的,定義都不統一,通常來說有兩種定義方式:

1、樣本容量的標準誤差是樣本的標準差除以。ps:這裡還有人用樣本的標準差除以n來作為標準誤差(估計是弄錯了,不過標準誤差是基於總體均值來估計標準差,所以也沒有必要說人家錯);

2、一個統計量的標準誤差還可以用估計誤差的標準差來刻畫即:。

 

         下邊來自編輯學報郝拉娣的《標準差與標準誤》,相關性也比較大,希望對大家有幫助。(全文請通過正規渠道下載獲得哦)↓↓↓

標準差作為隨機誤差(或真差) 的代表,是隨機誤差絕對值的統計均值。在國家計量技術規範中,標準差的正式名稱是標準偏差,簡稱標準差,用符號σ表示。標準差的名稱有10 餘種,如總體標準差、母體標準差、均方根誤差、均方根偏差、均方誤差、均方差、單次測量標準差和理論標準差等。標準差的定義式為:用樣本標準差s 的值作為總體標準差σ的估計值。樣本標準差的計算公式為:。

     

在抽樣試驗(或重複的等精度測量) 中, 常用到樣本平均數的標準差,亦稱樣本平均數的標準誤或簡稱標準誤( standard error of mean) 。因為樣本標準差s 不能直接反映樣本平均數…x 與總體平均數μ究竟誤差多少, 所以, 平均數的誤差實質上是樣本平均數與總體平均數之間的相對誤。可推出樣本平均數的標準誤為,其估計值為,它反映了樣本平均數的離散程度。標準誤越小, 說明樣本平均數與總體平均數越接近,否則,表明樣本平均數比較離散。

       

標準差是表示個體間變異大小的指標,反映了整個樣本對樣本平均數的離散程度,是數據精密度的衡量指標;而標準誤反映樣本平均數對總體平均數的變異程度,從而反映抽樣誤差的大小 ,是量度結果精密度的指標。

這是人大經濟論壇給出的另一個答案,或許能夠引發不一樣的思考噢。↓↓↓

標準誤其實就是標準差的一種,不過二者的含義有所區別:

標準差計算的是一組數據偏離其均值的波動幅度,不管這組數是總體數據還是樣本數據。你看standard deviation,說的就是「偏離」,只是在翻譯為中文時,失去了其英文涵義。

而標準誤,衡量的是我們在用樣本統計量去推斷相應的總體參數(常見如均值、方差等)的時候,一種估計的精度。樣本統計量本身就是隨機變量,每一次抽樣,都可以根據抽出的樣本情況計算出一個不同的樣本統計量值。理論上來講,從既定的總體中按照既定的樣本規模n,窮盡所有可能抽出的樣本(不妨假設為NN),根據這些樣本可以計算出NN個樣本統計量值,把這些統計量值分組繪成直方圖(X軸為分組的統計量數值,Y軸為落在某一分組區間內的頻率),則這個直方圖就反應了樣本統計量的分布情況(即抽樣分布)。既然是分布,當然就有均值和方差。如果所有可能的樣本統計量值的平均值就是總體均值,這就是無偏估計。如果所有可能的樣本統計量值的方差在所有用於估計總體參數的統計量裡最小,這就是有效估計。因此,抽樣分布的標準差(也就是標準誤)越小,則用樣本統計量去估計總體參數時,精度就越高。所以,你明白為什麼叫標準誤(standard error)了。一般意義上講,standard error反映的是用樣本統計量去估計總體參數的時候,可能發生的平均「差錯」。

不妨這麼理解吧,如果總體平均值是160,抽樣誤差是5,就是說用抽得的樣本平均數去推斷總體平均數時,平均差錯可能在5左右;如果抽樣誤差是3,精度當然就比5要高啦。不同的總體、不同的樣本規模,這個精度當然是不同的。如果總體的變異本身很小(也就是總體標準差小),樣本規模越大,這種情況下精度當然就高啦。另外,根據大數定律,當樣本規模大到一定程度的時候,不管總體是什麼分布,樣本平均數都會近似服從正態分布,這就為計算抽樣誤差(標準誤)提供了理論依據。

最後總結:標準差還是標準誤,注意看其英文原意,就可以把握個八九不離十了。本質上二者是同一個東西(都是標準差),但前者反映的是一種偏離程度,後者反映的是一種「差錯」,即用樣本統計量去估計總體參數的時候,對其「差錯」大小(也即估計精度)的衡量。

不知道以上的答案有沒有「精準」解決你的疑問呢?如還有不明白之處,歡迎留言繼續探討哈~

相關焦點

  • 誤差逆傳播
    這個差距叫做誤差,在本例中,這個(Ok- Tk)2實際是Ok這個向量和Tk這個向量的差向量的長度。每個樣本都有誤差,所有樣本的誤差累加起來就是總誤差。它的意思是:如果用採集來的K個樣本的樣本集對一個神經網絡進行求參,那麼誤差函數是所有樣本的誤差累加起來。每個樣本的誤差是模型輸出值和樣本標記值差的平方。誤差函數最後還除了一個2.這個僅僅為了後面求導美觀。訓練這個神經網絡的模型的過程,就是求得本網絡模型的17個參數(12個w和5個θ)的過程。
  • 「誤差捲尺」暴露多重問題
    (1月8日《北京青年報》)  「誤差捲尺」是通過有意識的「誤差」,通過調整刻度之間的距離,來達到改變測量值的目的,從而實現謀利,這是一種欺詐行為。「誤差捲尺」都到了可以「自行訂製」,到了公然出售的地步,這暴露了多方面的問題。
  • 「誤差捲尺」,短斤少兩的不止是良心
    「誤差捲尺」並非是「無心誤差」,而是「故意誤差」。「故意誤差」的目的,就是通過「打馬虎眼」方式,獲取不正當利益。「誤差捲尺」多數情況下是專門給裝修人員準備的,一些道德失色的裝修人員,藉助「誤差捲尺」多收取裝修費用。    「誤差捲尺」售價為正常尺子的五六倍之多。一名商家介紹,「誤差捲尺」通過調整刻度之間的距離,達到改變測量值的目的。
  • 數控插齒機工作檯迴轉運動誤差補償
    國內外對普通插齒機分度鋌運動精度的測量分析和提高的研究工作,遠不如對滾齒機的研究發展迅 速,相應的檢測設備和檢測標準仍不完善。因為與一 般的滾齒機相比,插齒機分度鏈的最大不同在於它有 兩套低速迴轉系統。在插齒加工過程中,兩套低速系 統的誤差相互登加後,使誤差的檢測和分析變複雜。
  • 4種繪製帶誤差線的柱形圖
    (), stat="identity") +    geom_errorbar(aes(ymin=len-se, ymax=len+se),                  width=.2, # 設置誤差線的寬度 # (右)誤差線2:使用95%置信區間ggplot(tgc2, aes(x=dose, y=len, fill=supp)) +
  • 血糖儀±20%的誤差範圍,這個國家標準是不是太寬泛了?
    (中國質檢總局發布的血糖儀國家標準GB/T 19634-2005規定)為此,王大伯很苦惱,他說如果自己早上的血糖測得的是7,算誤差範圍就是7 x ±20%=±1.4,可是5.6就是血糖正常,8.4就是高血糖。這樣的標準是不是也太寬泛了?
  • 網售「誤差捲尺」80釐米標為1米
    市場調查 「誤差捲尺」售價為正常尺五六倍近日,有網友發帖稱,網上有部分商家在網絡商城中售賣「非標、誤差捲尺」。北青報記者5日在一家網絡商城上看到,有數十個商家在出售這類「誤差捲尺」。一名商家在其店鋪中介紹,「誤差捲尺」通過調整刻度之間的距離,來達到改變測量值的目的。
  • 地腳螺栓誤差的處置方法
    原標題:地腳螺栓誤差的處置方法地腳螺栓誤差的處置方法,大致與死地腳螺栓的方法相同,僅僅可以將地腳螺栓拔出來處置。如螺栓過長,可在工具機上切去一段再套螺紋;如螺栓過短,可用熱鍛法伸長;如方位不符,用迂迴法糾正。
  • 一切都有動力的Elac:1dB以內單體誤差
    第二度造訪Elac,最令人驚訝的品管標準就是單體誤差,廠長Thomas告訴我們,Elac喇叭必須在Kiel工廠裡經過百分之百全部檢驗,合格之後才能出廠,而Elac對喇叭品管的檢驗標準,誤差容忍值僅有1dB,這是我參訪過的喇叭工廠當中最嚴苛的標準!
  • 跟蹤指數的指數基金 為什麼還會有跟蹤誤差?
    經常買ETF的朋友,應該看到過這個詞:「跟蹤誤差」,一般會在投資目標中這樣出現:「緊密跟蹤標的指數,追求跟蹤偏離度和跟蹤誤差最小化」。於是有小夥伴來問,ETF直接投資於指數,為什麼會有誤差呢?於是有小夥伴來問,ETF直接投資於指數,為什麼會有誤差呢?  其實,不止是ETF,包括普通指數基金、指數增強基金都會存在跟蹤誤差。
  • 「萬分之一誤差 也不能放過」
    「這兩個數據不對,有0.0002的誤差,需要重新檢測。」一次,核對當天的質檢數據時,胡麗娜發現兩個表格的同一個數據有差異,提出了疑問。「誤差那麼小,沒關係的。」同事不以為意。胡麗娜當場表明態度:「質檢工作要求數據必須準確,差0.0001都不行。」憑藉嚴謹細緻的工作態度,開展持續攻堅創效行動期間,經胡麗娜手檢驗的油品實現質量零投訴。(韋芫臻 )
  • 什麼情況下需要進行四輪定位,在使用中哪些操作不當會引起誤差?
    1.四輪定位儀的使用注意事項  在使用四輪定位儀時,應當懂得如何最大限度地減小測量誤差,以充分保證測試精度。四輪定位儀在測試中可能引起誤差的地方有三個方面,使用中必須要注意。  01 違反操作規程或未妥善保管設備引起的誤差  轉角盤保管得不好,將使其在轉動前輪時有阻力,造成前輪懸架撐緊,將會給前輪前束和外傾角的測量帶來誤差。
  • 小知識丨水準測量誤差來源,測繪人必看!
    今天我們就來說說水準測量時的誤差來源及修正方法,這一節所講述內容的實用性還是較強的,希望對大家日常作業有所幫助。主要是水準管軸與視準軸不平行,雖經校正但仍然殘存少量的誤差,而且由於望遠鏡調焦或儀器溫度變化都可引起i角發生變化,使水準測量發生誤差。所以,在觀測時,要注意使前、後視距相等,打傘避免儀器受日光暴曬,便可消除或減弱此項誤差的影像。
  • 流體型滅火劑表面張力測量中的誤差分析
    摘要:介紹泡沫滅火劑、水系滅火劑等流體型滅火劑產 品表面張力測量方法以及測量過程中容易出現的各種誤差,對其產生的原因進行分析。可通過恆溫水域或低溫試驗槽等控 溫裝置確保測量溫度在合理的範圍內,儘量減小溫度造成的測 量誤差。應保證測量中泡沫溶液質量分數的精確性;在測量時 要注意保持銷金環的菰度和水平度,鉗全環使用後應注意清洗 並高溫灼燒。
  • 異質性、隨機誤差、效應修飾——談談Meta分析的固有缺陷
    但是需要注意,不同RCT之間本身也存在隨機誤差,所以,當我們在說統計學異質性時,必然也包括隨機誤差的存在。 那麼,在Meta中,不存在異質性這個假設本身並沒有說清楚,其實正確的說法應該是:不存在隨機誤差以外的異質性。當忽略方法學異質性時,這個說法變為:不存在效應修飾。
  • 開關電源IC中誤差放大器的自激振蕩及解決方法
    開關電源的控制IC一般都會包含一個誤差放大器,用來將輸出電壓的偏移等進行放大以控制主開關電路的動作,實現穩壓輸出。這個誤差放大器本身是一個運算放大器,在實際使用中會加入負反饋,而由於外部元件及PCB等因素的影響,誤差放大器有時會產生自激振蕩,使開關電源不能正常工作。筆者分析了誤差放大器加入負反饋時產生自激振蕩的原理,並以UC3875控制IC為例設計了外部補償電路,並進行了實驗驗證。
  • 不同溫度計測量,為何有誤差
    人的體溫每時每刻都在不停地變化著,例如清晨的體溫是最低的,午後的體溫是最高的,對於這種情況想要判斷出體溫度是否標準,一定要進行反覆多次測量,那麼究竟體溫多少度才算是發熱呢,我們人體也我的溫度36-37度,在這個範圍內波動幅度不大都屬於正常的範圍內
  • 新泰市對256臺計程車計價器開展強制檢定 保障「零誤差」
    檢定過程中,檢定人員嚴格按照檢定規程,對計程車計價器的功能、計程誤差、計時誤差、切換速度誤差、永久時鐘誤差等項目進行逐項檢測。在檢定過程當中,檢定人員發現部分計程車存在因傳感器老化、輪胎磨損等問題,導致一次檢定不合格的情況。檢定人員對不合格的計價器及時進行了校正或要求更換,然後,再進行二次檢定,確保在用的計程車計價器周期檢定合格率為100%。
  • 一文帶你學會如何用Python生成帶誤差棒的並列和堆積柱狀圖
    首先,聊聊在Python中如何繪製帶誤差棒的並列柱狀圖通過前面咱們聊過的內容,大家已經知道繪製柱狀圖需要調用matplotlib庫中的bar()函數,那如何繪製帶誤差棒的多數據並列柱狀圖呢?為了能夠讓大家更好的理解,下面咱們還是先舉個「慄子」直觀感受一下吧:上面就是咱們所編寫的繪製帶誤差棒的多數據並列柱狀圖,下面咱們一起來分析一下,其中第14~19行代碼是設置誤差棒相關屬性的代碼,第27~30行則是用於生成帶誤差棒的多數據並列柱狀圖的函數,可以看到是通過調用兩次bar()函數進行繪製,二者進行疊加共同生成了咱們所需繪製的圖表
  • 有誤差嗎?
    誤差大嗎?紅外線熱像儀的誤差取決於它的靈敏度,靈敏度越高,誤差就越小,現在火車站和醫院等人口密集的地方使用的都是熱靈敏為0.03攝氏度的熱像儀,就是所測溫度的誤差在0.03攝氏度內,這個差距應該說非常小了。