信號處理中的平均偏差,標準偏差和方差

2021-02-19 汽車電子硬體設計

本文從信號處理應用的角度討論了三種統計性描述方法。

在上一篇有關電氣工程師的統計性描述的文章中,我們看到均值和中位數都可以傳達數據集的集中趨勢。儘管中位數對異常值的敏感度較低,但在電子和數位訊號處理中更經常使用均值。實際上,算術平均值是電氣工程中必不可少的統計技術。

但是,我們通常不僅僅需要一種手段來充分描述或理解數據集。

當我們僅報告中心趨勢時,我們沒有考慮數據的重要方面,即值偏離中心趨勢的方式。

偏離均值

假設我們已經數位化了兩個模擬輸入信號。如果我們將數字代碼轉換回伏特單位並繪製離散時間波形,則它們看起來像這樣:

我們可以通過查看曲線圖來很好地猜測均值:藍色信號的中心趨勢是1.2 V,紅色信號的中心趨勢是0.8V。但是,如果我們僅報告均值,我們將給人的印象是,這兩個信號之間唯一重要的差異是平均值的0.4 V差異(或者我們可以將其稱為DC電平或DC偏移)。顯然,這個故事還有更多。

電氣工程師會本能地將這些波形識別為穩定的DC信號(也許是電源電壓),其中包括相當多的噪聲。更重要的是,我們立即意識到,藍色信號比紅色信號噪聲大。如果僅考慮平均值,則將丟失噪聲性能的主要差異。順便說一下,為什麼我們會在這些信號中感知到噪聲?因為各個值明顯偏離平均值,他們這樣做的方式似乎是隨機的,並且相對於平均值,偏差很小。

當統計學家看到均值小的隨機偏差時,電氣工程師會看到噪聲。

平均偏差

這些信號有多吵?有點吵?非常吵?讓我們嘗試為該問題提供更精確的答案。換句話說,我們需要量化這些數據集中的偏差。

量化偏差時,我的第一個直覺是找到每個數據點與平均值之間的距離,然後計算所有這些距離的平均值。這將為您提供平均偏差(也稱為平均絕對偏差),即,值偏離中心趨勢的典型量。這是數學語言中的平均偏差:

 

其中N是數據集中值的數量,μ是平均值,x [k]是表示為離散時間變量k的函數的信號。

 

在該曲線圖中,水平線表示電壓水平,該電壓水平是平均值之上和之下的一個平均偏差。

儘管平均偏差是直觀的,但它並不是量化信號偏離均值趨勢的最常用方法。為此,我們需要標準偏差。

方差和標準偏差

在電氣工程中,平均偏差的問題在於我們正在平均電壓(或電流)差,因此我們在幅度範圍內進行操作。噪聲現象的本質是,在分析噪聲時,我們強調幅度上的功率,因此,我們需要一種在功率範圍內運行的統計技術。

幸運的是,這很容易實現。功率與電壓或電流的平方成正比,因此,我們要做的就是在求和和求平均值之前將差項平方。這個過程導致稱為統計度量方差,由σ2表示(發音為「西格馬平方」):

 

我們可以將方差描述為表示為功率的信號隨機偏差的平均功率。這意味著方差與我們開始使用的值沒有相同的單位。如果我們正在分析電壓信號的波動,則方差的單位為σ2而不是σ。

如果要表達信號使用原始單位隨機偏離的趨勢,則必須通過將平方根應用於最終值來補償平方差:

 

該過程生成稱為標準偏差的統計量度,即,信號隨機偏差的平均功率表示為幅度。因此,如果我們正在分析電壓信號,則儘管我們使用電壓偏差的平方來計算標準偏差,但標準偏差的單位為σ。

 

在該圖中,水平線表示電壓水平,該電壓水平是平均值之上和之下的一個標準偏差。

方差和標準偏差以不同的方式表示相同的信息。儘管據我所知,方差在某些分析情況下更為方便,但通常最好選擇標準差,因為它可以直接解釋為衡量信號偏離均值趨勢的度量。

結論

標準差和方差是在科學和社會科學中經常出現的基本統計技術。我希望本文能幫助您理解這些概念與電信號之間的基本聯繫,並且在下一篇文章中,我們將介紹一些與標準偏差有關的有趣細節。

相關焦點

  • 乾貨 :教你用Python來計算偏差-方差權衡
    儘管如此,我們可以評估出一個模型的誤差,並將其拆分成偏差和方差兩部分,從而藉此了解該模型的運行方式。在這篇教程中,你將了解如何計算一個機器學習模型的偏差和方差。——《統計學習及其在R中的應用》2014年版,第19頁偏差-方差的權衡理想情況下,我們希望一個模型能有低偏差和低方差,但是在實際操作中這是非常具有挑戰性的。實際上這是機器學習建模的目標。降低偏差很容易使方差升高。相反,降低方差也會使得偏差升高。
  • 分享丨如何正確區分誤差、不確定度、精密度、準確度、偏差、方差?
    在日常分析測試工作中,測量誤差、測量不確定度、精密度、準確度、偏差、方差等是經常運用的術語,它直接關係到測量結果的可靠程度和量值的準確一致。在實際工作中,測量不確定度可能來源有很多,如定義不完整、取樣、基體效應、環境條件、質量和容量器皿的不確定、標準物質、測量方法和程序中的估計和假定以及隨機變化等。測量不確定度一般來源於隨機性和模糊性,這就使得測量不確定度一般有許多分量組成。
  • 標準偏差如何與均方根值相關
    最近,我們在計算標準差時涉及了樣本量補償-特別關注貝塞爾的校正。在本文中,我們將基於上一篇文章對標準偏差的討論,該討論捕獲了數據集或數位化波形中隨機變化的平均功效。該平均功率表示為幅度,例如表示為瓦特而不是伏特。我們使用以下公式計算標準差: 均方根(RMS)評估我們大多數人可能首先在AC分析的背景下了解了RMS值。
  • 方差的計算公式 方差和標準差公式等
    >方差的計算公式 平方差及方差和標準差公式例1 兩人的5次測驗成績如下:X:50,100,100,60,50 ,平均成績為E(X )=72;Y:73, 70, 75,72,70 ,平均成績為E(Y )=72。
  • 雙下降真實發生,UW教授用統計學解釋偏差-方差權衡,LeCun轉推
    偏差—方差之間的權衡判讀對機器學習來說是非常重要的。在深度學習研究中,可能會遇到雙下降現象,認為這有悖於偏差—方差權衡。本文通過一個統計學的例子,對偏差—方差權衡展開了形象的解讀。並且,峰值不會出現在多層網絡中,因為它們呈現隱式正則化。」Daniela Witten 教授的解讀究竟有哪些獨到之處呢?她開篇是這樣介紹的:「還記得偏差—方差權衡嗎?它意味著模型在中等程度靈活性條件下表現良好。圖中可以看到 U 形測試誤差曲線。我們試圖找到靈活性的『最佳點』(Sweet Spot)」。
  • 方差的計算公式 平方差及方差和標準差公式
    方差的計算公式 平方差及方差和標準差公式例1 兩人的5次測驗成績如下:X:50,100,100,60,50 ,平均成績為E(X )=72;Y:73, 70, 75,72,70 ,平均成績為E(Y )=72。
  • 理解Bias(偏差),Error(誤差),和Variance(方差)的區別和聯繫?
    在概率論和統計學中方差是衡量隨機變量或一組數據時離散程度的度量。以上就是我對Bias(偏差),Error(誤差),和Variance(方差)的一些簡單理解,圖全是截取自李宏毅的PPT中。最近聽機器學習課程時聽到這三個概念一開始有點模糊。感覺沒理解透,所以自己又查了點資料,消化了一下,然後做了個筆記。
  • 結構方程操作篇——共同方法偏差檢驗(1)
    這裡劃線的地方改為:比較平均方差萃取量的根號值和構念相關係數的大小。本期內容:介紹檢驗同源偏差的第一種方法,Harman單因子!包括傳統的探索性因子做法和當下普遍的驗證性因子做法。我們對兩種方法的操作步驟進行了演示。此外,驗證性因子分析又分為兩種不同做法,我們比較了不同做法的特點。國內主流的控制同源偏差的方式有哪些?
  • 機械製圖中標準公差和基本偏差的基本概念
    標準公差和基本偏差1.標準公差﹕國家標準對每一基本尺寸制定一系列公差﹐根據使用要求選用﹐用以確定公差帶大小的任一公差﹐稱為標準公差﹐用「IT」表示。(2)公差等級 確定尺寸精確程度的等級﹐標準公差分為20級﹐即IT01﹑IT0﹑IT1……IT18﹐等級依次降低。2.基本偏差﹕國家標準規定的﹐用於確定公差帶相對於零線位置的上偏差或下偏差﹐一般為靠近零線的偏差。
  • MSSQL函數-STDEV標準偏差和STDEVP標準差
    StDev函數是算出查詢結果中指定欄位所有值的標準偏差,它是用來衡量數據偏離算術平均值的程序,標準偏差越小,這些值偏離平均值就越少,反之偏離越大。此函數不計算文本值和邏輯值(如TRUE和FALSE)。它反映了數據相對於平均值的離散程度。
  • 實驗標準偏差例題
    用實驗標準偏差表徵測量的重複性,請計算實驗標準偏差。10.0004+10.0006)m/10(2)計算殘差v1=10.0006m-10.0005m=+0.0001m,同理 v2=-0.0001m,v3=+0.0003m,v4=-0.0003m,v5=-0.0002m,v6=0.0000m,v7=0.0000m,v8=+0.0002m,v9=-0.0001m,v10=+0.0001m      (3)計算標準偏差
  • 日本留學:日本「偏差值」究竟是什麼?高校偏差值排行了解一下!
    一個成績墊底的高中生,在補習班老師和母親的幫助下,通過拼搏奮鬥,最終考上了慶應義塾。看完電影,大家想必都燃起了學習的熱情,恨不得立刻開始背單詞。小編也是一樣,但是當時有一點一直困擾著我:電影中一直出現的「偏差值」到底是什麼呢?
  • 使用R計算方差與標準差
    概述描述樣本值的離散程度,最常用的指標是方差和標準差,它們與前面所說的全距(極差)只使用了兩個極值情況不同,它們利用了樣本的全部信息去描述數據取值的分散性。計算方差的公式方差是各樣本相對均值的偏差平方和的平均。
  • 地學統計中的算術平均值、幾何平均值、中位數、標準偏差和標準誤差的意義和用法有何不同
    在處理分析實驗數據或採樣數據時,經常會遇到對相同採樣或相同實驗條件下同一隨機變量的多個不同取值進行統計處理的問題。此時,多數人會不假思索地直接使用算術平均值和標準差。顯然,這種做法是不嚴謹的。那麼在地學統計中不同的平均值和誤差計算方法的概念在意義和使用上有何不同呢?
  • 直播預告 | 挽回「迷途」中的少年,處理青少年的「偏差行為」
    世界觀、價值觀的關鍵期,這個階段,大部分孩子會產生迷茫、迷失感,有些孩子可能會做出讓人匪夷所思的行為行動: 在心理諮詢室中, 事實上,大部分「偏差行為」的出現,是青少年身心健康產生問題的信號:當青少年無法尋找到恰當緩解自身壓力和情緒的途徑時,就容易產生偏差行為。
  • 投資中的認知偏差:確認偏差
    證實偏差其實是人的一種自利性傾向造成的,有選擇地去解釋並記憶某些能夠證實自己既存的信念或圖式的信息,驗證自己觀念的科學性與合理性,並由此獲得自信與自尊的滿足感。不是你沒有接收到正確信息,而是那些與你的經驗和認知相矛盾的信息反而可能是正確的,但卻被你的大腦給過濾掉了。最能說明這種偏差的一個例子是《呂氏春秋》中疑鄰竊斧的故事。從前有個丟了一把斧子的人。
  • 「經驗分享」怎麼計算平均絕對偏差
    ['下面用wps中的excel通過分步計算和AVEDEV函數一步計算分別計算樣本平均絕對偏差,方便大家理解算法。']['工具/原料']wps-excel,office-excel類同['方法/步驟']1打開wps,建立excel文檔,先建立待計算平均絕對偏差的樣本數據,如圖以身高數據X為例。
  • 為什麼理想和現實總存在偏差?關鍵就是兩個字:概率
    這其中的關鍵是,如何解釋真實情況和理想中的概率之間的偏差。第一個概念就是平均值或者叫做數學期望值,也就是N*p,因為概率是p的事件進行N次試驗後,平均發生的次數,也是最可能發生的次數,好,這是N*p。接下來我們再用平方差(簡稱方差)這個概念來描述曲線的「鼓」與「平」。「方差」這個詞你可能並不陌生,那麼什麼是方差,它是如何計算的呢?我們下面就簡單地說一說。
  • 論施工中的進度表示及偏差處理
    它簡明形象和直觀,編制方法簡單,使用方便。橫道圖記錄比較法,是把在項目施工申檢查實際進度收集的信息,經整理後直接用橫道線並列標於原計劃的橫道線一起,進行直觀比較的方法。這是人們施工中進行施工項目進度控制經常用的一種最簡單、熟悉的方法。但是它僅適用於施工中的各項工作都是按均勻的速度進行,即是每項工作在單位時間裡完成的任務量都是各自相等的。
  • 【偏差】偏差調查常見的八大問題
    偏差調查是任何 GMP 組織中最重要的質量活動之一。在 FDA 和其他監管機構發布的缺陷、警告信和同意令中,它們也一直處於最常被引用的問題列表的首位。 (「未能徹底審核[任何無法解釋的差異][批次或其任何組分不符合質量,無論批次 是否已經銷售]。」)