殘差到底是什麼「鬼」?

2021-03-05 成偉精益六西格瑪

精益六西格瑪管理創新最佳實踐,我們一直在路上。

考完試了,那顆懸著的心終於回歸,但是精益六西格瑪的實踐才剛剛開始。大家好,我想大家在回歸分析中,方差分析中,DOE分析中都會碰到殘差分析,那麼什麼是殘差?什麼是殘差分析?什麼又是標準化殘差?分析的意義在哪裡?回歸模型是怎麼出來的呢?

本期主要說明一個知識點:殘差和標準化殘差

一、殘差的定義(殘差到底是什麼鬼?)

殘差:實際值和擬合值殘留的距離(如上圖所示)

二、殘差分析的定義

在 回歸模型y=β0+β1+e中,假定e的期望值為0,並且方差相等服從正態分布的一個隨機變量。但是,如果關於e的假設不成立,此時所做的檢驗以及估計和預測都站不住腳。確定有關e假定是否成立的分析方法之一:殘差分析(residual analysis)。

三、為什麼要進行殘差分析?

用最小二乘法進行回歸分析的人都知道,在回歸分析後的結果都要進行殘差圖(Residual Plots)分析驗證模型的有效性,那 為什麼我們要進行殘差分析呢?分析出來的 殘差圖又是如何看呢?

Response=(Constant+Predictors)+Error

響應(Response)=確定性(Deterministic)+隨機性(Stochastic)

確定性部分(The Deterministic Portion)

在預測模型中,該部分是由關於預測自變量的函數組成,其中包含了回歸模型中所有可解釋、可預測的信息。

隨機誤差(The Stochastic Error)

Stochastic 這個詞很牛逼,其不僅蘊含著隨機性(random),還有不可預測性(unpredictable)。這兩點放在一起,就是在告訴我們回歸模型下的預測值和觀測值之間的差異必須是隨機不可預測的。換句話說,在誤差(error)中不應該含有任何可解釋、可預測的信息(這也就是不能出現規則形狀的原因)。

所以、模型中的確定性部分應該是可以很好的解釋或預測任何現實世界中固有的隨機響應。如果你在隨機誤差中發現有可解釋的、可預測的信息,那就說明你的預測模型缺少了些可預測信息。那麼殘差圖(residual plots)就可以幫助你檢查是否模型OK。(參考以下四個殘差圖)

四、殘差和標準化殘差

1、殘差

殘差(residual)是因變量的觀測值yi與根據估計的回歸方程求出的預測yi^ 之差,用e表示。反映了用估計的回歸方程去預測yi而引起的誤差。第i個觀察值的殘差為:ei=yi-yi^(文章開頭的示意圖理解更直接)

2、標準化殘差

標準化殘差(standardized residual)是殘差除以其標準差後得到的值,也稱為Pearson殘差或半學生化殘差(semi-studentized residuals),用Ze表示,第i個觀察值  標準化殘差為:

(Se是殘差的標準化估計)其實就是殘差除以殘差的標準差。

如果誤差項e服從正態分布的這一假定成立,則標準化殘差的分布也服從正態分布,大約有95%的標準化殘差在-2和2之間。(中心極限定理)

標準化殘差意義:

標準化殘差遵從標準正態分布N(0,1)。實驗點的標準化殘差落在(-2,2)區間以外的概率≤0.05。若某一實驗點的標準化殘差落在(-2,2)區間以外,可在95%置信度將其判為異常實驗點,不參與回歸直線擬合。

最後我們再看看Minitab輸出的殘差和標準化殘差

如果您還有殘差有關的問題,歡迎大家一起探討學習。

相關焦點

  • R.Squared到底是個什麼鬼?
    今天想跟大家仔細探討一下,統計學中常常提到的R.Squared到底是個什麼鬼?為什麼要討論這個問題?因為之前發表的一個文章,叫做:「預測精度:到底多好才算真的好?」其中涉及到線性回歸中的R.Squared,而且提到「外樣本」的R.Squared有可能是負數。王老師一筆帶過,原以為這不是問題。沒想到給很多朋友帶來了困惑。因此,決定認真討論一下:R.Squared到底是個什麼鬼?
  • 為啥一定要用殘差圖檢查你的回歸分析?
    先說殘差圖究竟是什麼鬼。殘差圖是指以殘差為縱坐標,以任何其他指定的量為橫坐標的散點圖。(上圖僅是殘差的示意圖,非殘差圖,殘差圖可見下文)用普通最小二乘法(OLS)做回歸分析的人都知道,回歸分析後的結果一定要用殘差圖(residual plots)來檢查,以驗證你的模型。你有沒有想過這究竟是為什麼?
  • 殘差網絡解決了什麼,為什麼有效?
    在網絡高層,學習一個恆等映射即等價於令殘差部分趨近於0,即 。殘差單元可以以跳層連接的形式實現,即將單元的輸入直接與單元輸出加在一起,然後再激活。因此殘差網絡可以輕鬆地用主流的自動微分深度學習框架實現,直接使用BP算法更新參數[1]。
  • 《紅樓夢》裡的促狹鬼到底是個什麼鬼?
    促狹鬼到底是個什麼鬼?最先從《紅樓夢》中知道促狹鬼的存在,而且曹雪芹多處用到促狹鬼這個詞。查資料了解到,促狹的意思是氣量狹小,性情急躁。促狹鬼,是指喜歡捉弄人、使壞的那一類人,帶有一點小奸小惡的意思。但在不同情境下,促狹鬼並非實指,有時是一種戲謔的稱呼,就如「討厭鬼」「搗蛋鬼」一類的詞。
  • 深入探討:殘差網絡解決了什麼,為什麼有效?
    引言殘差網絡是深度學習中的一個重要概念。這篇文章將簡單介紹殘差網絡的思想,並結合文獻討論殘差網絡有效性的一些可能解釋。以下是本文的概覽:1.除此之外,去除個別神經網絡層,殘差網絡的表現不會受到顯著影響[2],這與傳統的前饋神經網絡大相逕庭。3. 殘差網絡解決了什麼,為什麼有效?
  • 深度學習入門講解:什麼是殘差網絡Resnet(上)
    微信公眾號:follow_bobo更多精彩內容,在知乎:蔣竺波加公眾號,回復『』殘差網絡『』,可以得得到視頻所有高清
  • 一文讀懂殘差網絡ResNet
    本文包括什麼:殘差網絡的由來,為什麼需要殘差網絡?殘差網絡是什麼,怎麼定義?殘差網絡為什麼好用?優越性在哪裡?有沒有一個簡單的例子來直觀看懂什麼是殘差網絡?殘差網絡的由來殘差操作這一思想起源於論文《Deep Residual Learning for Image Recognition》,目前的引用量已達3萬多。
  • 偏回歸圖與偏殘差圖
    雖然我極力想避免一些關於統計原理以及數學公式的表述,因為這對我來說是一件非常痛苦的事情,但對這幾個圖來說,我們要是知道了橫坐標是什麼,縱坐標是什麼,才能更好地理解和應用它們。當然在筆記中,我們還是用示例來展示一下這幾個圖如何獲得及其解讀,示例依舊採用《線性回歸中的線性考察》中的例子。
  • 萬聖節到底是什麼鬼?
    1、萬聖節到底是個什麼鬼?萬聖節是基督教的傳統節日,嚴格意義上說和大多數的中國人關係並不大。像中國的除夕節,會有各路鬼神出沒一樣,薩姆汗節也會出現各種鬼神,於是人們帶上鬼面具裝扮成鬼的模樣,以防止受到鬼怪的傷害。
  • 殘差分析思想淺談
    如果你學過線性回歸,那麼你應該知道殘差分析。因為殘差分析本質上就是從殘差出發分析關於誤差項假定的合理性以及線性回歸關係假定的可行性。              那麼我們先要了解一下,關於「誤差項」做了哪些假定?
  • 孩子害怕的那個「鬼」,到底是什麼鬼?
    「哪裡有鬼?長什麼樣子?我還沒見過,我也去看看。」我假裝一本正經地邊說邊往廁所走去。女兒聽我說了感覺很詫異接著說道「不知道,我也不知道長什麼樣,就總感覺身後有什麼東西跟著我,所以要趕緊跑!關了燈好黑我害怕,馬桶衝水的聲音也好可怕。」
  • 線性回歸時,你還不會做殘差分析?來看基本教程!
    LINE條件往往採用殘差分析的方法來診斷。若你要掌握線性回歸,殘差分析必須得學會的基本技巧。線性回歸模型構建是否成功,用什麼來評價也是重要的內容。SPSS一般來說統計分析時會產生兩個指標,R^2和方差分析的P值,本文同時展開介紹。這篇推文將全面介紹多因素線性回歸的一些細節處理方法,請不要錯過。篇幅較長(約6000字),請耐心閱讀。
  • 郎中講DOE-5-殘差分析(Minitab/JMP/MODDE/Design expert)
    一、殘差是什麼?
  • 「內生性」 到底是什麼鬼? New Yorker告訴你
    依照這個定義,我什麼也看不出來,倒是可以從CLRM假定cov(Ut,Xt)≠0情況考慮。既然cov(Ut,Xt)≠0可以叫成內生性,那麼cov(Ut,Xt)=0大概可以叫外生變量了吧。chris的書前面把這個假定強化為X是非隨機變量,當顯然這一假定是靠不住的,X更多情況下是隨機變量。
  • 怕鬼?鬼是個什麼東西?
    我說:什麼是鬼?長什麼樣?漂亮嗎?男的女的?有錢嗎?有車嗎?有房嗎?友人瞬間笑噴:「我怎麼知道。」我怒,嗔道:你什麼都不知道,怕什麼鬼?友人反擊:「就是不知道,才可怕!」既然已經知道不確定性是產生擔憂和恐懼的原因,那麼只要把這種不確定變成確定,就沒有什麼可怕的了。作家馬伯庸寫過一篇文章,《當你怕鬼時到底在怕什麼?》文中說,如果害怕鬼,你就不停地問自己問題,具體怕的是什麼?青面獠牙?漆黑的走廊?奪走你生命的恐懼?
  • 「量化多因子」到底是個什麼鬼?
    量化基金到底是怎麼運作的?經常聽到的量化基金名字中的「多因子」又是個什麼鬼?今天,我就和大家一起來巴拉巴拉。  那所謂的「量化多因子」到底是個什麼鬼?「機器智能分析選股」、「量化模型選股」,聽上去很高端,到底有沒有用呢?我們先來了解下「量化選股」的簡單原理。
  • 神經網絡中的幾個重要思想之殘差網絡(ResNet)
    概述殘差網絡解決了深度神經網絡不能過深的問題,對深度學習的實踐和思想影響都很巨大。本文首先介紹殘差網絡提出的背景,然後解釋它的原理,再後面介紹了殘差網絡背後的多個原理思考,最後給出了一個代碼實現。何愷明等人提出了殘差網絡ResNet解決了這個問題,並在2015年的ImageNet圖像識別挑戰賽中獲得冠軍。殘差塊下面講解一下殘差網絡的原理。
  • ResNet:用於圖像識別的深度殘差網絡
    因此本文提出了一種殘差學習框架,以簡化對更深網絡的訓練。該方法顯式地將層重新配置為參考輸入層的學習殘差函數,而不是學習非參考函數。本文提供了充分的經驗證據,這些證據表明,殘差網絡易於深度驗證,並且從大大增加的深度中可以獲得準確性。在ImageNet數據集上,評估深度最大為152層的殘差網絡-比VGG網絡[41]深8倍,但仍具有較低的複雜度。
  • 牙根處會黑黑的到底是什麼鬼? 黑色東西為何物?
    牙根處會黑黑的到底是什麼鬼? 黑色東西為何物?時間:2016-11-16 12:06   來源:樂莎莎口腔   責任編輯:沫朵 川北在線核心提示:原標題:牙根處會黑黑的到底是什麼鬼? 黑色東西為何物? 不知道大家在「照鏡子」的時候,有沒有發現「牙齒背面」牙齦周圍有一圈黑黑的的東西?怎麼刷也刷不掉。
  • 30天學會醫學統計與SPSS公益課程(Day17-2): 殘差分析
    LINE條件往往採用殘差分析的方法來診斷。若你要掌握線性回歸,殘差分析必須得學會。線性回歸模型構建是否成功,用什麼來評價也很重要。SPSS一般來說統計分析時會產生兩個指標,R^2和方差分析的P值,本文同時展開介紹。這篇推文將全面介紹多因素線性回歸的一些細節處理方法,請不要錯過。篇幅較長(約6000字),請耐心閱讀。