殘差到底是什麼鬼,為什麼黑帶們都在...?

2021-02-12 成偉精益六西格瑪

Merry Christmas · Merry Christmas · Merry Christmas · Merry

聖誕襪是要用來裝禮物的,所以是小朋友最喜歡的東西,晚上他們會將自己的襪子掛在床邊,等待第二天早上收禮。

Merry Christmas · Merry Christmas · Merry Christmas · Merry

今日學習:殘差到底是個什麼鬼?我們為什麼要做殘差分析?


一年一度的中質協黑帶考試成績已經公布,一顆懸著的心終於可以放下來!

但是精益六西格瑪的實踐才剛剛開始。大家好,我想大家在回歸分析中,方差分析中,DOE分析中都會碰到殘差分析,那麼什麼是殘差?什麼是殘差分析?什麼又是標準化殘差?分析的意義在哪裡?回歸模型是怎麼出來的呢?

本期主要說明一個知識點:殘差和標準化殘差

一、殘差的定義(殘差到底是什麼鬼?)

殘差:實際值和擬合值殘留的距離(如上圖所示)

二、殘差分析的定義

在 回歸模型y=β0+β1+e中,假定e的期望值為0,並且方差相等服從正態分布的一個隨機變量。但是,如果關於e的假設不成立,此時所做的檢驗以及估計和預測都站不住腳。確定有關e假定是否成立的分析方法之一:殘差分析(residual analysis)。

三、為什麼要進行殘差分析?

用最小二乘法進行回歸分析的人都知道,在回歸分析後的結果都要進行殘差圖(Residual Plots)分析驗證模型的有效性,那 為什麼我們要進行殘差分析呢?分析出來的 殘差圖又是如何看呢?

Response=(Constant+Predictors)+Error

響應(Response)=確定性(Deterministic)+隨機性(Stochastic)

確定性部分(The Deterministic Portion)

在預測模型中,該部分是由關於預測自變量的函數組成,其中包含了回歸模型中所有可解釋、可預測的信息。

隨機誤差(The Stochastic Error)

Stochastic 這個詞很牛逼,其不僅蘊含著隨機性(random),還有不可預測性(unpredictable)。這兩點放在一起,就是在告訴我們回歸模型下的預測值和觀測值之間的差異必須是隨機不可預測的。換句話說,在誤差(error)中不應該含有任何可解釋、可預測的信息(這也就是不能出現規則形狀的原因)。

所以、模型中的確定性部分應該是可以很好的解釋或預測任何現實世界中固有的隨機響應。如果你在隨機誤差中發現有可解釋的、可預測的信息,那就說明你的預測模型缺少了些可預測信息。那麼殘差圖(residual plots)就可以幫助你檢查是否模型OK。(參考以下四個殘差圖)

四、殘差和標準化殘差

1、殘差

殘差(residual)是因變量的觀測值Yi與根據估計的回歸方程求出的預測Yi^ 之差,用e表示。反映了用估計的回歸方程去預測yi而引起的誤差。第i個觀察值的殘差為:ei=yi-yi^(文章開頭的示意圖理解更直接)

2、標準化殘差

標準化殘差(standardized residual)是殘差除以其標準差後得到的值,也稱為Pearson殘差或半學生化殘差(semi-studentized residuals),用Ze表示,第i個觀察值  標準化殘差為:

(Se是殘差的標準化估計)其實就是殘差除以殘差的標準差。

如果誤差項e服從正態分布的這一假定成立,則標準化殘差的分布也服從正態分布,大約有95%的標準化殘差在-2和2之間。(中心極限定理)

標準化殘差意義:

標準化殘差遵從標準正態分布N(0,1)。實驗點的標準化殘差落在(-2,2)區間以外的概率≤0.05。若某一實驗點的標準化殘差落在(-2,2)區間以外,可在95%置信度將其判為異常實驗點,不參與回歸直線擬合。

最後我們再看看Minitab輸出的殘差和標準化殘差

如果您還有殘差有關的問題,歡迎大家一起探討學習。

相關焦點

  • 深入探討:殘差網絡解決了什麼,為什麼有效?
    引言殘差網絡是深度學習中的一個重要概念。這篇文章將簡單介紹殘差網絡的思想,並結合文獻討論殘差網絡有效性的一些可能解釋。以下是本文的概覽:1.除此之外,去除個別神經網絡層,殘差網絡的表現不會受到顯著影響[2],這與傳統的前饋神經網絡大相逕庭。3. 殘差網絡解決了什麼,為什麼有效?
  • 靈魂拷問:殘差網絡解決了什麼,為什麼有效?
    層的誤差項較後一層減小,如果很多層的情況都是如此,就會導致反向傳播中,梯度逐漸消失,底層的參數不能有效更新,這也就是梯度彌散(或梯度消失);當 除此之外,去除個別神經網絡層,殘差網絡的表現不會受到顯著影響[2],這與傳統的前饋神經網絡大相逕庭。殘差網絡解決了什麼,為什麼有效?殘差網絡在圖像領域已然成為了一種主流模型,雖然這種網絡範式的提出是為了解決網絡退化問題,但是關於其作用的機制,還是多有爭議。
  • 為啥一定要用殘差圖檢查你的回歸分析?
    先說殘差圖究竟是什麼鬼。殘差圖是指以殘差為縱坐標,以任何其他指定的量為橫坐標的散點圖。(上圖僅是殘差的示意圖,非殘差圖,殘差圖可見下文)用普通最小二乘法(OLS)做回歸分析的人都知道,回歸分析後的結果一定要用殘差圖(residual plots)來檢查,以驗證你的模型。你有沒有想過這究竟是為什麼?
  • 鬼壓床到底是什麼鬼?
    鬼壓床到底是什麼鬼? 還有外國貴「鬼」壓床
  • 學校組織「扮鬼」,到底是個什麼鬼
    (原標題:學校組織「扮鬼」,到底是個什麼鬼)
  • 殘差分析思想淺談
    如果你學過線性回歸,那麼你應該知道殘差分析。因為殘差分析本質上就是從殘差出發分析關於誤差項假定的合理性以及線性回歸關係假定的可行性。              那麼我們先要了解一下,關於「誤差項」做了哪些假定?
  • 「沒茅臺」到底是個什麼鬼?
    剛出現「沒茅臺」這個鬼的時候,它是被灌水一族稱為「戒菸神曲」,同時又被彈幕網民們尊之為「吸菸神曲」,一切皆源於網絡上一段「哥哥」張國榮的吸菸視頻,以及那視頻中出現的神秘配樂,本尊初次聽到這個「吸菸神曲」的時候,竟被此曲的旋律搞的惆悵不已,一種時光流逝的浩瀚威壓,不講任何道理的直接撞進本尊那顆悠閒、慵懶的強大內心,竟把本尊搞的緊張兮兮,就像初次參加高考一樣,生怕倒計時已臨近了終點。
  • 趣話化學史——火焰到底是個什麼鬼(上)
    然而,火到底是個什麼東西?不論是西方的「四元素說」還是中國古代的「五行學說」,火都被認為是重要的物質組成元素。那麼,作為元素的火,到底是個什麼物質呢?很顯然,亞里斯多德和他的逍遙學派們沒有深究這個火到底是個什麼物質。而作為經驗主義的鍊金術士巴拉塞爾蘇斯,也更不可能提出任何的理論。那麼波義耳既然不滿足古希臘流傳下來的「四元素說」,他就得指出,這四種所謂的「元素」其實都是可以再分解的。
  • 鬼壓床到底是什麼鬼
    心裡雖然什麼都明白,但想舉手,手就像被捆綁住一樣;想抬腳,腳卻無力不能動。急得想呼喊求救,又苦於喊不出聲來。國產鬼壓床的故事,都跟這篇「咬鬼」差不多,所以我們勉強把這種鬼,稱為國產鬼。另一個就是其他國家鬼壓床的鬼,我們姑且統稱為外國鬼,外國鬼就多了,個個都是當地特色。比如歐洲說鬼壓床是女巫在人身上,放了600斤鹽。
  • 從心理學層面來看「鬼」:為什麼你會怕鬼?鬼又是個什麼玩意?
    為什麼大家會害怕鬼呢?對於血腥的恐怖片,可能我們只會覺得噁心,但是對於帶有鬼的恐怖片,可能我們會覺得驚悚,不敢去看。其實在我們的生活中,這種恐懼也常常有,並且「鬼」這個概念也深入人心了。相信大家對於鬼都不陌生吧!
  • 朋友圈都在說的"水逆",到底是什麼鬼?
    所以,水逆到底是個什麼鬼,工作不順,溝通不暢,小人不少,甚至什麼出門堵車,總是健忘、電子設備故障,似乎諸事不順都可以歸結到水逆的頭上。 其實,水星逆行每一年都有,大概每隔三到四個月就會發生一次,每次大約會持續20天左右。2016年之所以有這老多次水逆,是因為今年第一次水逆發生在1月5日,幾乎是一年的開始,所以剛好趕在12月19日發生第四次水逆。也就是說2016年有四分之一的時間都在水逆,一年四季都有水逆… 這種機率大概每過幾百年就會發生一次。
  • 鬼龍到底是什麼鬼?
    剛開始接觸微距的時候,一般都需要依賴對潛水點很熟悉的導潛的「火眼金睛」才能找到目標物。但是如果潛水的經驗豐富了,尤其是經常在某個潛水點出落,你也會比較知道在什麼環境下它出現的可能比較大。比如大從的黑底白點羽毛星和黑珊瑚邊上,可能有黑色的 細吻剃刀魚。白色的柳珊瑚,黃白紅間雜的羽毛星邊上,可能有白色的 細吻剃刀魚。
  • 環境變量到底是個什麼鬼?
    環境變量到底是個什麼鬼你是否會遇到這種情況,在黑窗口輸入javac xxx.java回車之後的結果是javac不是內部命令也不是外部命令,不僅如此,其它程式語言配置開發環境的時候也會遇到此類問題,說到底是「環境變量」配置出現了問題。
  • 這個世界上到底有沒有鬼?
    這個世界上到底有沒有鬼?那麼到底鬼魂這東西到底是不是真實存在呢?英國的《走進科學》為了解答這個問題,特地做了一個實驗,希望能解開困擾了很多人的一個問題,從中得到定論。堅持唯心主義的人認為,雖無人親眼目睹,但鬼魂真的存在我們的世界;而堅持唯物主義科學家們則信奉能量守恆定律,認為不管是什麼東西,不會憑空產生,也不會無故消失,只要存在過,就一定會消耗相應的物質能量
  • 都在說NVMe協議 那麼它到底是什麼鬼?
    (原標題:都在說NVMe協議 那麼它到底是什麼鬼?) 在過去的2016年,幾乎全球所有的存儲大廠都推出了基於NVMe協議的固態硬碟產品,一時間NVMe協議幾乎成為了行業最為熱門的詞彙。那麼,NVMe協議到底是什麼?它和傳統的AHCI協議又有哪些異同?下面,我們一起來看。
  • 為什麼人都說鬼都是害人的?
    為什麼鬼要害人?人死了變成鬼,鬼有法力,能穿牆,能飛,能附身,鬼的超能力有許許多多,然而活人最怕的就是她們那及其恐怖的面容。經常在影視劇聽到含冤而死的人說:「做鬼都不會放過你!」那麼鬼把人殺死了,就能報仇雪恨了嗎?
  • 淺談「多元線性回歸中的殘差分析」
  • 回歸方程殘差的方差 - CSDN
    的假定是否成立的方法之一是進行殘差分析(residual analysis).2、殘差與殘差圖殘差(residual)是因變量的觀測值常用殘差圖:有關x殘差圖,有關的方差都相同,且描述變量x和y之間的回歸模型是合理的,殘差圖中的所有點落在一條水平帶中間。(b)對所有的值,
  • 偏回歸圖與偏殘差圖
    雖然我極力想避免一些關於統計原理以及數學公式的表述,因為這對我來說是一件非常痛苦的事情,但對這幾個圖來說,我們要是知道了橫坐標是什麼,縱坐標是什麼,才能更好地理解和應用它們。當然在筆記中,我們還是用示例來展示一下這幾個圖如何獲得及其解讀,示例依舊採用《線性回歸中的線性考察》中的例子。
  • 關於Fluent的殘差(二)
    殘差曲線震蕩問題一.