線性回歸分析詳解9:顯著性水平、置信度、置信區間及其計算方法

2020-12-05 許栩原創之管理與職場

許栩原創專欄《從入門到高手:線性回歸分析詳解》第9章,總體回歸、置信度、置信區間及其計算方法。

多元回歸方程求解後,我們分別確認了回歸方程的精度和進行了回歸方程的顯著性驗證,接下來,需要計算置信區間。

置信區間是回歸分析的一個重要概念,但是,將回歸分析應用到需求預測時,並不強求引入置信區間,也就是說,用回歸分析做需求預測時,可以不進行置信區間的計算,而直接進行後續的預測步驟。所以,從這一點來說,大家可以跳過本章,直接進入專欄的第10章,用線性回歸分析進行預測。

不過,我們做回歸分析,非常有必要懂得相關置信區間的概念、邏輯和計算方法。所以,本章,我還是對此做些基礎的介紹。(本專欄總目錄如下圖。)

置信區間。

置信區間(Confidence interval)是指由樣本統計量所構造的總體參數的估計區間。【引自百科定義】

因數據極為龐大,不管是回歸分析,還是統計本身,我們都不可能去統計和分析全部數據,統計學上一般採取的做法是,用樣本去估計總體,也就是用局部去估計全部。

因為樣本、局部畢竟是總體中的一部分,所以,用樣本估算的總體存在一定的不可靠性,為了量化這種不可靠性,統計上一般以「一定的範圍」來表示,這個「一定的範圍」就是置信區間。

舉個例子,天氣預報(一種典型的預測),也是用樣本估算的總體,因總體存在一定的不可靠性,所以氣象臺發布氣溫時,一般播報多少度到多少度之間,比如明天氣溫在20℃~30℃之間,這個20℃~30℃之間,就是置信區間。

回歸分析的置信區間,可以簡單地理解為,我們最終的預測結果,不是一個確定的值,而是一個區間範圍。即,預測出來的結果在某個數以下,某個數以下,這兩個數之間就是置信區間。

比如回歸火鍋店,當未來某天氣溫3度,打99折時,最終的預測結果,銷售額在4471元至5333元之間,這個4471元至5333元之間,就是置信區間。

置信度。

上一章已經講到了置信度,置信度可以粗暴地理解為對回歸模型運行結果有把握的程度。

比如上面說的天氣預測,對「明天氣溫在20℃~30℃之間」這個預測結果有多大的把握呢?或者說「明天氣溫在20℃~30℃之間」這個結果的可信程度有多大呢?量化「把握」與「可信程度」的指標就是置信度。

置信度一般用百分比來表示,比如氣象預測人員對「明天氣溫在20℃~30℃之間」有90%的把握,或者說明天氣溫有90%的可能在20℃~30℃之間,這個把握,這個可能,這個90%,就是置信度。

需要強調的一點是,置信度並不是在求出置信區間後判斷出來的。實際上,置信度是在求解置信區間之前,由預測人員(分析人員)自己「決定」的,你採用不同的的置信度,會帶來不同的置信區間。

相關焦點

  • 線性回歸分析詳解10(完結篇):線性回歸分析預測的十大步驟
    線性回歸分析專格欄總目錄請見上圖,前9章,我分別講述了回歸分析及與回分析相關的概念,一元、多元線性回歸分析的公式與計算方法,以及多重共線性、回歸方程的精度、顯著性驗證和置信區間等進行回歸分析的重要步驟及其計算方法。至此,以回歸分析進行需求預測的各項知識點及各項準備工作全部完成,我們可以正式的以回歸分析進行需求預測。
  • 線性回歸方程的顯著性驗證,總體驗證的F檢驗與個體驗證的t檢驗
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第8章,顯著性驗證,總體驗證的F檢驗與個體驗證的t檢驗。進行F檢驗或t檢驗,都需要知道一個概念,顯著性水平。什麼是顯著性水平呢?顯著性水平是估計總體參數落在某一區間內,可能犯錯誤的概率,用α表示。有點繞吧,我將其翻譯成簡單點的:顯著性水平就是對這個模型運行結果沒有把握的程度,與之相對應的是置信度。
  • 範例分析:多元線性回歸分析
    ;回歸參數的區間估計;一元(簡單線性)回歸方程的假設檢驗;範例分析:一元(簡單線性)相關與回歸分析;多元線性回歸分析;線性回歸的步驟不論是一元還是多元相同,步驟如下:1、散點圖判斷變量關係(簡單線性);2、求相關係數及線性驗證;3、求回歸係數,建立回歸方程
  • 第四十講 R-線性回歸:預測模型及可信區間
    今天的課程將繼續帶大家學習R-線性回歸:預測模型及可信區間。線性回歸的一個主要目標是基於一個或多個預測變量來預測結果值。(我們也用它來研究兩個變量的相關性,同時校正其他混雜因素)。我們首先建立一個簡單的線性回歸模型,該模型根據速度預測汽車的停車距離。
  • 的方法 線性回歸方程檢驗專題及常見問題 - CSDN
    回歸方程建立及回歸參數的區間估計,但是它們都是建立在假定因變量和自變量線性相關的基礎上。解:運用Excel對數據進行回歸分析,得到回歸方程和決定係數R平方;三種檢驗方法雖然各有側重,但在一元線性回歸方程的檢驗中,三種檢驗的作用是相同的,因此對於一元線性回歸方程而言,只要選擇一種方法進行檢驗即可。
  • 回歸係數顯著性t檢驗_多元線性回歸方程及回歸係數的顯著性檢驗...
    解釋:隨著樣本數(或測量次數)n的增大,標準差趨向某個穩定值,即樣本標準差s越接近總體標準差σ,而標準誤則隨著樣本數(或測量次數)n的增大逐漸減小,即樣本平均數越接近總體平均數μ;3、置信區間:是對樣本的某個總體參數的區間估計,這個參數的真實值有一定概率落在測量結果的周圍的程度
  • 數據科學 | 第5講:線性回歸
    回歸分析是對客觀事物數量依存關係的分析,是統計中的一個常用的方法,被廣泛應用於自然現象和社會經濟現象中變量之間的數量關係研究。本章將介紹線性回歸的原理、估計方法以及R語言的實現。例5.1 為了研究某社區家庭月消費支出與家庭月可支配收入之間的關係,隨機抽取並調查了12戶家庭的相關數據,見表5-1。
  • 我們常聽說的置信區間與置信度到底是什麼?
    這裡就涉及到統計學裡面的置信區間與置信度,本文簡要介紹了置信區間這一核心概念,它有助於我們從直觀上理解評價估計優劣的度量方法。本文討論了統計學中的一個基本術語 :置信區間。我們僅以一種非常友好的方式討論一般概念,沒有太多花哨的統計術語,同時還會使用 Python 完成簡單的實現!
  • 分析方法驗證中的統計指標
    轉換成我們熟悉的分析方法驗證的科學名詞就是「檢測限、定量限、線性」,「準確性」和「精密度」,以及包裹在內核中的「專屬性」。在新的USP1200 Requirments for compendial validation中,「檢測限、定量限、線性」已經被新的「可檢測性」的概念所取代。
  • 《多元回歸分析》實驗報告
    由方差分析表可以得到回歸標準誤差:SSE=1.843,所以回歸標準差誤差為:SSE/2=0.48回歸標準誤差為0.4800。(5) 給出置信度為95%的區間估計。方差分析中可以得到:F值=72.396>5.32[F(1,8)=5.32]。(8) 做回歸係數的顯著性檢驗。
  • 逐步回歸分析調整後r2和模型的顯著性f值_多元線性回歸方程的顯著...
    主要有平方和(SS)、自由度(df)、均方(MS)、F(F統計量)、顯著性(P值)五大指標。通常只需要關注F和顯著性(P值)兩個指標,其中主要參考顯著性(P值),因為計算出F統計量,還需要查找統計表(F分布臨界值表),並與之進行比較大小才能得出結果,而顯著性(P值)可直接與顯著性水平α(0.01,0.05)比較得出結果。
  • 回歸分析t檢驗公式_線性回歸t檢驗公式 - CSDN
    解釋:隨著樣本數(或測量次數)n的增大,標準差趨向某個穩定值,即樣本標準差s越接近總體標準差σ,而標準誤則隨著樣本數(或測量次數)n的增大逐漸減小,即樣本平均數越接近總體平均數μ;3、置信區間:是對樣本的某個總體參數的區間估計,這個參數的真實值有一定概率落在測量結果的周圍的程度
  • 多元線性回歸與模型診斷
    ②假設檢驗(同一元線性回歸類似)自變量選擇偏差的權衡(1)丟失重要變量(2)加入無關變量變量係數的估計偏差(大樣本,無關變量會收斂於0)增加了模型參數估計的不確定性增加了R方的值,但是使得調整的R方減小(3)兩種合理估計線性回歸係數的方法①一般情況模型變量的選擇方法a.
  • 通俗易懂告訴你:何為95%置信區間?
    但我們不可能期望點估計量能給出總體參數的精確值,所以經常在點估計上加減估計誤差來計算區間估計。即區間估計的一般形式為:點估計±邊際誤差。有一個零部件的長度θ未知,我們通過點估計推測θ為9 cm,這還不足夠。如果我們能知道θ有95%的概率在(8.7cm,9.2cm),那麼就理想多了。
  • 一元線性回歸顯著性檢驗專題及常見問題 - CSDN
    一、σ2 的估計  因為假設檢驗以及構造與回歸模型有關的區間估計都需要σ2的估計量,所以先對σ2作估計。  3.相關係數的顯著性檢驗  因為一元線性回歸方程討論的是變量 x 與變量 y 之間的線性關係,所以變量 x 與 y 之間的相關係數來檢驗回歸方程的顯著性。用相關係數來反應 x 與 y 的線性關係的密切程度。
  • 數量方法期末試題
    <Object: word/embeddings/oleObject10.bin>9.根據樣本估計值以一定的概率給出總體參數的數值範圍,被稱作總體參數的(   )A.假設檢驗 B.顯著性水平C.區間估計 D.否定域10.對兩個正態總體
  • 簡單線性回歸(二)
    線性回歸相關知識:簡單線性回歸(一)線性回歸步驟線性回歸需滿足的條件①因變量Y與自變量X呈線性關係②每個個體觀察值之間互相獨立③在一定範圍內,任意給定X值,其對應的隨機變量Y均服從正態分布條件② ③ ④需通過下面的操作來判斷(一)「分析」「回歸」「線性」
  • 這些線性回歸知識是底線!
    無論面試的工作領域是數據科學、數據分析、機器學習或者是量化研究,都有可能會遇到涉及線性回歸的具體問題。要想熟練掌握線性回歸,需要了解以下知識。註:本文僅涉及理論而非代碼。,但在開始介紹之前還是要回顧下線性回歸的公式和假設。
  • 「申碩」《心理學研究方法》第四章:研究結果的整理和分析
    心理學2種:1、數碼2、代碼(二)編碼系統及其設計編碼系統包括編碼指導手冊和編碼表(三)編碼注意事項◆◆三、研究資料的定性分析◆◆(一)定性分析的含義與特點定義:對研究結果的「質」的分析,是運用分析與綜合、比較和分析、歸納和演繹等邏輯分析方法,對研究所獲得資料進行思維加工