CFA L2 知識點:數量分析-線性回歸和假設(Day 2)

2020-12-12 注會閒談

複習Day 2:

今天把下載的PDF原版書在某寶上找了家文印店發過去列印裝訂了,大概後天收到。鑑於周末兩天低效的電子書複習效果,既然6000大洋報名費都花了,省不到兩百塊錢的列印費實在有點說不過去,少吃的幾頓大餐等考試完再補上吧。

複習總括

發文前的複習進度:L2V1:P242-250,共8頁,按照原定計劃需要複習40頁才算完成任務。按照CFA官網的Learning Ecosystem裡,每天要完成59個知識點,完成了17個。

今天的學習內容是數量分析裡面的線性回歸分析部分,內容包括線性回歸方程、線性回歸方程的求解、假設。本著學以致用的精神,在excel中做了線性回歸分析的模型。

對應考綱Los4b :explain the assumptions underlying linear regression and interpret regression coefficients。說明在線性回歸下的假設,並解釋回歸係數。

今日思維導圖

線性回歸分析模型(Linear Regression Model)和相關假設的思維導圖如下:

知識點

1.線性回歸方程:Y=b0+b1X+ε,i=1,……n

2.線性回歸方程模型我將其中的內容分為三部分:

(1)變量/觀測值(oberservations),Xi,Yi,這是要分析的數據對象。教材中舉例的研究貨幣供應量的關係(Money Supply Growth)對通貨膨脹率(Inflation Rate)的影響。觀測值可以用散點圖直觀地用圖形表示出來

(2)回歸係數(Regression Coefficient):b0,b1,這是要求解的回歸方程的參數。有了b0,b1,就有了兩個變量之前的線性回歸方程。

為了計算回歸係數,引入了協方差Cov(X,Y)和方差Var(X)的概念。這些知識都是大學學過的,CPA考試也有涉及,所以還能學得通。

考綱裡有一條,要解釋回歸係數,我理解這是初中數學的內容了,那就是X變動1個單位,Y對應變動b1個單位。

以教材上的例子來說,得到的回歸方程為:通貨膨脹率=-0.0008+0.3339*長期貨幣供應增長率,那就意味著某個國家的長期貨幣供應增長率如果預測的長期貨幣供應增長率為0,則這個國家的預期通貨膨脹率-0.08個百分點,長期貨幣供應增長率每增加1個百分點,比如從3%增長到4%,那麼預測的通貨膨脹率增加0.3339個百分點。

(3)誤差項(error term):ε。這是當得出回歸方程後,用回歸方程計算出來的預測值(Predict Value)與實際的觀測值(Actual Value)之間的差。我理解的誤差項的存在, 主要是為了驗證回歸方程的準確性,誤差項的方差越大,說明預測與實際的偏差越大,預測的準確度較低。誤差項的方差越小,說明預測與實際的偏差越小,預測的準確度越高。

3.線性回歸的假設

教材上一共列了6個假設,我沒有學得特別明白,我的理解就是為了推導出線性回歸方程,以下條件必須滿足,否則就算不出上述的線性回歸方程,或者即使算出來線性回歸方程了,回歸的可靠性也很差。假設準備死記硬背了

有以下6點:

(1)Y,X在參數b0,b1下呈線性關係,

(2)X不是隨機變量

(3)誤差項的期望值為0,E(ε) = 0

(4)同方差性,誤差項的方差=樣本方差。

(5)誤差項獨立不相關,因此誤差項乘積的期望值=0,

(6)誤差項服從期望值為0,同方差的正態分布。

Excel模型

教材上的案例被我整理為Excel模型了,有需要的可以後臺回復"CFA模型」,後面的學習中,如有有新的模型,也會繼續做。

回歸分析的實務案例:

市銷率(PS)和毛利率有什麼關係?excel畫散點圖就知道了

今天下雪了,放一張雪景吧。

相關焦點

  • CFA level2 量化分析 簡單線性回歸介紹 R4
    這章是簡單的線性回歸,包含兩個變量,一個自變量和一個因變量。要能夠建立簡單的線性回歸模型,並解釋其成立的假設和所存在的局限性。然後,就是要會使用模型和給定的自變量去預測因變量,還要理解ANOVA表和檢驗回歸的顯著性水平。很大一部分都是中學數學的內容,用一堆數,得到一個一元一次方程後,再給出一個新的x,帶進去計算y,不同的是加了顯著性水平等。
  • CFA二級:線性回歸假設的違反,識別與處理「量化方法分析」
    CFA二級量化方法重點分析:線性回歸假設的違反,識別與處理   高頓財經CFA講師  Quine老師   線性回歸分析的有效性依賴於若干假設,這些假設包括:
  • 6.數據分析(1) --描述性統計量和線性回歸(2)
    (1) --描述性統計量和線性回歸(1)前言:在針對非物理信號分析的時候,例如用戶數、用戶經常出入的地點、疾病感染人數等,這部分涉及到數據分析知識,本文分享一下Matlab常用的描述性統計量函數和線性回歸的基本應用。
  • 範例分析:一元(簡單線性)相關與回歸分析
    (簡單線性)相關分析與回歸分析;回歸參數的區間估計;一元(簡單線性)回歸方程的假設檢驗;今篇用例題將上面的內容串聯起來,講述簡單線性(一元)相關與回歸分析的完整過程。因為要分析的是產量對單位成本的影響,所以,將產量作為自變量,單位成本作為因變量(回顧:一元(簡單線性)相關分析與回歸分析)。
  • 多元線性回歸的模型解釋、假設檢驗、特徵選擇
    線性回歸是最流行和討論最多的模型之一,它無疑是深入機器學習(ML)的入門之路。這種簡單、直接的建模方法值得學習,這是進入ML的第一步。在繼續討論之前,讓我們回顧一下線性回歸可以大致分為兩類。簡單線性回歸:當只有一個輸入變量時,它是線性回歸最簡單的形式。
  • 線性回歸分析淺談
    這種方法常用於校準(calibration),常見的例子如製備一系列已知不同濃度的標準品溶液並測試其響應值(如吸光度),然後用線性回歸分析求得校準曲線方程(等一等,有童鞋可能會說,分析化學書上早就講了分子吸收光度與濃度成線性關係,還有必要再囉嗦嘛。很抱歉,理想很豐滿,但現實很骨感,真實情況有時會偏離理想很遠)。
  • 線性回歸(2)—— 模型評估
    當然,對於方差分析來講,分析變量一般都是連續型資料,而分組變量一般都是分類資料。我們再回過頭看一下線性回歸的形式,也應該發現,最簡單的線性回歸也是兩個變量,一個是因變量,一個是自變量。比如體重對肺活量的影響。對於線性回歸來講,自變量和因變量都是連續型資料。
  • 線性回歸:簡單線性回歸詳解
    【導讀】本文是一篇專門介紹線性回歸的技術文章,討論了機器學習中線性回歸的技術細節。線性回歸核心思想是獲得最能夠擬合數據的直線。
  • R數據分析:一般線性回歸的做法和解釋
    在R語言中我們可以非常方便地用基礎包中的lm方法做出線性回歸。參數的書寫也和數學方程一樣一樣的Y~X+X2,只不過將等號換成了~。我們用summary+回歸對象就可以得到回歸結果,如果要看模型的殘差直接$resid就可以。還是給大家寫一個活生生的例子吧:實例描述:我們有如圖的數據集,我想要用回歸分析做month, spend對sales的關係。
  • 線性回歸假設檢驗 - CSDN
    中)但是並非全都是線性回歸>>> get_lr_stats(x1_in, y1_in, lrg1)一元線性回歸方程為: y=3.000090909090906 + 0.5000909090909094*x相關係數(R^2): 0.6665424595087752;回歸分析(SSR): 27.51000090909094
  • python數據分析--回歸函數及線性回歸分析
    1.常見的回歸函數2.工具數據分析有很多成熟的工具可以使用,如R、python、此處我們選用python進行分析。首先,我們需要安裝並導入python數據分析常用的庫。__version__)3.線性回歸分析Y= aX + b + e ,e表示殘差。
  • 入門機器學習之線性回歸
    回歸分析按照涉及的變量的多少,分為一元回歸和多元回歸分析;按照因變量的多少,可分為簡單回歸分析和多重回歸分析;按照自變量和因變量之間的關係類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個自變量和一個因變量,且二者的關係可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量,且自變量之間存在線性相關,則稱為多重線性回歸分析。
  • 一元線性回歸分析的基本流程
    回歸分析能夠刻畫響應變量和解釋變量之間的因果關係。根據解釋變量的多少,可將回歸分析分為一元線性回歸和多元線性回歸。
  • 線性回歸分析詳解10(完結篇):線性回歸分析預測的十大步驟
    許栩原創專欄《從入門到高手:線性回歸分析詳解》第10章,這是本專欄的最後一章,是專欄的完結篇:用線性回歸分析做預測,多元線性回歸分析預測的十大步驟。線性回歸分析專格欄總目錄請見上圖,前9章,我分別講述了回歸分析及與回分析相關的概念,一元、多元線性回歸分析的公式與計算方法,以及多重共線性、回歸方程的精度、顯著性驗證和置信區間等進行回歸分析的重要步驟及其計算方法。至此,以回歸分析進行需求預測的各項知識點及各項準備工作全部完成,我們可以正式的以回歸分析進行需求預測。
  • 高中數學《4.3.1 一元線性回歸模型》微課精講+知識點+教案課件+習題
    A.回歸分析B.相關分析C.假設分析D.散點圖2.在回歸分析中,( )可以用描述因變量如何依賴自變量和誤差項的方程來表示。A.樣本回歸線B.回歸模型C.估計方程D.經驗方程3.A.分析回歸係數的經濟含義是否合理B.分析變量之間相關的方向C.分析估計的模型對數據的擬合效果如何D.分析變量之間相關的程度E.對模型進行假設檢驗 課件:
  • 回歸系列(五)|線性回歸分析做完後,還應考慮什麼?
    回歸是相關不是因果多重線性回歸,一般是指有多個自變量X,只有一個因變量Y。前面我們主要是以簡單線性回歸為例在介紹,兩者的差距主要在於自變量X的數量,在只有一個X時,就稱簡單線性回歸。前面我們主要是以簡單線性回歸為例在介紹,兩者的差距主要在於自變量X的數量,在只有一個X時,就稱簡單線性回歸。回歸分析有時候之所以不能揭示因果,除了上面談到的遺漏變量效應和反向因果外,某些假設條件的違反也會導致回歸的結果不準。所以,我們要牢記做完回歸併不意味著萬事大吉,進行必要的診斷性分析十分必要。
  • 線性回歸-如何對數據進行回歸分析
    2,線性回歸模型如果將上面方程組中的任意一個表達式單拿出來,那麼 x 和 y 都是一種線性關係,比如:該表達式中,我們將 x 叫做自變量,yx2目標y011.41-1-0.482813.2我們知道線性回歸的公式為:那麼上面表格的數據轉化為方程組:b0 + b1⋅0 + b2⋅1 = 1.4b0 + b1⋅1 - b2⋅1 = −0.48b0 + b1⋅2 + b2⋅8 = 13.2那麼矩陣 X 為:
  • 相關和回歸—SPSS多重線性回歸
    定義模型(確定研究問題、定義變量)⇒適用條件檢驗假設⇒自變量篩選⇒模型和偏回歸係數假設檢驗⇒殘差分析⇒強影響點、高槓桿值和離群點判斷⇒多重共線診斷⇒結論,具體可以查看下面兩個教程,講的比較仔細。關於線性回歸模型的應用條件在前面已經學習:(1)自變量與因變量存在線性關係;(2)殘差滿足正態性、方差齊性和獨立性;(3)自變量之間獨立,不存在共線性,且無高槓桿值、強影響點;(4)因變量為隨機變量,自變量固定變量;(5)各觀測值之間相互獨立。
  • 應用sklearn工具做線性回歸分析
    具體而言,回歸分析所要解決的問題主要有:(1)確定因變量與自變量之間的回歸模型,並依據樣本觀測值對回歸模型中的參數進行估計,給出回歸方程。(2)對回歸方程中的參數和方程本身進行顯著性檢驗。(3)評價自變量對因變量的貢獻並對其重要性進行判別。
  • 一文看懂線性回歸及相關概念
    最近剛好在看線性回歸,於是想分享下最近的學習心得。首先申明,此文只講大致的理解思路,力求以簡單通俗的方式來表達,因此不適合對數據分析有一定造詣的人士閱讀。同時鑑於本人也是小白,若有錯誤歡迎指正。而R方是用來檢驗線性回歸的擬合程度的,擬合程度越好,則R方越接近於1。那什麼是線性回歸,什麼又叫擬合程度呢?二、一元線性回歸作為初中(或是小學)的知識點,線性方程大家肯定都很熟悉。y=kx+b就是最早接觸到的一元線性回歸方程式。