barra模型 - CSDN

2020-11-30 CSDN技術社區

一、CAPM模型

1.1 模型

CAPM(Capital Asset Pricing Model),資本資產定價模型。模型形式為

其中  代表股票 n 的收益率;  代表市場組合的收益率,在實踐中可以用大盤收益率代替;  代表無風險收益率,實踐中可以用國債收益率代替; 代表隨機因素

1.2 模型求解

顯然,估計式中的  需要回歸,那麼是在時序上回歸還是在截面上回歸呢?

考慮截面回歸,也就是等式左邊是用某一天所有股票的   ,右邊是某一天的大盤收益率。但是某一天的大盤收益率是一個常數!這意味著拿一個變量與一個常量作回歸,沒有意義,因此應當是在時序上回歸

時序回歸,也就是等式左邊是用某一支股票在過去一段時間內(比如一年)每一天的   ,等式右邊是大盤在同一時期每一天的  ,這樣就避免了與常量回歸的問題

究其本質,只能在時序上回歸的原因是  對截面上的所有股票是一樣的,因此只能在時序上回歸

1.3 模型意義

翻譯一下模型:股票收益率只與大盤收益率相關,這種關係是線性的

很顯然,如果 CAPM 模型是正確的,那麼意味著選股是沒有意義的——因為股票收益率只與大盤收益率相關,在截面上大盤收益率對所有股票是相同的,股票在截面上的收益率差異完全是由隨機因素決定的。這顯然與實踐中觀察到的情況不符

1.4 誤區

首先,模型中是沒有截距項(alpha)的!

其次,CAPM 模型在實踐上並不正確!更不能作為炒股的指導!

再次,CAPM 模型的偉大之處在於其理論意義,也就是在滿足一系列嚴苛的模型假設後,CAPM 模型是正確的。或者說,CAPM 模型是理想市場環境下股市應有的樣子

二、Fama-French 三因子模型

1.1 模型

Fama-French 三因子模型,模型形式為

其中  代表股票 n 的收益率;  代表市場組合的收益率,在實踐中可以用大盤收益率代替;  代表無風險收益率,實踐中可以用國債收益率代替; 代表隨機因素;SMB(small minus big) 代表規模風險溢價(size premium),HML(high minus low)代表價值風險溢價(value premium);截距  代表定價錯誤(pricing error),如果模型正確這項應與 0 無顯著差異

SMB 跟 HML 的計算方式:

先根據流通市值將股票分為 1:1的大市值(B)和小市值(S)股票;根據帳面市值比數據將股票分為3:4:3的高中低(H/M/L)三組;這樣我們就有了2×3共計6種投資組合(SL/SM/SH/BL/BM/BH)。然後我們通過市值加權平均的方式求得各組的收益率,最後就是求SMB和HML了:

其本質是,SMB :流通市值佔後 50% 的小市值股票加權平均收益率 - 流通市值佔前 50% 的大市值股票加權平均收益率

HML:流通市值佔前 30% 的高價值股票加權平均收益率 - 流通市值佔後 30% 的高價值股票加權平均收益率

1.2 模型求解

像 CAPM 模型一樣,Fama-French 三因子模型是在時序上回歸

1.3 模型意義

翻譯一下模型:股票收益率只與大盤收益率、市值、市淨率相關

相對於 CAPM 模型,Fama-French 三因子模型加入了市值、市淨率兩個新的因子,分別代表規模跟價值,這是在實踐中廣泛認同的兩個因子,因此在實踐中比 CAPM 模型的效果要好

但是其因子的構造過程(強行構造兩個資產組合)在理論上缺乏依據

1.4 誤區

首先,對於價值因子,有些資料上寫的是帳面市值比,有些資料上寫的是市淨率。其實帳面市值比與市淨率互為倒數

其次,劃分股票時是以流通市值為依據的!不是以公司個數為依據的!

再次,計算平均收益率時是以流通市值為權重的!不是簡單平均!

三、Barra 模型

1.1 模型

Barra 模型,模型形式為

其中  代表股票 n 的收益率;  代表無風險收益率,實踐中可以用國債收益率代替; 代表特異性收益率(specific return); 代表國家因子收益率; 到  代表 P 個行業因子收益率; 到 ​​​​​​​ 代表 Q 個風格因子收益率;對應的 X 代表因子暴露

所有股票在國家因子上的暴露均為1;如果股票屬於行業  ,則  ,其餘行業因子暴露為 0

1.2 模型求解

Barra 模型的求解是在截面上進行的,也就是已知因子暴露求因子收益率

那麼因子暴露是什麼呢?Barra 模型與 Fama-French 模型不同,它沒有人為構造一個資產組合,而是直接把標準化後的變量值作為因子暴露。比如風格因子 S1 是市盈率,那麼股票在市盈率上的暴露就是股票本身的市盈率的標準化

將上述模型寫成矩陣形式:

注意到,國家因子與行業因子之間存在完全共線性,即 ,所以需要對矩陣 X 加一個約束,即:

,其中  代表行業 i 的流通市值。這個約束的意義是:行業因子收益率的市值加權為 0

將此式代入後可以消掉 ,解決完全共線性的問題

在這個回歸求解中,還涉及到異方差的問題,即  的方差互不相同。實踐中認為  的方差與  成正比,因此最終進行的是加權最小二乘,權重是 

對上述帶約束的方程求取加權最小二乘,可以解得因子收益率向量

1.3 模型意義

Barra 模型是一個典型的多因子模型。其創新點有四

一是引入了國家因子,並解決了國家因子與行業因子的多重共線性問題。宏觀經濟因子全部被國家因子所代表,經濟周期則被行業因子所代表

二是使用的是加權最小二乘,解決了回歸中的異方差問題

三是直接使用標準化後的變量值作為因子暴露,而非人為構造資產組合,這種模型更加自然

四是標準化可以使得因子暴露的方差為 1,所以求出的因子收益率是可以比較的

1.4 誤區

首先,風格因子中不應該有  這種在截面上對於所有股票都相同的因子——這些因子都被涵蓋在國家因子中了

其次,前二個模型均是當期與當期數據的回歸,barra 模型中的 X 是上一期的,而 r是當期的,也就是因變量與自變量之間隔了一期

再次,barra 模型不是用於預測股票收益率的!雖然 barra 模型中的 X 是上一期的,而 r是當期的,看似可以用來預測股票收益率,但是求出的因子收益率向量f也是上一期的,預測股票收益率必須假設因子收益率向量 f在時序上平穩,而這與實踐不符

那麼 barra 模型是用來作什麼的呢?答案是用來探究因子的性質的。在每個截面上都可以求得一個因子收益率 f,這樣就有了每個因子的收益率序列,可以從中篩選出穩定的因子,也可以探究因子之間的相關性,進而探究股票之間的相關性,起到降維的作用

相關焦點

  • IEEE論文:城市大腦,基於網際網路大腦模型的智慧城市建設
    [導讀]基於網際網路大腦模型與智慧城市建設的結合,2015年2月在csdn第一次發布文章
  • 回歸模型怎麼做 - CSDN
    具體操作可以參照李子奈的說法:ADF檢驗是通過三個模型來完成,首先從含有截距和趨勢項的模型開始,再檢驗只含截距項的模型,最後檢驗二者都不含的模型。並且認為,只有三個模型的檢驗結果都不能拒絕原假設時,我們才認為時間序列是非平穩的,而只要其中有一個模型的檢驗結果拒絕了零假設,就可認為時間序列是平穩的。
  • [PRML]線性分類模型--概率判別模型
    在統計學術語中,這種模型稱為邏輯回歸,但應強調這是一種分類模型,而不是回歸模型。但並不是所有的類條件密度的選擇都能產生簡單形式的後驗概率(例如如果使用高斯混合模型來對類條件密度建模)。這表明,其他類型的判別概率模型值得探索。
  • 廣義差分模型 - CSDN
    ,原因3數據處理造成的相關,12,原因4蛛網現象13,如果模型中省略了某些重要的解釋變量或者模型函數形式不正確,都會產生系統誤差,這種誤差存在於隨機誤差項中,從而帶來了自相關。由於該現象是由於設定失誤造成的自相關,因此,也稱其為虛假自相關。
  • r語言 動態面板模型 - CSDN
    模型選擇一般有三種形式 (1)無個體影響的不變係數模型(混合估計模型):ai=aj=a,bi=bj=b 即模型在橫截面上無個體影響、無結構變化,可將模型簡單地視為是橫截面數據堆積的模型。這種模型與一般的回歸模型無本質區別,只要隨機擾動項服從經典基本假設條件,就可以採用OLS法進行估計(共有k+1個參數需要估計),該模型也被稱為聯合回歸模型(pooled regression model)。
  • 回歸模型擬合優度檢驗 - CSDN
    在依賴模型得出結論或預測未來結果之前,我們應儘可能檢查我們假設的模型是否正確指定。也就是說,數據不會與模型所做的假設衝突。對於二元結果,邏輯回歸是最流行的建模方法。在這篇文章中,我們將看一下 Hosmer-Lemeshow邏輯回歸的擬合優度檢驗。
  • 動力學規律_正向動力學 逆動力學 - CSDN
    在了解高級的車輛控制算法之前,掌握車輛運動模型是非常有必要的。車輛運動模型就是一類能夠描述我們的車輛的運動規律的模型。顯然,越複雜的模型就越接近現實中的車輛運動規律,本節我們一起了解一下兩個廣泛使用的車輛模型——運動學自行車模型(Kinematic Bicycle Model) 和 動力學自行車模型(Dynamic Bicycle Model)原創不易,轉載請註明出處:http://blog.csdn.net
  • kappa一致性檢驗教程 - CSDN
    一、基礎知識在數據分析或臨床工作中,我們會經常遇到檢驗一致性的問題,如判斷不同模型或者診斷方法在預測結果上是否具有一致性,如模型預測的結果與實際結果是否具有一致性,又如兩名或多名醫生對同一病人的診斷結論是否一致
  • 財富二元模型_二元分類 - CSDN
    >StumbleUpon Evergreen大數據問題場景分析StumbleUpon是一個個性化的搜尋引擎,會按用戶的興趣和網頁評分等記錄推薦給你感興趣的網頁,有些網頁是暫時性的,比如新聞,這些文章可能只是在某一段時間會對讀者有意義,而有些則是長青的,讀者會對這些文章有長久興趣我們這節的目標就是利用決策樹二元分類機器學習,建立模型
  • 回歸模型eviews專題及常見問題 - CSDN
    來源 | 計量經濟學服務中心綜合整理轉載請聯繫一、Threshold Regression Estimation閾值回歸模型描述了一種簡單的非線性回歸模型。TR規範很受歡迎,因為它們很容易。估計和解釋,並能產生有趣的非線性和豐富的動力學。
  • R語言arma模型診斷_arma模型實現模型r語言 - CSDN
    #時間格式預處理library(xts)            #同上library(timeSeires)      #同上library(urca)           #進行單位根檢驗library(tseries)         #arma模型
  • 深度研究:回歸模型評價指標R2_score
    回歸模型的性能的評價指標主要有:RMSE(平方根誤差)、MAE(平均絕對誤差)、MSE(平均平方誤差)、R2_score。但是當量綱不同時,RMSE、MAE、MSE難以衡量模型效果好壞。這就需要用到R2_score,實際使用時,會遇到許多問題,今天我們深度研究一下。預備知識 搞清楚R2_score計算之前,我們還需要了解幾個統計學概念。
  • r中回歸結果怎麼判定模型好壞_lasso回歸 模型好壞 - CSDN
    故模型等式右邊是用X組成的函數去描述Y的均值,即模型是在平均的意義下去描述自變量與因變量間的關係,所以在解讀模型的時候,我不會將模型說死。       模型中不同形式的m(X)會幻化為不同的模型體系,一般可以將模型分為兩大類:m(X)可以幻化為數學公式,即公式模型,一般比較成熟的都是公式模型,例如回歸模型的理論與底蘊就比較完善,模型的假定都是可以進行檢驗的;
  • 大規模主題模型:對Spark LDA算法的改進
    這些問題都能夠被話題模型所解答,它是分析文檔集所涵蓋話題類別的一種技術。本文將要討論Spark 1.4和1.5使用強大的隱含狄利克雷分布 (Latent Dirichlet Allocation,LDA)算法對話題模型的性能提升。
  • 值 多元線性回歸模型專題及常見問題 - CSDN
    多元線性回歸模型通常用來研究一個應變量依賴多個自變量的變化關係,如果二者的以來關係可以用線性形式來刻畫,則可以建立多元線性模型來進行分析。1.模型簡介1.1模型的結構多元線性回歸模型通常用來描述變量y和x之間的隨機線性關係,即:
  • r語言 多元回歸模型_r語言多元回歸模型殘差分析 - CSDN
    1、多元線性回歸模型1.1多元回歸模型與多元回歸方程設因變量為y,k個自變量分別為,描述因變量y如何依賴於自變量和誤差項ε的方程稱為多元回歸模型。其一般形式可表示為:式中,為模型的參數,ε為隨機誤差項。
  • OLS估計Logit模型參數
    LDM 模型來源於 LPM 和 logit 模型的轉換。首先,LDM 可以轉換為一個 logit 模型,其次,線性概率模型 (LPM) 的參數估計能夠轉換為「第一步轉換後的 Logit 模型」參數的極大似然估計。
  • r語言一元回歸模型專題及常見問題 - CSDN
    計算模型的參數k和b(1)估算參數k和b的典型值(k<-cov(cost,sales)/cov(cost,cost))#模型參數k(b<-mean(sales)-k*mean(cost))        #模型參數b也可使用回歸方程建立函數lm來計算。
  • 加性注意力機制 - CSDN
    在神經網絡學習中,一般而言模型的參數越多則模型的表達能力越強,模型所存儲的信息量也越大,但這會帶來信息過載的問題。那麼通過引入注意力機制,在眾多的輸入信息中聚焦於對當前任務更為關鍵的信息,降低對其他信息的關注度,甚至過濾掉無關信息,就可以解決信息過載問題,並提高任務處理的效率和準確性。
  • spss多元線性回歸模型專題及常見問題 - CSDN
    點擊「分析」——回歸——線性——進入如下圖所示的界面: 在「回歸係數」下面勾選「估計,在右側勾選」模型擬合度「 和」共線性診斷「 兩個選項,再勾選「個案診斷」再點擊「離群值」一般默認值為「3」,(設定異常值的依據,只有當殘差超過3倍標準差的觀測才會被當做異常值) 點擊繼續。