發布時間:2019年11月05日
研究員:林曉明 S0570516010001/李聰 S0570519080001/劉志成 S0570518080005
核心觀點
本文分別基於模擬數據和真實數據實證了不同協方差估計方法的表現
投資者通常採用樣本協方差作為對真實協方差矩陣的估計,該方法需要估計的參數眾多,誤差較大,為此學者們提出了包括稀疏矩陣、因子模型、壓縮估計在內的一系列改進算法。本文正是要討論各類協方差估計方法的優劣及適用場景,主要內容包括:1、採用一套統一、透明的評價體系來評估各個算法的估計效果,保證結果的可比性;2、基於模擬數據驗證各類算法能否達到其理論設計目標;3、基於大類資產、一級行業、股票的真實交易數據驗證各類複雜協方差估計方法相比於樣本協方差的改善程度,並針對不同配置場景(大類資產、行業、股票)提供實操建議。
樣本協方差是真實協方差的漸進無偏估計,但觀測樣本較少時估計誤差大
多元正態分布假設下,樣本協方差是真實協方差矩陣的漸進、無偏估計量,當觀測樣本足夠長時,樣本協方差會收斂到真實協方差矩陣;只有當觀測長度相比於資產維度不夠時,才需要引入複雜協方差估計方法。實證結果表明,當/ < 0.1時,樣本協方差已經是一個較為精確的估計量,引入複雜協方差估計方法帶來的增益有限;當0.1 < / < 1時,複雜協方差估計方法會體現出一定的改善,而且這種改善會隨著/比提升而愈發明顯;當/ > 1時,樣本協方差矩陣不滿秩,無法在真實場景中應用,而因子模型、壓縮估計等複雜方法仍能保證協方差估計量的正定性,適用範圍更廣。
稀疏矩陣方法假定協方差矩陣具有稀疏結構,在真實應用中適用性不足
稀疏矩陣方法假定協方差矩陣具有稀疏結構,也即協方差矩陣的非對角元素中大部分為零,這樣可以大幅減少需要估計的參數個數,從而降低整體估計誤差。實證結果表明,稀疏假設在真實應用中過於強烈,尤其是行業和個股場景,各資產波動水平相仿,協方差矩陣各元素大小是可比的。所以該方法的適用範圍相對受限,只有在/較大時相比於樣本協方差有一定的改善,而且這種改善主要是因為樣本協方差的估計誤差較大,並非稀疏估計量本身有多精確。
因子模型假定協方差具有條件稀疏結構,在行業和股票配置中改善顯著
因子模型假定資產收益率可由某些共同的底層因子驅動,不能被因子解釋的部分稱為殘差收益率,那麼對資產收益率協方差的估計可以分解成對因子收益率協方差和殘差收益率協方差的估計。其中,因子數量遠小於股票數量,而殘差協方差又可以加以適當的簡化(比如稀疏化,甚至是對角陣),兩者相結合大幅減少了需要估計的參數個數,提升了估計精度。本文實證了因子模型中典型的POET算法,結果表明,該類算法在大類資產場景下使用相對受限,因為大類資產間較難找到顯著的共性驅動因素,而行業和個股場景下,市場的漲跌本就是最大的解釋變量,所以該算法改善明顯。
壓縮算法在大類資產、行業、股票配置場景下均改善明顯,適用性較廣
壓縮算法採用貝葉斯估計的思路,將樣本協方差(基於觀測樣本的後驗估計)向特定結構的目標協方差矩陣(基於主觀判斷、歷史經驗構建的先驗估計)壓縮。其中,樣本協方差矩陣是無偏估計,但是參數眾多,估計誤差較大;而目標協方差具有更簡潔的結構,雖然帶有設定偏差,但需要估計的參數較少,因而估計誤差較小,壓縮估計的目的就是在先驗設定偏差和後驗估計誤差間達到平衡。本文實證了三類經典的線性壓縮算法和一種非線性壓縮算法,結果表明,在大類資產、行業、股票配置場景下,壓縮估計相比於樣本協方差都有顯著改善,適用性較廣。
風險提示:模型根據歷史規律總結,歷史規律可能失效。報告中涉及到的具體資產、股票不代表任何投資意見,請投資者謹慎、理性地看待。
本文首發於微信公眾號:華泰證券(601688,股吧)研究所。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
(責任編輯:王治強 HF013)