【華泰金工林曉明團隊】不同協方差估計方法對比分析

2021-01-09 和訊股票

  發布時間:2019年11月05日

  研究員:林曉明 S0570516010001/李聰 S0570519080001/劉志成 S0570518080005

  核心觀點

  本文分別基於模擬數據和真實數據實證了不同協方差估計方法的表現

  投資者通常採用樣本協方差作為對真實協方差矩陣的估計,該方法需要估計的參數眾多,誤差較大,為此學者們提出了包括稀疏矩陣、因子模型、壓縮估計在內的一系列改進算法。本文正是要討論各類協方差估計方法的優劣及適用場景,主要內容包括:1、採用一套統一、透明的評價體系來評估各個算法的估計效果,保證結果的可比性;2、基於模擬數據驗證各類算法能否達到其理論設計目標;3、基於大類資產、一級行業、股票的真實交易數據驗證各類複雜協方差估計方法相比於樣本協方差的改善程度,並針對不同配置場景(大類資產、行業、股票)提供實操建議。

  樣本協方差是真實協方差的漸進無偏估計,但觀測樣本較少時估計誤差大

  多元正態分布假設下,樣本協方差是真實協方差矩陣的漸進、無偏估計量,當觀測樣本足夠長時,樣本協方差會收斂到真實協方差矩陣;只有當觀測長度相比於資產維度不夠時,才需要引入複雜協方差估計方法。實證結果表明,當/ < 0.1時,樣本協方差已經是一個較為精確的估計量,引入複雜協方差估計方法帶來的增益有限;當0.1 < / < 1時,複雜協方差估計方法會體現出一定的改善,而且這種改善會隨著/比提升而愈發明顯;當/ > 1時,樣本協方差矩陣不滿秩,無法在真實場景中應用,而因子模型、壓縮估計等複雜方法仍能保證協方差估計量的正定性,適用範圍更廣。

  稀疏矩陣方法假定協方差矩陣具有稀疏結構,在真實應用中適用性不足

  稀疏矩陣方法假定協方差矩陣具有稀疏結構,也即協方差矩陣的非對角元素中大部分為零,這樣可以大幅減少需要估計的參數個數,從而降低整體估計誤差。實證結果表明,稀疏假設在真實應用中過於強烈,尤其是行業和個股場景,各資產波動水平相仿,協方差矩陣各元素大小是可比的。所以該方法的適用範圍相對受限,只有在/較大時相比於樣本協方差有一定的改善,而且這種改善主要是因為樣本協方差的估計誤差較大,並非稀疏估計量本身有多精確。

  因子模型假定協方差具有條件稀疏結構,在行業和股票配置中改善顯著

  因子模型假定資產收益率可由某些共同的底層因子驅動,不能被因子解釋的部分稱為殘差收益率,那麼對資產收益率協方差的估計可以分解成對因子收益率協方差和殘差收益率協方差的估計。其中,因子數量遠小於股票數量,而殘差協方差又可以加以適當的簡化(比如稀疏化,甚至是對角陣),兩者相結合大幅減少了需要估計的參數個數,提升了估計精度。本文實證了因子模型中典型的POET算法,結果表明,該類算法在大類資產場景下使用相對受限,因為大類資產間較難找到顯著的共性驅動因素,而行業和個股場景下,市場的漲跌本就是最大的解釋變量,所以該算法改善明顯。

  壓縮算法在大類資產、行業、股票配置場景下均改善明顯,適用性較廣

  壓縮算法採用貝葉斯估計的思路,將樣本協方差(基於觀測樣本的後驗估計)向特定結構的目標協方差矩陣(基於主觀判斷、歷史經驗構建的先驗估計)壓縮。其中,樣本協方差矩陣是無偏估計,但是參數眾多,估計誤差較大;而目標協方差具有更簡潔的結構,雖然帶有設定偏差,但需要估計的參數較少,因而估計誤差較小,壓縮估計的目的就是在先驗設定偏差和後驗估計誤差間達到平衡。本文實證了三類經典的線性壓縮算法和一種非線性壓縮算法,結果表明,在大類資產、行業、股票配置場景下,壓縮估計相比於樣本協方差都有顯著改善,適用性較廣。

  風險提示:模型根據歷史規律總結,歷史規律可能失效。報告中涉及到的具體資產、股票不代表任何投資意見,請投資者謹慎、理性地看待。

本文首發於微信公眾號:華泰證券(601688,股吧)研究所。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。

(責任編輯:王治強 HF013)

相關焦點

  • spss協方差分析
    什麼是協方差分析?協方差分析又稱「共變量分析」,是方差分析的引申和擴大。基本原理是將線性回歸與方差分析結合起來,調整各組平均數和 F 檢驗的實驗誤差項,檢驗兩個或多個調整平均數有無顯著差異,以便控制在實驗中影響實驗效應(因變量)而無法人為控制的協變量(與因變量有密切回歸關係的變量)在方差分析中的影響。好吧,聽不懂。簡單舉個例子來說:有一項研究,想知道男生和女生在跑步後的心率是否有差異。
  • 方差分析
    方法就是本次文章要介紹的方差分析。方差分析的前提不過方差分析不是隨隨便便就能用的,至少要滿足以下幾個條件:方差分析的基本思想引起觀測值不同(波動)的原因主要有兩類:一類是實驗過程中隨機因素的幹擾或觀測誤差引起的不可控制的波動;另一類是由於試驗中處理方式不同或試驗條件不同引起的可以控制的波動。即
  • SPSS統計:單因素方差分析與單變量方差分析
    這兩種方法既有區別又有聯繫,在統計學中,這兩種分析方法統稱為方差分析,在spss中由於線性模型的引入,才有所區分,那麼這兩種分析方法在具體應用中有什麼樣的區別和聯繫?二者的適用情況是什麼?分析結果有何異同?下面將進行詳細介紹。
  • r做方差分析 - CSDN
    方差分析可以用來推斷一個或多個因素在其狀態變化時,其因素水平或交互作用是否會對實驗指標產生顯著影響。主要分為單因素方差分析、多因素無重複方差分析和多因素重複方差分析。做方差分析首先必須滿足獨立,正態檢驗,方差齊性檢驗。
  • 【影響因素研究】相關分析+回歸分析+方差分析+因子分析
    方差分析是特殊情形的回歸分析,是回歸分析的特例。方差分析就是解釋變量全為分組的dummy的回歸分析。所以方差分析可以用於分析影響因素,是一種很重要的定量分析方法。方差分析(Analysis of variance,簡稱ANOVA)為資料分析中常見的統計模型。
  • 方差檢驗專題及常見問題 - CSDN
    方差分析方差分析,就是對多個平均數進行比較的一種統計方法,又稱變異數分析,其主要功能在於分析實驗數據中不同來源的變異對總變異的貢獻大小,從而確定實驗中的自變量是否對因變量有重要影響。 它與實驗設計緊密相聯,實驗設計不同,方差分析的方法也有所不同。1. 1方差分析的三條假設:• 總體分布的正態性。方差分析要求樣本必須來自正態分布的總體。
  • 兩因素方差分析怎麼理解?
    文章來源: 丁點幫你作者:丁點helper看完單因素方差分析,一般的統計學中並不會直接講two-way(雙因素)方差分析,而是講「隨機區組設計的方差分析」,那這兩者有什麼關係嗎?從統計方法的角度來看,隨機區組設計的方差分析其實就屬於兩因素(或多因素)方差分析,一種說法認為,為什麼不直接叫兩因素,是因為不把「區組因素」算作一類真正的「因素」,而重點研究隨機分組因素。我們認為,實際稱雙因素方差分析可能更好理解。不過這裡稱作「隨機區組設計」,也是有其他特別的考慮。
  • 統計學最常用的「數據分析方法」清單(一)
    一、描述統計  描述統計是通過圖表或數學方法,對數據資料進行整理、分析,並對數據的分布狀態、數字特徵和隨機變量之間關係進行估計和描述的方法。描述統計分為集中趨勢分析和離中趨勢分析和相關分析三大部分。  1. 集中趨勢分析  集中趨勢分析主要靠平均數、中數、眾數等統計指標來表示數據的集中趨勢。
  • 精益六西格瑪管理-假設檢驗-單因子方差分析
    這類問題可以用方差分析的方法來解決。為了表述方便,這裡先給出在以後實驗設計中經常會遇到的幾個概念因子對指標有影響的因素稱為因子,通常情況下,我們約定用大寫字母來表示因子。在不同水平下的方差相等,即σ1^2=….=σr^2=σ^2,只要諸實驗是在相同條件下進行,方差相等一般可以滿足。各數據yij相互獨立,這通常只把實驗次序隨機化即可得到滿足。
  • 使用R計算方差與標準差
    概述描述樣本值的離散程度,最常用的指標是方差和標準差,它們與前面所說的全距(極差)只使用了兩個極值情況不同,它們利用了樣本的全部信息去描述數據取值的分散性。計算方差的公式方差是各樣本相對均值的偏差平方和的平均。使用s2來表示,其公式如下:
  • SPSS——單因素方差分析
    單因素方差分析(one way anova),是一種較為常用的方差分析手段,主要目的是為了尋找多組數據總變異的真實來源,判斷總變異是來自於組內變異(Vin),還是來自於組間變異(Vbetween)。單因素方差分析的檢驗統計量F=Vbetween/Vin,表示組間變異與組內變異的比值。F值越大於1,說明各組數據之間的變異越大,組內變異越小,各組數據之間的差異也就越大。
  • 七種回歸分析方法,個個經典
    回歸分析也允許我們去比較那些衡量不同尺度的變量之間的相互影響,如價格變動與促銷活動數量之間聯繫。這些有利於幫助市場研究人員,數據分析人員以及數據科學家排除並估計出一組最佳的變量,用來構建預測模型。 我們有多少種回歸技術? 有各種各樣的回歸技術用於預測。
  • 一文帶你輕鬆掌握,重複測量方差分析
    在某些實驗研究中,常常需要考慮時間因素對實驗的影響,當需要對同一觀察單位在不同時間重複進行多次測量,每個樣本的測量數據之間存在相關性,因而不能簡單的使用方差分析進行研究,而需要使用重複測量方差分析。重複測量方差-SPSSAU重複測量方差分析時涉及兩個重要的術語名詞,分別是組內和組間。組內項表示同一對象被測試多次的標識項(如時間);組間項表示不同對象組別的標識項。案例中測量時間點稱之組內項;舊藥、新藥的不同組別稱為組間項。
  • spss完成單因素方差分析和T檢驗的簡單小例子
    單因素方差分析和T檢驗實用性:T檢驗應用於兩組之間的差異性分析;而單因素方差分析,應用於多組之間因單個因素的變化,分析組間的差異性。2)如果符合正態分布,不滿足方差齊性:可以採用不滿足方差齊性的檢驗方法,如塔姆黑尼檢驗方法等;關於非參數檢驗,這裡不做過多介紹,主要講如何做T檢驗和單因素方差分析。
  • 必考知識點,CFA一級數量分析-抽樣與估計
    這篇文章主要的內容為抽樣和估計,通過從總體中抽取樣本獲得樣本統計量進行分析,從而反推總體的參數,對其進行估計。引言現實生活中,特別是在金融領域,我們每分每秒都在形成大量的交易數據。我們如何通過這麼多的數據來評判整個全球市場的運行情況呢?近期頻上熱門的「熔斷」想必大家都聽說過吧。
  • 由方差分析到趨勢分析【薦】
    往期已經介紹過方差分析的相關內容。相信大家已經掌握了方差分析,但是這是遠遠不夠的。
  • 論文推薦 | ​林東方:均方誤差意義下的正則化參數二次優化方法
    正則化參數的選擇對於正則化方法至關重要,常用的正則化參數確定方法,從不同的分析角度提出,各具優勢,但均難以給出最優的正則化參數[23-24]。均方誤差意義下正則化參數的確定體現了估計精度與偏差的折中,理論依據更為直觀高效。
  • 重慶大學團隊特稿:區域電氣聯合系統全局靈敏度分析的新方法
    團隊介紹胡瀟雲,碩士研究生,2013年於重慶大學電氣工程學院獲學士學位,同年進入重慶大學電氣工程學院攻讀碩士學位,主要研究方向為綜合能源系統建模與分析。趙霞,博士,重慶大學副教授。其次,基於Sobol′方法的方差分析,建立電-氣聯合系統各輸入變量的全局靈敏度指標,以量化分析各輸入變量及其相互作用對系統輸出的影響。全局靈敏度指標一般可以通過蒙特卡羅模擬(MCS)進行計算,但MCS計算量大、計算時間長。
  • 重複測量數據的方差分析在SPSS中的應用——【杏花開醫學統計】
    因此,我們有必要將過程中的測量數據也納入研究,如了解測量指標的時間變化趨勢、不同時段的治療效果等。臨床上,我們將這種納入了時間效應的對同一受試對象的兩次及以上的觀測稱為重複測量的實驗設計。 本期,我們來具體介紹醫學重複測量數據的方差分析基本原理、適用範圍及其在SPSS中的具體操作。
  • 方差分析F檢驗結果如何解讀?
    方差分析的思想 方差分析從名字上看強調「方差」,實際上它分析的是「均值」是否相等,而不是「方差」是否相等。它的思想是將Y的總變異分解為系統誤差和隨機誤差。所以方差分析是通過對數據誤差來源的分析從而判斷不同總體的均值是否相等。