來源:中證指數
在數據存儲與分析技術快速發展的今天,數量化方法對投資領域的滲透超越歷史任何時期。大量的創新性方法被提出並得到應用,以數據和模型為核心的現代投資方法體系已見雛形。在組合風險預測領域,線性風險模型方法不斷在理論框架內升級完善,成為組合管理者所採用的風險預測主流方法。
在海外,風險模型方法被學術界和投資界廣泛研究和討論,並已形成相對完善與成熟的系統生態,而國內目前對合適的因子、參數與方法還未達成完全一致。本文旨在梳理風險模型理論和方法,並在A股市場進行驗證,以期對風險模型和相關投資策略做相應的解析和驗證。
一、風險模型方法的基本情況
一
風險模型方法的產生背景
風險模型的產生與投資者對投資的認知發展密不可分,是特定投資框架下的產物,並服務於該理論框架下的投資應用。投資理論對於收益與風險的認知發展是風險模型誕生的先決條件,所帶來的風險預測需求是推動風險模型產生的直接動力。
表1Risk Model方法重要時間表
Risk Model的出現並非偶然,是Markowitz、Sharpe等搭建的分析體系的必然需要。收益與風險被放置在組合構建的核心位置,性價比成為衡量投資組合是否優異的基礎指標,對未來風險的預測成為一個最為重要的問題。CAPM模型使投資者認識到證券收益與其所承受的特定風險相關聯,更衍生出多因子分析方法,研究驗證股票收益和風險可由少量共同因素所驅動和解釋,風險模型雛形初現。
二
RISK MODEL方法的應用場景
風險模型主要作用是提供證券的風險預測與業績歸因。在此過程中,風險模型需要對股票收益建立因子模型,對組合過去歷史的收益來源進行歸因,依據統計方法和經驗對股票未來風險形成推斷與預測。
圖1 Risk Model的主要應用場景
1、投資組合優化
組合優化是風險模型最核心的應用。在指數增強策略中,通常突出Alpha因子的同時,需要將跟蹤誤差鎖定在一定的範圍內,而這是風險模型最為擅長的部分。在主動量化策略中,如何最大化預期收益,減少不必要的風險暴露,實現收益風險最佳配比,同樣需要風險模型的組合優化功能。
2、組合業績歸因
風險預測主要面向未來,而組合業績歸因是面向過去。業績歸因在基金公司的運營、風險的監控存在集中應用。在基金評價和內控合規性要求愈加嚴格的背景下,業績歸因也將會是市場的重要需求領域。
二、RISK MODEL的理論架構和構建過程
一
RISK MODEL方法的理論基礎
Grinold和Kahn對風險模型做出了重要的貢獻,其風險模型的核心可以總結為三點:1)股票收益主要受少數幾個因子的驅動;2)股票收益與風險因子暴露之間的關係是線性的;3)因子風險特徵與特質風險特徵存在穩定性,可以根據歷史的特徵推測未來。
基於歷史的個股收益及因子暴露,通過線性回歸估計出歷史因子收益,利用統計方法預測出因子收益未來的協方差陣,用於投資組合未來風險的評估。
圖2Risk Model的基本思想
二
RISK MODEL方法的構建流程
借鑑部分市場機構的經驗,將RiskModel構建流程分為六步:因子選擇、數據預處理、因子暴露計算、因子收益估計、因子協方差預測及特質風險預測。每個步驟涉及諸多精細化處理,精確度和穩定性決定了整個模型建立的質量和高度。
1、因子選擇
選擇哪些因子來解釋收益,是構建風險模型的第一步,雖然可採用數量化的規則用於指導,但更多的是不斷通過模型更新和迭代修正。因子選擇的目標是通過少量風險因子實現絕大部分組合收益的解釋,以使個股特定性風險儘量少且不相關,模型儘量穩定。因此,解釋性、穩定性和直觀經濟金融邏輯是因子篩選的重要標準。
圖3 PB風險因子的時間序列相關性
2、數據預處理
數據預處理是整個模型最關鍵的環節之一,只有準確與完備的數據才能做出好的模型。對線性模型而言,異常值和缺失值的處理顯得極為重要。異常值可使模型偏離絕大多數的樣本,缺失值則會使部分股票難以得到估計。需要明確的是,有時候異常值並不一定是這個數據出現了錯誤,而是其存在會導致模型不穩定。
根據以往經驗,對異常值的處理一般可採用刪除或降低回歸權重的方法,刪除意味著不把該只股票的信息帶入模型的構建,降低回歸權重則意味著降低該只股票信息的重要性。
對缺失值的處理則會相對簡單一點,一般會認為其他指標十分相近的股票,也會具有相似的特定指標,有三種處理方式:一是基於其他指標估計相應缺失的指標;二是基於聚類的結果,使用相應類中的平均數或者中位數估計缺失的指標;三是刪除,一般不會這麼選擇,因為其將直接導致相應股票缺少風險估計。
3、因子暴露計算
風格因子暴露需要保證具有統一的量綱及相近的分布,而每個因子可由多個指標構成。
首先,計算每個指標的標準化分數,使其具有均值為0,標準差為1的數據特性。風險模型所有的風險衡量都以基準指數為基礎,基準指數的風險暴露需被設定為0。所以,在標準化所採用的均值是自由流通市值加權的均值。
其次,根據因子類內指標權重,加權得到因子數據,相應權重的設定是經濟金融邏輯判斷與模型迭代的結果。
最後,將計算得到的因子暴露數據進行標準化。因子暴露數據將會具有自由流通市值加權為0,標準差為1的性質。
對於行業因子暴露的數據處理則會採用離散型的方式。首先,確定使用行業分類,不同國家和市場往往適用的行業分類並不統一;其次,對於單行業經營的公司,其行業暴露即為1,對於跨行業經營的公司,將對多個行業進行暴露,並且和為1。
4、因子收益模型估計
明確因子暴露數據之後,最重要的環節是對整個模型的構建與估計,市場上使用的主流模型將個股收益劃分為市場收益、風格因子超額收益、行業超額收益及特質收益。
此外,因為不同規模股票對應的特質風險是明顯不同的,根據諸多海外文獻建議,特質風險與公司規模(總市值)平方根倒數成正比,在回歸時,個股的回歸權重經常會被設置為總市值平方根。
5、因子收益協方差陣預測
因子收益協方差陣估計是對因子收益風險未來的外延性預測。主要解決思路來自Menchero,Morozov和Shepard(2008)的方法,基本想法是:1)更接近的數據具有更高的信息價值;2)相關係數要比方差更加穩定,具有更長的記憶性。
首先,為保證預測的可用性與穩定性,多使用日頻收益數據對月頻率風險進行預測,由於因子日度收益率會存在一定自相關性,需要使用Newey-West方法進行協方差的估計與調整。
其次,為凸顯近期數據具有更高價值的特點,一般使用半衰期給不同時期的數據價值進行賦權。
基於此方法計算出相應的協方差矩陣,並給出相關係數與方差的估計值。
第三,在得到初步協方差矩陣估計後,還需進行特徵因子(Eigenfactor)方差調整。Muller(1993)指出依據風險模型估計最優投資組合的方差會出現明顯的低估,Shepard(2009)給出偏差的數量化證明,在正態性、平穩性的假設下,風險模型估計最優組合的方差會小於真實的方差,這部分低估主要來自於模型的過度擬合。
Menchero,Wangand Orr(2011) 對該類問題進行了系統的修正和討論,通過引入特徵因子(Eigenfactors)以輔助判斷低估的幅度。(具體的討論可參考文集)
最後,之前的每一步修正,其實都是針對橫截面方向上的修正,當出現金融危機等特殊時期,使用過去一段時間的信息來估計方差會出現明顯的低估。因此,在時間序列方向上也需對估計的波動做一個修正。基本的思路即是觀察近期的風險數據與預測數據的高低估程度,如在時間序列上有系統性偏差,則對其進行修正。
經過時間序列上的調整後,對於風險的評估將會更加準確和穩定,保障截面與時間序列上均無系統性偏誤。
6、個股特質風險預測
模型一般默認特質風險互不相關,故只存在個股的方差預測問題。具體可分為三步:基於模型殘差給出特質風險的初步估計,基於市值分組進行貝葉斯修正和基於時間序列調整估計。
首先,基於殘差給出個股特質風險的估計,但對於明顯存在瑕疵的股票進行修正。
其次,由於特質風險存在明顯的均值回復效應,可採用貝葉斯方法利用先驗信息將其估計值向均值靠攏,符合均值回復的效應。
最後,與因子風險的時間序列修正一樣,特質風險也需要對時間序列方向上進行調整,以使其估計更加匹配金融危機時的情況。
至此,在完成特質風險的預測之後,最終得到了每個因子的協方差矩陣估計及每個個股的特質風險估計,可用於對投資組合未來風險進行預測。
三、RISK MODEL方法在A股的實證分析
為探討Risk Model方法在A股市場的有效性,選取2016年以來的數據進行建模與分析,為便於比較,本文所選擇的因子以市場機構普遍使用的模型基本一致,剔除部分解釋性較弱的指標。
表2 Risk Model選用因子與指標
一
A股市場RISK MODEL的實證
採用中證全指為樣本空間,對異常值進行剔除處理,整體實證結果反映出中美市場的差異。
1、橫截面擬合優度不高,市值組合收益接近全指
依據因子數據對中證全指的日收益進行建模,整個擬合優度處於30%的平均水平,同時存在較大波動性,這與A股市場特質性、情緒性因素影響更大有一定關係。擬合優度與模型的應用效果並不等同,僅會限制可優化的程度。在對特質性風險合理估計的情況下,依然可實現相當於隨機權重的收益風險比的提升,在發達市場擬合優度大致處於40%水平。
圖4 Risk Model對A股的收益解釋能力
圖5 Risk Model市場組合與中證全指收益
Risk Model所回歸出的市場組合與中證全指走勢非常接近,側面說明中證全指特質風險分散良好,模型預測沒有對所有股票形成明顯的方向性的漂移。
2、因子收益詮釋市場轉變,因子偏好周期性變化
依據Risk Model回歸出來的純因子收益,可以提供觀察整個市場的因子視角:
(1)市值因子(sizef)在2017年前一直處於反向狀態,但在2017年後出現了明顯的反轉,並最終處於正向狀態。同樣呈現出反轉特點的還包括貝塔因子和估值因子,投資者偏好對於這些屬性始終處於一個多變的狀態;
(2)風險因子(rvf),動量因子(momf),流動性因子(liqf)則呈現出穩定的反向狀態,投資者對於它們的偏好在整個樣本時期處於穩定,即偏好低風險、反轉、低流動性的股票;
(3)成長因子(growf)在這段時期則處於一個波動上升的狀態,意味著投資者還是偏好於成長性的股票,但經常呈現周期性變化。
圖6 Risk Model各類型因子收益走勢圖
A股市場的因子收益展現出來的特徵與美國市場存在明顯差異,美國市場小市值、動量、低貝塔、高預期盈利的公司會獲得更優的收益,而A股市場更傾向於反轉、高成長、低風險、低流動性的股票,這些特點與兩地市場的投資者、市場結構差異存在關聯。
圖7 美國市場因子收益的部分展示
(數據來源:US Equity Model)
3、行業因子影響顯著,風格因子表現平均
因為回歸涉及到個股的權重,所以難以採用偏相關係數衡量因子解釋度,故而選擇T統計量(純因子收益的顯著性統計量)衡量每個因子的顯著性水平,也可認為是對模型的重要性水平。
從實證結果看,最顯著的統計量為行業類型因子,而風格因子的重要性則穿插其中,顯著水平高低依次為槓桿因子、動量因子、成長因子、估值因子、市值因子、貝塔因子、風險因子、流動性因子,較優的因子收益與較優的解釋性並不絕對一致。
圖8 各因子顯著性水平
二
Risk Model的應用
——指數增強基金收益分解和策略構建
指數增強型基金在近年來表現優異,受到廣泛關注,不少基金規模都超過10億元,個別的甚至超過100億元,受制於當前市場有效性環境,指數增強型基金的優勢或將持續。同時,Alpha多因子策略仍是基金公司實現指數增強的主要途徑。
1、指數增強基金優異表現驗證市場弱有效性
從指數增強型基金的表現來看,近幾年平均有70%以上的指數增強型基金實現了超額收益,年化超額收益可達近10%,這與發達市場存在顯著差異。
圖9 指數增強型基金的歷年表現
2、指數增強型基金的因子暴露
由於對滬深300指數增強的基金產品最多,規模最大。同時,滬深300股票集中於大市值,風險模型預測更加準確,本文選擇以滬深300為標的的指數增強型基金進行分析。
表3 滬深300指數增強型基金列表
由於基金半年報會披露所有的持股明細,而季報只披露前十大持股,所以採用半年報對其暴露進行分析,同時由於小規模基金受各類型因素影響較多,組合難以匹配目標,因此目前市場規模最大的300增強產品-景順長城滬深300產品為例進行分析,探討增強型產品的風險暴露變化。
圖10景順長城滬深300半年因子暴露(vs 滬深300)
從其產品披露的持倉,估算出其對應的因子暴露情況,可觀察到幾個有意思的情況:(1)該產品對SIZE因子做了較為精準的擇時,2016年中時,持倉幾乎是消除了SIZE的影響,但在2016年末、2017年都加強了SIZE因子的正向暴露,匹配了市場的走勢;(2)該產品對Beta、PB、Leverage有持續穩定的風險敞口,一直傾向於選擇低貝塔,低估值、高槓桿的公司;(3)該產品對于波動率、流動性、成長性、動量應用較少。
3、增強收益的解析和相關策略構建
公募基金具有定期的持倉披露制度,為分析和跟蹤其投資邏輯提供了學習與研究的基礎。在學習的技術上有兩種選擇,一種是基於持倉的精確數據,配置複製組合,這種方法的優勢是精確,劣勢是時效性比較差,只能半年調整一次持倉,並且調倉存在明顯的滯後;另一種方法是根據淨值表現去分析風險暴露,從而實現更為及時的跟蹤。
驗證第一種方法,配置與基金公布持倉完全一致的股票,以基金定期報告披露時間進行調倉。在早期,複製效果尚可,但隨著基金對於風險和持倉的調整,差異開始顯現。比如在2016Q4,持有的仍是對size暴露接近0的組合,而基金已經轉向正向的size暴露,表現就開始出現明顯的分歧,所以該種學習方法存在明顯的滯後性,從實際來看操作可行性較差。
圖11採用持倉複製方法的效果
驗證第二種方法,依據基金淨值表現推測其相應的風險暴露,利用Risk Model的穩健性和優化功能達到較優的跟蹤或超越。將基金的淨值超越RiskModel市場組合的超額收益對所有純因子收益進行回歸,依據模型輸出的係數估計其所採用的因子暴露情況。
依據所回歸出來的暴露,對滬深300 的成份股權重進行優化,在保持相同風險暴露時,追求偏差最小化(最優可追求跟蹤誤差風險最小化,但其中涉及諸多複雜的風險預測方法,這裡僅以簡單的方法說明)。
從整體情況來看,學習效果會優於成份股方法,其對於基金組合調整的信息反映更加及時,同時風險暴露的貼合更加穩定,該方法在複製基金組合時會更加穩健。
圖12 採用模型複製方法的效果
圖13 2016年底估算的基金風險暴露變化
需要特別說明的是,對於增強型基金的跟蹤,主要是學習和借鑑增強型基金經理對因子表現擇時的智慧,輪動可能是發現新因子信號所驅動,相應方法的應用會存在一定主觀性和產品設計上的障礙。因此,對於單只或少數幾隻產品的跟蹤意義不大,而通過對特定群體的學習或更有參考和借鑑意義。與此同時,可依據自身觀察的長期溢價因子與對組合的風險預測技術,實現完全被動化的因子溢價增強的方法。
圖14 構建規則化增強型策略路徑
四、總 結
風險模型誕生與投資認知深入發展密不可分,它是收益-風險分析框架下的必然產物。風險模型的主要功能在於對證券風險的預測與解析,可應用在組合優化與業績歸因領域,在整個風險管理技術行業有重要影響力。
線性風險模型的核心邏輯有三點:1)股票收益主要主要受到少數幾個風險因子所驅動;2)股票收益與風險因子暴露之間呈現線性關係;3)因子風險特徵與特質風險特徵存在穩定性,可根據歷史推測未來。風險模型的基本流程可以分為三塊,分別是因子收益與特質收益的估計,風險的外延性預測及組合風險的預測與優化。同時可分為6個步驟,即因子的選擇、數據的預處理、因子暴露的計算、因子收益的模型估計、因子收益協方差陣的預測、個股特質風險的預測。
A股市場風險模型的擬合優度略低於海外發達市場,因子收益同樣呈現出特色的一面。相較於美股偏好小市值、動量、低貝塔、高預期盈利的特點,A股市場更傾向於反轉、高成長、低風險、低流動性的股票。另外,A股市場行業因子相較於風格因子更為顯著,個股收益受行業影響更大。
指數增強型基金近年來表現優異,側面驗證了市場的弱有效性。增強型基金的因子暴露變化顯著,從因子暴露的視角可以有效分析其收益來源。學習增強型基金的收益有兩條途徑,其一是根據其披露的成份股學習,其二是依據淨值走勢猜測其風險暴露敞口,並據此構建組合。從整體情況來看,第二種方法對基金調整暴露的信息反映更加及時,收益方面也更加穩健。未來,可根據因子系統性溢價的研究結果,利用風險模型的預測,形成特定主動風險下的完全規則化的溢價指數構建。