本篇報告嘗試解決Alpha預測中高維度與非線性兩個問題。我們使用基於Lasso的模型,針對性的解決了上述兩個問題,最後增強組合的效果相對於傳統的ICIR方法有非常顯著的提升。
高維度問題:目前已知的有效單因子個數越來越多,如何正確有效的篩選因子並且預測收益呢?
非線性問題:線性模型並不能準確的描述因子和收益之間的關係,有些因子並不是嚴格單調的,如何擬合因子和收益之間的非線性關係呢?
本報告使用Adaptive Lasso方法來幫助我們解決高維度下因子篩選以及預測的問題。同時,我們使用樣條回歸來擬合因子和收益之間的非線性關係,然後用Group Lasso的方式進行預測。
從中證500增強組合的角度來說,Adaptive Lasso相對於ICIR方法有年化3%左右的提升,信息比提升0.4。而非線性的Group Lasso方法相對於ICIR方法有年化6%左右的提升,信息比提升1左右。因此,總體來說,基於Lasso的收益預測模型要顯著好於傳統的ICIR方法。
一、實證資產定價與Alpha預測
隨著越來越多的市場異象被發表出來,Cochrane(2011)在他的主席演講中說到股票截面收益又一次陷入混亂。目前的實證資產定價領域有一些亟須解決的問題:1)已經發現的異象都能夠提供關於股票截面收益的獨立信息嗎?哪些能夠被其他因子解釋呢?哪個因子模型才最為有效?2)大多數資產定價模型都有很強的線性假設,如何能夠有效的解決因子和收益的非線性關係呢?(Fama和French,2008)
這與我們在Alpha預測中遇到的高維度與非線性這兩個問題非常相似,因此我們借鑑了資產定價論文中的一些方法來幫助我們解決這兩個問題。
二、Lasso方法與傳統Alpha模型的對比
2.1 ICIR方法存在的問題
ICIR方法在實際投資中可操作性強,且易於解釋,也被證明有著不錯的效果,但是其中存在著一定的問題:
1) 首先,在小類因子合成大類的時候,對於因子的分類存在主觀性,主觀的信息不一定是增量,也有可能是噪聲。一些因子蘊含的信息並不相同,也可能被分到一組內,最典型的例子是質量類因子中,一些財務比率的相關程度並不是很高。
2) 即使這些因子通過統計或者邏輯的方法正確的進行了聚類,在小類合成大類的過程中仍會損失一定的信息。例如,我們將EP、BP、SP等權合成為一個複合因子,期望複合因子中代表的是小類因子中共同含有「價值」因子的信息,但這一做法可能弱化小類因子包含的特質的收益預測信息。
3)最後,在大類合成的時候,等權和ICIR加權也沒有考慮大類因子間的相關性。
2.2 Lasso回歸
想要考慮因子之間的相關關係,並運用因子池中儘可能多的信息,我們需要將所有因子放在一個統一的模型中來預測收益,其中最簡單的模型就是線性模型。
由於因子數量眾多,因子間產生共線性的可能性較大,如果直接進行OLS回歸,那麼對於因子的統計檢驗容易不顯著,幾乎不具備因子篩選的能力。同時,過多的自變量可能會造成模型的過擬合,導致樣本外的預測不準確。我們使用Lasso回歸幫助我們解決上述兩個問題。
Lasso方法滿足因子選擇一致性的條件過於嚴格,測試中發現Lasso篩選變量的效果並不好。因此我們採用Adaptive Lasso方法。即在做完第一步Lasso(OLS)之後再做第二步回歸。
2.3 ICIR方法與Adaptive Lasso回歸的對比
三、考慮非線性的Group Lasso方法
3.1 因子和收益的非線性關係
上圖展示了反轉因子2014年的分組收益,可以看到這個分組收益是中間高兩邊低的。但此時反轉因子的IC值仍然顯著為負。如果去持有反轉因子第一組,這個組合可能不能戰勝市場,甚至產生回撤。
3.2 如何擬合因子和收益之間的非線性關係?
我們參考了很多資產定價領域的論文,有如下一些方法來擬合因子和收益之間的非線性關係,例如使用多項式、分段函數、三角函數等等。通過嘗試,我們發現用這些模型擬合出來的參數不太穩定,並不能很好的預測收益。
3.3 考慮非線性的Group Lasso方法
我們採用非參的方法來對因子和收益的非線性問題進行建模。實際上,通過分組收益測因子的方法就類似於非參截面回歸。如果我們將股票的分組定義為啞變量,與未來一期的收益進行加權線性回歸(加權是由於不同期的樣本數量不同),得到的係數就是分組收益。這相當於把因子和收益的關係擬合成了一個階梯函數。 在此方法中,我們試圖利用非參的方法將階梯函數變換成一個連續光滑的函數,並使用Group Lasso進行估計。
從增強組合的表現來看,考慮非線性問題的Group Lasso方法相比於線性Adaptive Lasso方法有年化2.5%的提升。
風險提示:以上結論均基於歷史數據和統計模型的測算,如果未來市場環境發生明顯改變,不排除模型失效的可能性。
本文節選自國盛證券研究所已於2019年2月20日發布的報告《多因子系列之二:Alpha因子高維度與非線性問題——基於Lasso的收益預測模型》,具體內容請詳見相關報告。
劉富兵
S0680518030007
liufubing@gszq.com
丁一凡
dingyifan@gszq.com
特別聲明:《證券期貨投資者適當性管理辦法》於2017年7月1日起正式實施。通過微信形式製作的本資料僅面向國盛證券客戶中的專業投資者。請勿對本資料進行任何形式的轉發。若您非國盛證券客戶中的專業投資者,為保證服務質量、控制投資風險,請取消關注,請勿訂閱、接受或使用本資料中的任何信息。因本訂閱號難以設置訪問權限,若給您造成不便,煩請諒解!感謝您給予的理解和配合。
重要聲明:本訂閱號是國盛證券金融工程團隊設立的。本訂閱號不是國盛金融工程團隊研究報告的發布平臺。本訂閱號所載的信息僅面向專業投資機構,僅供在新媒體背景下研究觀點的及時交流。本訂閱號所載的信息均摘編自國盛證券研究所已經發布的研究報告或者系對已發布報告的後續解讀,若因對報告的摘編而產生歧義,應以報告發布當日的完整內容為準。本資料僅代表報告發布當日的判斷,相關的分析意見及推測可在不發出通知的情形下做出更改,讀者參考時還須及時跟蹤後續最新的研究進展。
本資料不構成對具體證券在具體價位、具體時點、具體市場表現的判斷或投資建議,不能夠等同於指導具體投資的操作性意見,普通的個人投資者若使用本資料,有可能會因缺乏解讀服務而對報告中的關鍵假設、評級、目標價等內容產生理解上的歧義,進而造成投資損失。因此個人投資者還須尋求專業投資顧問的指導。本資料僅供參考之用,接收人不應單純依靠本資料的信息而取代自身的獨立判斷,應自主作出投資決策並自行承擔投資風險。
版權所有,未經許可禁止轉載或傳播。