★主要內容
我們在今年10月份發布的《衍生品量化擇時系列專題之二:螺紋鋼指標篩選與大類因子合成研究》報告中,我們分別基於IVX的預測回歸方法進行螺紋單因子篩選與基於3PRF降維模型進行因子動態賦權合成兩套方法論體系採用基本面與宏觀數據信息對螺紋期價進行預測建模。從2011年至2019年12月30日的回測結果來看,單因子等權模型年化收益率53%,年化波動率18%,最大回撤-18%,日勝率57%,夏普比率2.82,月度換手率0.79;基於3PRF模型年化收益率37%,年化波動率20%,最大回撤-22%,日勝率54%,夏普比率1.73,月度換手率1.15。
今年四季度螺紋鋼基本面量化模型在樣本外繼續走出較佳表現,單因子等權模型最早與2019年11月5日給出看漲信號,此後一直堅定看漲不變,使得模型基本拿到了本輪上漲的絕大部分收益,淨值再創新高,其中10-12月收益率分別為-1%,7%、4%。等權信號構成佔比方面,看多因子佔比在11月以來顯著提升,位於50%-70%左右,而看空因子佔比最高也在30%以下,儘管單因子等權結果較為粗糙,但本輪上行短周期中從信號數目的角度可以看出模型多頭信號是較為堅定的,相對9-10月份震蕩行情中偶爾得到的多頭信號一致性更高。
3PRF模型下,11月15日開始穩定看漲信號,近期四季度的表現相對單因子等權模型有一定劣勢,主要因為10月份震蕩行情下換手更高,淨值波動較大,而後趨勢看多信號較為滯後,10-12月的月度收益率分別為-3%、2%、4%。
市場邏輯切換造成回撤、模型失效。
1
衍生品量化擇時之螺紋策略跟蹤
在今年10月份發布的《衍生品量化擇時系列專題之二: 螺紋鋼指標篩選與大類因子合成研究》報告中,我們分別基於IVX的預測回歸方法進行螺紋單因子篩選與基於3PRF降維模型進行因子動態賦權合成兩套方法論體系採用基本面與宏觀數據信息對螺紋期價進行預測建模。 從2011年至2019年12月30日的回測結果來看,單因子等權模型年化收益率53%,年化波動率18%,最大回撤-18%,日勝率57%,夏普比率2.82,月度換手率0.79; 基於3PRF模型年化收益率37%,年化波動率2 0%,最大回撤-22%,日勝率54%,夏普比率1.73,月度換手率1.15。
今年四季度螺紋鋼基本面量化模型在樣本外繼續走出較佳表現,單因子等權模型最早與2019年11月5日給出螺紋看漲信號,此後一直堅定看漲不變,使得單因子模型基本拿到了本輪上漲的絕大部分收益,策略淨值不斷再創新高。3PRF模型下,11月15日開始穩定看漲信號,趨勢看多信號相對較為滯後。單因子等權模型表現優於3PRF模型,與我們長期回測結果保持一致,單因子等權模型是基於對螺紋基本面框架中較為重要的170個指標(分別具有四種變化形式)中通過IVX預測回歸方法篩選得到的20個預測能力最強的指標(或變化形式),單因子等權模型基於固定窗口的篩選得到長期有效的指標,其結果彈性較大,缺點在於可能面臨指標失效的風險。3PRF模型基於樣本外滾動窗口對螺紋五大類基本面指標分別進行動態篩選與賦權,得到供給、需求、庫存、宏觀、價格價差共五大綜合指標,進行合成預測,該方法不事先對指標加以篩選,完全由模型基於與收益率相關性最大的原則進行滾動窗口的動態降維,其淨值結果較為平穩,相對彈性較小,但可能對市場主要邏輯轉換的適應性更強。
2
螺紋期價走勢主要影響因子
我們在原專題報告中基於螺紋產業鏈與宏觀面,將影響螺紋期價的因子歸為供應類(共49個),需求(共25個),庫存(共11個),宏觀(共62個),價格類(共23個)。經單因子測算,我們選出供給類中高爐開工率、鐵礦石日均疏港量、鋼坯庫存等單因子;需求類中測算具有顯著線性預測效果的指標主要是鋼材出口這一相對比較冷門的指標;宏觀類因子主要是社融、M1等資金面因子以及鋼鐵行業景氣度(PMI)指標;此外則是鋼坯庫存指標以及基差指標。
通過四季度的樣本外表現來看,供給類指標中年粗鋼產量≤200萬噸鋼廠開工率(歷史均值比)指標表現最佳,10月至12月月度收益率分別為3%、7%、3%,2019年月度勝率100%,小鋼廠開工率指標表現較好主要因為其更能代表邊際供應、對盈利和政策更為敏感。需求指標中我們選出的鋼鐵出口指標儘管不算是鋼材行業最核心指標,但其預測月度勝率較高,其中,中國鋼材出口數量(歷史均值比)10月至12月月度收益率分別為6%、7%、3%,2019年全年月度勝率10/12,其背後的邏輯我們在此前的專題報告中也曾給予說明,我們認為背後的原因可能在於相較於大體量的房地產、基建需求,鋼材出口更加敏銳的捕捉到需求的邊際變化,線性預測模型很難把握地產景氣度預期的變化,市場對需求端的預期也往往超越了數據本身而基於一定的推理演繹,因而地產數據本身暫時測算下來並不顯著,簡單的線性模型對於需求的邊際變量效果更好也可以理解,但我們不可否認地產開工等指標的重要性,這也是我們後續模型完善的方向之一。社融指標四季度表現有一定分化,不同分項以及不同變化形式月度收益率漲跌不一,社融企業債券融資(歷史均值比變化率)指標相對較優,10月至12月月度收益率分別為-3%、7%、3%,2019年全年月度勝率9/12。此外活躍合約基差(歷史均值比變化率)對四季度行情預測勝率也相對較好,主要由於11月開始的螺紋上漲行情主要是由於在地產開工韌性超預期加暖冬需求旺盛影響下現貨供應偏緊庫存再創新低,11月底基差最高超550元/噸,對期價上行也起到了一定的解釋作用。鐵礦石港口疏港量指標在歷史測算中表現較優,鐵礦石疏港量指標可體現剛才補庫需求,可更為準確的體現鋼廠的實際產出水平,但近期預測效果相對較為一般,其原因可能主要是冬儲時期補庫目的或更為複雜,對短期期價解釋程度不足。
3
基於IVX回歸法的單因子等權模型
單因子等權模型最早與2019年11月5日給出看漲信號,此後一直堅定看漲不變,使得模型基本拿到了本輪上漲的絕大部分收益淨值再創新高,其中10-12月收益率分別為-1%,7%、4%。等權信號構成佔比方面,看多因子佔比在11月以來顯著提升,位於50%-70%左右,而看空因子佔比最高也在30%以下,儘管單因子等權結果較為粗糙,但本輪上行短周期中從信號數目的角度可以看出模型多頭信號是較為堅定的,相對9-10月份震蕩行情中偶爾得到的多頭信號一致性更高。
4
基於3PRF的大類因子綜合信號
3PRF模型下,11月15日開始穩定看漲信號,近期四季度的表現相對單因子等權模型有一定劣勢,主要因為10月份震蕩行情下換手更高,淨值波動較大,而後趨勢看多信號較為滯後,10-12月的月度收益率分別為-3%、2%、4%。
5
附錄:量化模型介紹
5.1、基於時間序列的預測回歸:IVX方法介紹
我們基於時間序列上的預測回歸來檢驗單因子有效性,但時間序列回歸易面臨指標內生性與持續性的問題,使得傳統OLS估計有偏。首先,OLS回歸假設自變量的外生性,即X與誤差項無關,這一假設通常在時間序列回歸上不成立;其次,OLS回歸的另一個重要假設是X是平穩時間序列,而實際上宏觀或其他基本面指標往往具有較強的自相關性,其自回歸係數越高說明持續性越強,OLS估計偏差增加。
Kostakis(2015)的IVX方法適用於金融時間序列回歸中常遇到的平穩序列、協整序列、近似協整序列、近似平穩序列四類,且無需加以區分,基本可以涵蓋基本面預測回歸中需要的變量特徵。首先,基於預測因子的一階差分得到近似平穩變量,並定義自回歸矩陣:
最後採用兩階段最小二乘估計法(2SLS) 得到工具變量法對 的無偏估計,且參數估計漸近地服從混合正態分布,可基於Wald 統計量便捷進行參數估計與假設檢驗,方法運算效率較高。
5.2、基於3PRF模型的數據降維與大類因子合成
預測問題接下來面臨降維方法的選擇,降維最常用的方法之一是主成分分析(PCA),其通過找到與原變量方差較大的線性組合進行數據降維,但方差最大的變量組合併不一定是預測能力最強的變量組合。我們本文將基於Kelly(2015)提出的三階段回歸(3PRF,Three-pass Regression Filter) 模型進行指標降維,其降維目標是和預測目標變量的協方差最大,有助於在時間序列滾動窗口上動態捕捉對收益率貢獻較大的因子及時應對預測過程中常面臨的驅動因子失效與邏輯切換,更適用於我們面臨的預測問題。模型引入了代理變量(proxy variable),代理變量可通過經濟理論設置或算法迭代生成。共包含三步回歸:
第一步運行N個獨立的時間序列回歸,在第一步回歸中,預測因子是因變量,代理變量是自變量,估計係數描述了預測因子對代理變量(代理變量與Y相關)的敏感性;
第二步回歸基於第一步回歸得到的係數進行T次獨立的截面回歸,此回歸中預測因子仍然是因變量,第一階段回歸係數為自變量。第一階段回歸將預測因子的橫截面分布映射到潛在因子得到各預測因子對預測目標的敏感度係數,進而在每個時點上該係數與預測因子截面回歸的斜率()即為我們需要的隱變量,即降維因子值。
最後基於第二步所得降維後的預測因子對目標收益率進行時間序列上的預測回歸,第三步回歸擬合得到最終的預測結果。
6
市場邏輯切換造成回撤、模型失效。
從業資格號:F3032817
投資諮詢號:Z0014348
Email:xiaohui.li@orientfutures.com
來源: 東證衍生品研究院