報告日期:2020年12月30日
基於我們對不同擇時方法的實證分析,不同方法論的擇時效果有一定差異但均體現出一定的擇時效果,基於我們選擇的景氣度、金融條件以及利率利差因子進行國債收益率的預測是有效的,但不同方法論在具體應用中存在比較大的差異。
首先,單因子滾動窗口篩選與預測適用於較為精簡的指標庫,其優點在於單因子在不同時間區間上的有效性可以進行非常清晰明了的展現,缺點在於對於等權合成的方法沒有考慮到指標間相關性的差異,且對於數據量大的情況處理效果可能不佳。單因子滾動窗口篩選法基於五年期國債期貨三倍槓桿回測,實現年化收益率7%,夏普比率1.47;基於十年期實現年化收益率14%,夏普比率2.91。
其次,主成分分析法更適合處理板塊內指標的相關性問題,採用主成分分析的方法無法解決降維所得結果對因變量是否具有解釋能力的問題,因而還需要對各個降維成分進行預測能力的驗證,實際應用過程中可能存在因驗證標準選擇而對樣本外預測結果產生較大影響的情況,實際應用難度較高。基於五年期國債期貨三倍槓桿回測在包括樣本集與預測集的全部時間區間上,實現年化收益率12%,夏普比率1.24;相應的基於十年期國債期貨,實現年化收益率17%,夏普比率1.26。
最後,基於偏自相關回歸框架的三階段回歸法整體的實用性最強,模型在滾動窗口內基於指標對因變量的解釋能力進行賦權,無需再對降維結果與因變量的相關性進行驗證則可直接用於預測,模型應用方面的主要缺點在於降維結果缺乏實際經濟含義支撐,模型對於指標選擇與參數選擇具有一定的敏感性。基於五年期國債期貨三倍槓桿回測實現年化收益率7%,夏普比率2.01;相應的基於十年期國債期貨,實現年化收益率8%,夏普比率1.58。
指標的有效性基於歷史數據得出,不排除失效的可能。
1
國債期貨擇時框架介紹
1.1.數據指標介紹
本文擇時模型採用的數據整體上是相對較為基礎、普遍關注度較高的宏觀經濟與價格價差指標,我們將影響國債收益率的指標初步整理分類主要涵蓋景氣度、金融條件指標以及貨幣市場利率利差三個主要模塊。我們嘗試在經濟景氣度月度指標中加入較多的高頻數據進行補充,目前市場上對於景氣度先行指標研究也比較多,我們觀察一些價格數據也能夠表徵經濟景氣度,主要是受宏觀影響較大的部分大宗商品價格以及航運價格等走勢與PMI具有較高的一致性,為便於分析我們將高頻數據整理為周度均值並計算同比。金融條件指標對利率走勢往往具有一定的領先作用,我們主要考慮社融、流動性以及信貸方面的指標。此外今年以來我們明顯觀察到央行對貨幣市場利率的調節對債市的影響大大加強,存單利率、市場利率與政策利率利差、利率互換利差等對國債期貨擇時的指導意義在今年整體表現也比較突出。
文本擇時實證研究共基於31個指標初步分為三大類五個子類,分別為經濟景氣度之經濟指標(E1)、經濟景氣度之高頻指標(E2)、金融條件指數之流動性(F1)、金融條件指數之信貸規模佔比(F2)、貨幣市場利率利差(IR)。
數據指標的選擇本身肯定具有「倖存者偏差」的,隨著研究體系的升級,我們以現在研究體系中的關鍵指標去進行歷史回溯往往是更容易取得好的結果的,即便側重「樣本外」結果的呈現也難免結果上仍然具有一定的偏差。本文重心主要在於構建框架,將不同的擇時體系的難度、效果、可行性進行比較分析,對於影響利率指標體系的研究我們也將進一步不斷豐富與完善。
1.2.建模方法論
我們在擇時框架的構建方面主要基於三種方法進行探討,首先是對單因子進行有效性檢驗,對於各個指標整體的擇時能力進行初步的研究,並基於滾動窗口進行單因子篩選與樣本外預測。單因子的驗證與預測結果非常直觀,可以在樣本集內對各個指標的擇時有效性進行排序與對比,並且便於同邏輯分析相結合。但單因子滾動區間篩選與等權預測信號的合成方法終歸還是較為粗糙,不能夠較好地解決指標間相關性強弱差異的影響,且該種方法也相對更適合處理小樣本的數據指標。
對於數目較多相關性較強的宏觀數據,建模應用還是首先需要解決降維的問題,我們在此前的基本面量化研究中應用偏自相關回歸的方法論,在較為繁雜的基本面數據中基於指標對被解釋變量的解釋能力進行賦權降維,總體上可以實現較好的預測效果。本文用到較多低頻率的宏觀數據,我們希望在建模過程中對數據本身的主要成分進行深入分析,而非僅僅根據數據的預測能力進行篩選,因此我們首先還是基於傳統的主成分分析對於不同大類的因子進行降維,分析前幾個主要成分對國債收益率的預測能力。即本文在降維模型方面將分別探討主成分分析與偏自相關回歸兩種方法論在國債擇時方面的效果與實用性等方面比較。
對於降維模型的原理我們先進行一個簡單直觀的介紹。主成分分析(PCA)的基本思路是基於解釋變量方差最大的原則,提取全新的正交特徵即主成分。具體做法是,首先從原始數據中找方差最大的方向作為第一主成分,從正交平面中繼續尋找使得方差最大的主成分,依次類推。主成分分析得到的第一主成分接近均值的概念,後續成分可能代表指標價差等維度,具體涵義是不確定的。主成分分析的優勢是可以有效解析大量相關性強的解釋變量的主要特徵,而對於預測回歸應用而言,並非所有的「特徵」都對我們的待預測指標有解釋能力,因而對於PCA的主成分應用與預測之前需要進行進一步的分析與篩選。
由於方差最大的變量組合併不一定是預測能力最強的變量組合,我們基於Kelly(2015)提出的三階段回歸模型(3PRF)進行偏自相關回歸框架的實證應用,三階段回歸模型的降維目標是因子和預測目標變量的協方差最大,因而採用該模型可以在時間序列滾動窗口上動態捕捉對收益率貢獻較大的因子,可以應對預測過程中常面臨的驅動因子失效與邏輯切換的問題,降維結果按照指標的解釋能力進行加權所得,因而所得「主成分」可直接應用與預測回歸,無需進一步驗證因子與因變量的相關性,模型使用方面相對PCA更為高效。其缺點主要是在尋找對Y有解釋能力的因子與權重的過程中,降維結果可能與解釋變量本身的主要特徵已產生了較大的偏離,難以解釋降維結果反應的經濟涵義。具體實現方法上,首先模型引入了代理變量,代理變量可通過經濟理論設置或算法迭代生成。共包含三步回歸:
第一步運行N個獨立的時間序列回歸,在第一步回歸中,預測因子是因變量,代理變量是自變量,估計係數描述了預測因子對代理變量(代理變量與Y相關)的敏感性;
最後基於第二步所得降維後的預測因子對目標收益率進行時間序列上的預測回歸,第三步回歸擬合得到最終的預測結果。
1.3.策略構建說明
1.3.1.數據處理
a)建模採用的數據指標包含宏觀月度指標也包含利差日度指標,我們將數據統一轉換成周度,對於沒有數據指標用前值代替。所有數據納入模型進行回測前均進行歸一化處理,避免數據量綱不同的影響。
b)考慮數據可得性宏觀數據統一滯後一個月,價格價差類日度數據滯後一日,作為生成信號時點的可得信息,對於周度頻率數據我們統計周度可得信息基於下周第一個交易日結算價作為建倉價格。
c)國債期貨的移倉換月處理方面,我們基於持倉量最大的規則進行主力合約切換,主力合約切換時剔除移倉換月價差,得到復權後的收益率時間序列。
1.3.2.數據平滑
對於宏觀數據進行模型應用前,一般需要進行適當的平滑,去除噪音得到趨勢性特徵,平滑的方法有很多,最簡單的移動平均、指數移動平均,以及HP濾波器等工具均是較為常用的,我們本篇文章中選取低延遲趨勢線(LLT),主要是因為在此前的擇時策略實證研究中發現該方法對於趨勢的把握相對而言更為靈敏、擇時效果較佳。該方法的主要思路是基於一階改進的指數移動平均(EMA)濾波器函數串聯一個二階低通濾波器的傳輸函數得到,二階濾波器的特點是原始信號中相對高頻一些的信號也能保留下來。在相同的衰減因子下,趨勢線LLT 相比於MA 和EMA 具有更低的延遲性。其表達式為如下公式,其中為平滑參數,取值與選取的數據窗口有關。
1.3.3.策略設計
a)模型解釋變量為上文展示的宏觀經濟與利差等指標或指標降維結果,被解釋變量為五年期和十年期國債收益率(中債估值),為方便多空策略回測我們選取五年期和十年期國債期貨為交易標的,即我們預測的是現券收益率而策略落地到國債期貨。由於國債波動較小保證金佔用僅0.5%-2%左右,策略回測包括國債期貨多頭基準淨值的計算均使用三倍槓桿,不再考慮保證金利息、剩餘資金的投資收益與交易成本。
b)單因子方面,我們逐個進行預測效果檢驗,並基於滾動窗口進行指標篩選與樣本外合成。在主成分分析模型下,我們把2015至2018年作為樣本集,把2019至2020年作為預測集,預測成分的選取方法是在樣本集上表現較好的主成分進行等權合成,並在預測集上進行驗證。在三階段回歸模型下,我們基於1年(52周)的滾動窗口進行動態的因子合成與預測,即在每周我們均基於前52周的歷史表現進行因子的賦權與降維,將所得成分進行對下一周的預測,3PRF模型整體就是在一個滾動窗口下進行動態演化的,因而不需要專門去設置樣本集與預測集。
2
基於國債期貨多空擇時策略回測
2.1.單因子預測效果分析
我們針對每個單因子對國債收益率預測效果進行全樣本測算,整體看來利率利差因子、景氣度因子以及金融條件因子均可以對利率方向起到較好的預測效果,對於五年期國債期貨與十年期國債期貨預測效果較好的單因子整體差異不大,我們以五年期為例,對預測效果較佳的單因子進行簡要分析。
首先,若我們以淨值夏普率從高到低排序,貨幣市場利率利差因子(例如存單利率與政策利率利差、利率互換與國開收益率利差等)位居前列,部分利率利差因子由於數據長度的原因回測區間較短(2018年至今),今年國債行情較大而利差類因子對於今年行情的上漲與下跌普遍均把握較好,使得整體回測夏普率較高,而對於18-19年利差類因子相對表現其實是較弱的。其次,對於景氣度因子與金融市場條件因子長期具有較為明顯的擇時效果,但在今年的行情下擇時效果較為一般,主要原因或由於新冠影響下市場波動幅度整體較大,而經濟金融數據可能有一定的滯後性對於應對短期突發的事件驅動性質的行情把握能力較弱,長期依然來看依然具有顯著應用價值。
在實際擇時應用中,我們除了驗證因子在樣本內的預測效果還需要檢驗我們所選數據對未來利率走勢的解釋能力是否穩健,也就是我們在樣本內發現的預測能力是否能夠向外推演。邏輯上講,我們認為我們文章中所選取的基礎的經濟金融與利差數據與國債收益率的關係應該是穩定的,例如金融周期上行景氣度上行往往帶動利率走高。為了在數據上進行檢驗,同時也基於單因子設計一個簡單的可執行擇時策略,我們以年為節點篩選與更新歷史上表現較佳的單因子,進行等權合成作為下一個年度的指標集,具體而言,我們基於2014至2016年中淨值夏普比率(期債三倍槓桿回測)高於1.0的因子作為2017年的預測因子,以2014至2017年表現較好的因子作為2018年的預測因子,以此類推。基於單因子滾動篩選,以五年期國債期貨三倍槓桿回測,實現年化收益率7%,年化波動率3%,勝率68%,夏普比率1.47;基於十年期國債期貨三倍槓桿回測,實現年化收益率14%,年化波動率4%,勝率72%,夏普比率2.91。
2.2.基於主成分分析法的實證分析
前文基於單因子滾動窗口篩選可以在一定程度上解決基本面量化中面臨的有效指標的篩選問題,但隨著數據量增加,單因子等權的處理方法也顯得較為粗糙,因納入因子的相關性不同直接等權生成信號也可能會對數據中存在的某一特徵的影響過於強化。對於處理較為繁雜的基本面與宏觀數據,對於建模而言更為簡潔有效的方式是對數據進行降維,將數據中的主要成分即可以概括數據主要特徵的抽象結果納入模型。但數據經降維處理後,其原本的經濟意義也將被打破,我們得到的主要特徵向量是數據維度的與從邏輯出發對數據關注的要點往往不完全相同。
我們首先對主成分分析(PCA)的降維方法進行實證,相對更為複雜的降維模型,主成分分析相對而言還是可以更好地保留數據本身的特徵。我們以前文三大類五個子類的指標數據為例,在PCA模型下得到前三大主成分,分別記為pca1、pca2、pca3,並在展示中將經後文測算在子類別中在測試集合預測效果相對較好的成分我們以深紅色高亮顯示。
我們基於歷史效果推演未來主要的邏輯基礎是經濟指標與利率之間變動的邏輯長期來看具有穩定性,因而對於PCA成分在預測中的應用時可以定期進行回測驗證與更新迭代。經過對不同模塊降維主成分的觀察,第一主成分普遍反映了數據的長周期趨勢項,一般相對其他成分波動更小代表更長周期的信息,而其次的成分可能代表二階或者價差等方面的信息,波動性相對較高。經測算具有顯著預測能力的成分不一定是第一主成分,可能原因在於我們預測頻率偏高頻,長周期的變化不一定可以對短期波動起到較好的預測作用,反而其後的二三主成分可能起到更好的預測效果。此外,由於方法決定了我們將為所得的主成分盡可以代表解釋變量的特徵而不保證與被解釋變量有關,因而對於主成分分析的結果,我們依然需要用到類似於單因子的方法劃分用於因子有效性篩選的樣本集與驗證因子樣本外預測作用的測試集。具體做法是基於2015至2018年作為樣本集進行有效性篩選,得到樣本上預測效果較佳的成分(選擇每個子類別中預測淨值夏普率最高的成分)用於2019至2020年測試集上的樣本外預測。
在主成分分析模型框架下,我們對降維得到的主成分分別基於LLT模型進行周度數據12期的平滑,再進行預測驗證。對於每一個模塊不同主成分對利率的影響方向不盡相同,我們根據因子變動與下一期利率變動的相關性係數正負值作為各因子影響方向,再進行回測分析,基於歷史樣本集中的表現選擇對利率具有擇時能力的因子。根據我們的測算,金融條件流動性因子(F1)和貨幣市場利率利差因子(IR)的第一主成分對於利率走勢具有顯著的擇時效果,金融條件信貸規模佔比因子(F2)和經濟景氣度基礎指標(E1)的第三主成分相對預測效果更為顯著,景氣度高頻因子(E2)的第二主成分效果較好。基於上述因子,在五年期國債期貨三倍槓桿的回測框架下,包括樣本集與預測集的全部時間區間上,實現年化收益率12%,年化波動率8%,勝率63%,夏普比率1.24;相應的基於十年期國債期貨,實現年化收益率17%,年化波動率12%,勝率63%,夏普比率1.26。
2.3.基於三階段回歸法的實證分析
相對主成分分析,基於偏自相關回歸框架的三階段回歸(3PRF)模型對數據降維的依據則是基於對因變量的解釋能力確定各個因子的權重,我們可以設定滾動窗口進行自變量的動態降維合成並進行預測,操作模式類似於單因子模型滾動窗口篩選,但基於3PRF模型的降維合成對於指標的相關性的處理明顯更為科學。具體處理方法我們將全部指標依然基於LLT模型進行平滑,將平滑後的指標以及指標的環比變化均納入3PRF模型,分別將十年期/五年期國債收益率左右被解釋變量,得到相應的降維結果與預測信號。
預測效果方面,由於模型較為靈活可以明顯降低擇時淨值波動性,但同時信號切換也更為頻反應到策略換手率的上升,模型對於參數選擇具有一定的敏感性,由於數據長度可回測區間的限制,我們把滾動時間窗口的長度設置為1年(52周)不做調整,測算不同數據平滑窗口下模型的預測效果,發現基於LLT模型以3~6個月左右的時間窗口進行平滑後預測效果相對較佳。在LLT模型12期平滑的情景下,基於五年期國債期貨在三倍槓桿下,實現年化收益率6%,年化波動率3%,勝率69%,夏普比率1.36;相應的基於十年期國債期貨,實現年化收益率7%,年化波動率4%,勝率65%,夏普比率1.13。在LLT模型16期平滑的情景下,基於五年期國債期貨在三倍槓桿下,實現年化收益率7%,年化波動率3%,勝率72%,夏普比率2.01;相應的基於十年期國債期貨,實現年化收益率8%,年化波動率4%,勝率67%,夏普比率1.58。相比較PCA降維方法而言,基於3PRF模型降維在收益風險比方面是更優的選擇,且在實際操作上也更加簡潔高效。
3
結論
基於我們對不同擇時方法的實證分析,不同方法論的擇時效果整體而言有一定差異但均體現出一定的效果,基於我們選擇的景氣度、金融條件以及利率利差因子進行國債收益率的預測是有效的。不同方法論在具體應用中存在比較大的差異,首先,單因子滾動窗口篩選與預測適用於較為精簡的指標庫,其優點在於單因子在不同時間區間上的有效性可以進行非常清晰明了的展現,缺點在於對於等權合成的方法沒有考慮到指標間相關性的差異,且對於數據量大的情況處理效果可能不佳。其次,主成分分析法更適合處理板塊內指標的相關性問題,採用主成分分析的方法無法解決降維所得結果對因變量是否具有解釋能力的問題,因而還需要對各個降維成分進行預測能力的驗證,實際應用過程中可能存在因驗證標準選擇而對樣本外預測結果產生較大影響的情況,實際應用難度較高。最後,基於偏自相關回歸思路的三階段回歸法整體的實用性最強,模型在滾動窗口內基於指標對因變量的解釋能力進行賦權,無需再對降維因子與因變量的相關性進行驗證則可直接用於預測,模型應用方面的主要缺陷在於降維因子缺乏實際經濟含義支撐,模型對於指標選擇與參數選擇具有一定的敏感性。
4
模型結果不能代表未來。
從業資格號:F3032817
投資諮詢號Z0014348
Email:dongli.wang@orientfutures.com
關注同花順財經(ths518),獲取更多機會
責任編輯:wyj