金融異象指標的失靈

2021-03-01 量化投資與機器學習

科學領域的可複製性危機

造成如此結果的部分是因為P-hacking!

我們在統計時經常用到P值,一般認為P≦0.05有統計學意義。但是現在很多統計學家並不是這樣認為,對於P值的濫用和誤用進行了苛刻的批評。因此出現了一個新詞:P-hacking。

P-hacking 最早應該是美國賓夕法尼亞大學的Simmons和他的團隊提出來的,Simmons等人也對P-hacking進行了定義:

P-hacking refers to the practice of reanalyzing data in many different ways to yield a target result. They, and more recently Motulsky, have described the variations on P-hacking, and the hazards, notably the likelihood of false positives—findings that statistics suggest are meaningful when they are no.

P-hacking 按照字面的意思來看是「P值黑客],但是實際上的意思科研動力認為是「P值篡改」或者「P值操縱」。P-hacking是科研人員不斷的嘗試統計計算直到p<0.05,當然有時這可能是無意識的。

有一些可重現性危機,一些科學家無法複製一些關鍵實驗:

《科學》雜誌發表了一項名為「可複製性項目」(re - bility Project)的計劃的成果。該計劃是由非營利組織開放科學中心(Center for Open Science)協調的合作項目。參與者試圖複製100個與實驗相關的心理學研究,這些研究已經在三家著名的心理學雜誌上發表。媒體廣泛報導的結果令人深思,只有39項研究被成功複製。

大部分原因是研究人員在發表具有統計學意義的結果之前進行了大量的試驗。或者在試驗過程中改變不同的參數。這就是所謂的The garden of forking paths,並不總是經過深思熟慮的。

金融領域的可複製性危機

在過去的幾年裡,一些金融數學領域的一些學者已經注意到困擾大家的回測過擬合問題。例如,下面這篇在2016年發表的論文闡述了這個問題:

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2731886

為什麼在理論上看起來不錯的策略往往在實踐中表現不佳,是因為回測中那些看起來牛逼轟轟的表現往往不會在實際應用中繼續重現。

沿著這條線,在下面這篇論文中:

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2739335

論文表明:基於回測,可以很容易地實現任何預期的目標。比如10年或更長時間內每月增長1%。然而,當呈現新的數據時,它們總是被證明是禁不住考驗的。至少,完全不能複製當初所宣稱的目標。

如今,隨著算力與程序化技術的興起,情況更加惡化了!

為一個策略生成千上萬、數百萬甚至數十億的組合權重或參數已經變得越來越簡單。正如這篇論文所提到的:

http://www.ams.org/notices/201405/rnoti-p458.pdf

Marcos Lopez de Prado、Michael Lewis在回顧了上述以及該領域其它的最新發展後,遺憾地得出結論:從業者和學者發現的大多數投資策略都是錯誤的!

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3167017

同樣,Marcos Lopez de Prado在2018年《福布斯》採訪Brett Steenbarger時,也從以下幾個方面討論了這種情況:

假設一家製藥公司開發了1000種藥物,並在1000組志願者身上進行測試。當有幾十種測試證明「顯著性」的機率為0.05時,這些藥物就被當作有效的治療方法開始銷售了。病人們相信這些「科學測試」,紛紛湧向這些新的藥物。結果卻發現,由於藥物並沒有帶來預期的效果,他們的病情反而惡化了。一些消費者病得很厲害,有些人甚至死亡。

顯然,這種欺騙行為會引起公眾的強烈抗議。事實上,這正是我們有一個監管機構和法律來幫助確保藥物在向公眾提供之前經過了適當的測試的原因。但金融消費者卻得不到這樣的保護,使他們容易受到未經驗證投資策略的影響。這些假陽性結果尤其具有誤導性,因為它們是由一群具有專業研究背景的人所推動的,而這些研究人員並沒有使用必要的科學工具來發現這些虛假的結果。


新的異象指標研究

Fama將有效市場定義為:如果資產價格完全反映了可得的信息,則市場有效。而在隨後的研究中,眾多異常收益現象(Anomalies)被發現,即持有具有某種特徵的股票在未來會獲取超額收益。

為了更好地評估金融領域的可複製性狀態,Kewei You、Chen Xue、Lu Zhang發表了一篇關於金融領域異象指標複製的論文:

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3275496

在Lu Zhang教授的論文中,基於美國市場數據,對447種異常收益現象進行了研究(考慮到變量定義的唯一性,實際有大約220種異常收益變量)。結果表明,將T值為2作為閾值時,約64%的異常收益組合收益是不顯著的;將閾值提高至3時。約85%的異常收益組合收益是不顯著的。也就是說,儘管已有文獻記錄了眾多樣本期內有效的因子,但當對其進行複製時,該因子有效性或喪失、或減弱。


論文最後指出:投資者必須對研究結果自己動手進行複製與回測,所謂「信任但要驗證」。對任何感興趣的研究成果,都需要在研究團隊反覆獨立測試驗證後才相信,對學術研究結果反覆測試檢驗是很有必要的。科學文獻自我糾正的機制是有限的,一般也只會糾正最重要研究成果的偏差。


大部分基於流動性的變量基本只在微盤股有效,即使用等權重,交易摩擦因子的複製成功率也只有不到40%。因此這個類別因子的有效性值得懷疑。我們並不是說流動性、交易微觀結構和其他交易摩擦變量(例如交易費)在實踐中不重要,而是就驅動股票獲得超額收益的因子而言,交易摩擦遠遠沒有價值、動量、投資和盈利因子重要。

其他一些眾所周知的異象指標,作者無法複製,包括:

the Bhandari (1988) debt-to-market; the Lakonishok-Shleifer-Vishny (1994) five-year sales growth; the La Porta (1996) long-term analysts』 forecasts; several of the Abarbanell-Bushee (1998) fundamental signals; the O-score and Z-score studied in Dichev (1998); the Piotroski (2000) fundamental score; the Diether-Malloy-Scherbina (2002) dispersion in analysts』 forecasts; the Gompers-Ishii-Metrick (2003) corpo- rate governance index; the Francis-LaFond-Olsson-Schipper (2004) earnings attributes, including persistence, smoothness, value relevance, and conservatism; the Francis-LaFond-Olsson-Schipper (2005) accrual quality; the Richardson-Sloan-Soliman-Tuna (2005) total accruals; the Campbell-Hilscher-Szilagyi (2008) failure probability; and the Fama-French (2015) operating profitability.

有人擔心,儘管Kewei You、Chen Xue、Lu Zhang引用了一些多重檢驗統計數據,但考慮到他們的研究範圍,可能沒有完全彌補這一現象。但這意味著,如果有什麼區別的話,那麼他們的研究結果是相對保守的。在他們的研究中,統計上可以複製的指標甚至更少,或者僅在非常有限的統計可信度下才可複製。

更重要的是應該記住,張教授他們的數據只持續到2016年。從那時起,全球市場上基於大數據的程序化交易大幅度增加,這也很可能意味著,一些曾經有重大價值的異象指標不再有效!

發布新結果的壓力

2016年,Harvey、Liu、Zhu的一項研究表明:他們分析了296篇已發表的論文中的異象,發現80至158篇(高達53%)可能是錯誤發現。

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2249314

作者認為,該領域的一種基本結構性結構偏差可能是罪魁禍首:儘管複製研究經常出現在大多數其他科學領域的頂級期刊上,但這類研究很少在金融和經濟領域發表。換句話說,人們普遍傾向於發表新的結果,而不是嚴格地驗證之前的結果。

美國金融協會前任主席Campbell R. Harvey也注意到了這類問題:

https://faculty.fuqua.duke.edu/~charvey/Research/Published_Papers/P131_The_scientific_outlook.pdf

由於複製性研究和其他沒有報告顯著新結果的研究往往產生較少的引用,這類論文不太可能發表。另一方面,Harvey注意到研究人員也會造成發表偏見,摸清了期刊對有重大新結果的論文的套路,作者可能不會提交只有邊緣結果的論文。這種偏見在其他領域被稱為「file drawer effect」。發表偏見也可能是由於作者在期刊提交的論文中精心挑選最重要的結果引起的,這是P-hacking的一種形式。

恢復可複製性

幸運的是,有一些特定的工具可以用來防止這次有害的影響,如回測過擬合和其他形式的多重檢驗偏差。例如,2014年JPM的這篇論文提供了一些可靠的方法來檢測和防止錯誤的發現:

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2460551

同時,2017年JCF的這篇論文提供了計算回測過擬合概率的理論框架:

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2326253

歸根結底,唯一的長期解決方案是教育!但針對金融領域的研究人員來說,這個問題任重而道遠~

避免P-hacking

最後,在你自己的研究中避免P-hacking的一個好的方法是:從一開始就對自己誠實。仔細考慮並記錄你想要測試的所有內容。如果你想測試20個不同的因子,請在開始測試之前指定這些因子,並在評估指標時考慮所有20個因子。

但最重要的是,想想你自己的模型在做什麼。神經網絡有時被認為是黑箱,從某種意義上說,的確如此,但是你應該批判性地回顧每一步。如果你正在進行圖像識別,請觀察每一層的激活,大致了解該層的激活基於什麼。如果你正在進行強化學習來玩遊戲,看看你是否能夠大致理解邏輯是如何工作的。如果你正在進行自然語言處理,請考慮與同義詞、反義詞和相關單詞有關的詞向量。

如果你在做股票市場分析,問問自己你真正想從模型中得到什麼。為什麼某些因子的第n個延遲是一個預測因子?為什麼以前的收益會影響未來的收益?你為什麼只考慮最近的N次收益?為什麼要預測一個(每天、每小時、每分鐘)的周期?你為什麼要考慮從X到Y這段時間?為什麼驗證到Z?

將股票增量輸入到一個遞歸神經網絡中就可以達到減少損失的目的,但是有了解釋,你也可以將這些值擬合到一個隨機數生成器中。

參考文獻

1、Kewei Hou, Chen Xue, Lu Zhang, 2019, Replicating anomalies, forthcoming, Review of Financial Studies.

2、David H. Bailey, Marcos Lopez de, PradoJournal of Portfolio Management, 40 (5), pp. 94-107. 2014

3、David H. Bailey, Jonathan Borwein, Marcos Lopez de Prado, Qiji Jim Zhu, Journal of Computational Finance (Risk Journals), 2015, Forthcoming

4、東北證券,高建、王琦,2018,Replicating Anomalies A股檢驗

5、新全球資產配置,2019,因子戰國:張櫓教授對q-factor模型的五大討論

量化投資與機器學習微信公眾號,是業內垂直於量化投資、對衝基金、Fintech、人工智慧、大數據等領域的主流自媒體。公眾號擁有來自公募、私募、券商、期貨、銀行、保險、高校等行業20W+關注者,連續2年被騰訊雲+社區評選為「年度最佳作者」

相關焦點

  • 中國金融體系主要指標大全!
    【收藏版:研究必備】中國金融體系主要指標及內涵大全來源:博瞻智庫(微信號Bzzk-research) 作者:任濤▌一、央行體系金融指標維度(一)貨幣供應1、貨幣發行與基礎貨幣(亦稱央行儲備貨幣
  • 【招商策略】機構投資者會利用市場異象交易嗎? ——股票市場SCP...
    研究了包括動量、盈餘公告後漂移等14種廣為人知的股票市場異象,結果發現,當學術期刊刊發相關異象且會計數據可得後,基於市場異象的交易增多。作者進一步研究是哪些機構會利用市場異象進行交易,結果發現共同基金很少參與,但是對衝基金和短線機構會利用這些市場異象進行交易。進一步的研究發現對異象的交易與文章發表後異象收益降低有直接關係。
  • 中國金融體系主要指標大全
    (三)社會融資規模社會融資規模於2010年提出來,這是一個中國獨有的指標。所謂社會融資規模,即一定時期內(月度、季度和年度)實體經濟從金融體系所獲得的資金總額,既有存量概念,又有流量內涵,可兼顧絕對規模,又可衍生相對指標。
  • 《明日之後》颶風異象劇情怎麼樣 颶風異象劇情詳解
    《明日之後》颶風異象劇情都有什麼內容呢?對此,很多小夥伴還不是很了解。那麼接下來,及滾歲九遊的小編一起繼續往下看吧! 異象再起 原本風平浪靜的聖託帕尼 ... 颶風來襲,聖託帕尼、南希市請求支援! 《明日之後》颶風異象劇情都有什麼內容呢?對此,很多小夥伴還不是很了解。
  • 金融科技概念魚龍混雜,七大指標或可釐清界線 | 中國金融科技發展論壇前瞻
    記者採訪了業內多位權威人士進行探討,給出了七大指標和四大分類。《21世紀經濟報導》2018年6月30日在上海,再度重磅推出「中國金融科技發展論壇」及系列活動,探討金融科技3.0、尋找發展新動能(下拉文章到底,查詢論壇簡介和參會信息)。在言必稱金融科技的時代,到底怎樣的公司可以算作金融科技公司?記者採訪了業內多位權威人士進行探討,給出了七大指標和四大分類。
  • 《劍網3》天現異象任務怎麼做 天現異象任務完成攻略
    導 讀 劍網3天現異象任務怎麼完成?
  • 央行解讀金融系統成績單:2020年我國主要指標符合預期,金融體系...
    2020年金融體系運行平穩,普惠小微貸款增長3成「今年1月12日,央行發布的《2020年金融統計數據報告》顯示,2020年我國主要金融指標運行符合預期,金融體系運行平穩」,陳雨露對於2020年金融體系的整體情況進行明確。分述來看,首先,貨幣、信貸增長基本實現年度目標。
  • 央行:數據顯示2020年中國主要金融指標運行符合預期
    中新社北京1月15日電 (記者 魏晞)中國央行副行長陳雨露15日在國務院新聞辦公室舉行的發布會上表示,數據顯示,2020年中國主要金融指標運行符合預期,金融體系運行平穩。陳雨露提出四點來支持上述論斷。1月15日,中國國務院新聞辦公室在北京舉行新聞發布會,介紹2020年金融統計數據有關情況。中國人民銀行副行長陳雨露表示,數據顯示,2020年中國主要金融指標運行符合預期,金融體系運行平穩。 中新社記者 張宇 攝一是貨幣、信貸增長基本實現年度目標。
  • 古代人生出生異象有什麼用
    古代人生出生異象有什麼用?古代人生是一款非常有特色的模擬人生手遊,古代人生玩家經理十三個周目即可解鎖出生異象的功能,很多玩家對這個功能不大了解,古代人生出生異象有什麼用呢,下面由心願遊戲小編為您介紹一番吧
  • 蘋果手機屏幕失靈怎麼辦?iPhone屏幕失靈解決方法
    例如屏幕失靈了。蘋果手機屏幕失靈怎麼辦?iPhone手機屏幕失靈的解決方法有哪些?如何避免iPhone手機屏幕失靈。下面小編就分享給大家蘋果手機屏幕失靈的解決方法。一、靜電導致屏幕暫時失靈在冬天屏幕特別容易出現靜電問題,當你長時間不適用iPhone放置了一段時間,剛開機的時候發現屏幕不是很靈敏,那就可能是靜電所導致的。
  • 和平精英陀螺儀失靈怎麼辦 陀螺儀失靈解決方法
    和平精英在這次更新後,有很多玩家碰到了陀螺儀失靈的情況,這給大家造成了不小的困擾,下面小編就帶來的和平精英陀螺儀失靈解決方法,一起來看看吧。
  • 那些出生就天生異象的皇帝們
    自古以來,中國流傳著一種說法「天生異象,必有貴人降臨」。在那個皇權至尊的年代,民間百姓一直相信這樣的說法,更不用說皇家了。下面我們就來說說那些出生就有異象的皇上。三皇五帝當中的伏羲氏,據部分古籍記載,伏羲出生於成紀。(北魏酈道元《水經註:渭水》記載:「故瀆東經成紀縣,故帝太皞庖犧所生之處也。」司馬貞:「母曰華胥,履大人跡於雷澤而生庖羲於成紀。」)
  • 斷路器失靈保護工作原理
    對於斷路器失靈保護的配置和實現方案,我國技術標準有著明確的要求。標準化方案將斷路器失靈保護分為線路保護分相啟動斷路器失靈保護和變壓器、線路永跳保護共用三相啟動斷路器失靈保護,其動作邏輯分別如圖1和圖2所示。
  • 小英偶遇天氣"異象" "吉兆說"還是「妖孽論」
    據島內民視報導,蔡英文近日探訪大埔農民,意外發生小插曲,天空中太陽周圍突然出現一道光暈,讓民眾高喊「天有異象,臺灣要出女『總統』了」。不過,氣象學者指出,這是日華現象,是因為高層冰晶被太陽光折射,其實並不少見……     事件:蔡英文遇「日華異象」將當「總統」 網友譏諷    快評:日前,民進黨主席蔡英文探訪大埔農民,偶遇天氣異象
  • TCL空調遙控器失靈原因 TCL空調遙控器失靈解決方法【詳解】
    TCL空調遙控器是對TCL空調進行整體操控的儀器,但是在使用的過程中往往會出現TCL空調遙控器失靈的情況,非常影響我們的使用體驗。但是很多人對TCL空調遙控器失靈的原因了解的不是很多,下面小編就來給大家介紹一下TCL空調遙控器失靈的原因。  一般情況下首先考慮的是否是遙控器內的電池電量用完了,或者是因為電池出現了接觸不良的原因。
  • 株洲頻現異象 多與地殼運動有關
    株洲頻現異象 多與地殼運動有關 來源:紅網 作者:溫琳 李聖鵬 編輯:王津 實習編輯 楊眉 2014-08-13 23:45:32
  • 啟示錄灰白色的馬之異象
    2014年8月初,我從主那裡得到了最強有力、最生動的異象之一,這些異象可以在啟示錄中找到。啟示錄6章預言了關於世界範圍的屠殺,其中充滿了混亂,欺騙,戰爭,饑荒和瘟疫,這些將殺死地球的四分之一。這個異象集中在聖經啟示錄6章中提到的灰白色的馬,以及紅色的馬。這裡提供了簡短摘要,但我在24分鐘的視頻中分享了更多詳細信息。
  • 天現異象!美國雪地屢次出現的神秘光柱,是在預示著什麼嗎?
    如果我們對中國的傳統文化感興趣的話就會發現,中國古時候經常會發生一些所謂的異象。其實這樣異象用我們現在的科學眼光來看,大部分都是天文現象或者是光學現象,因為古人缺乏一定的科學知識,所以對於這些不懂的現象都歸納於異象。
  • 「十三五」合肥金融系統深化改革顯擔當 主要指標連創歷史新高
    合肥在線訊(記者 王曉峰 文/攝)  1月8日,記者從「美好合肥『十三五』成就巡禮」系列新聞發布會上獲悉,「十三五」期間,合肥市金融系統按照穩金融、促發展的工作總基調,大力構建現代金融服務體系,主要金融指標接連創下歷史新高,在全國省會城市位次穩步前移。
  • 截至6月末,泰安市銀行機構本外幣貸款餘額達3001億元,主要金融指標...
    截至6月末,全市銀行機構本外幣貸款餘額達3001億元,各項貸款規模首次超過3000億元,主要金融指標實現歷史性突破。實體企業獲「無縫續貸」政策新工具持續釋放紅利 「疫情期間,我們開啟了口罩繩生產線,公司被列為全國疫情防控重點企業,獲得了快速、優惠的信貸支持。」