今天這篇文章來自塔勒布哲學理念的數量化版本Statistical Consequences of Fat Tails,全書400餘頁,由戴國晨研讀後用可讀性比較強的方式為大家進行細緻講解,戴國晨說:「整體讀完對我幫助很大,結合之前聽他上課時候的內容有豁然開朗的感覺,書裡面包含了對肥尾分布不同角度的分析理解。我沒有直接做翻譯,而是採用筆記的形式。一來是塔勒布老師的文字本身比較晦澀,二是塔勒布老師在量化領域深耕多年,裡面有一些數學炫技的成分,我儘可能的對內容做了一些簡化。在術的層面上這是一本很有價值的書,通過裡面的期權部分我大概能猜出Universa尾部對衝策略的超額收益來源···」
譯者導讀:真實世界中的隨機性並非無跡可循,在日常經驗中,人們發現冪律分布可以近似描述大量真實世界的現象,如市場波動,財富分配,流量效應,災難損失等等。更準確的講,這些隨機事件的尾部都具備冪律特徵,在對數坐標系下生存函數以直線形式下降。
這是極為神奇的現象,從標普500指數的尾部收益率到大型戰爭的極端傷亡人數,橫跨不同領域的風險事件在肥尾的數學框架中得到了統一。二八定律周而復始的出現,映照出世界背後的底層邏輯:均衡不過是奢望,極端才是常態。
本書的下半部分就從實際肥尾分布出發,引出預測和賠付的關係,最終收尾於期權定價,構建了從現象到規律,思路到工具的閉環。
在標普500指數的收益率分布中,可以看到隨著周期拉長,收益率峰度逐漸下降,呈現出緩慢的中心極限定理。這也是很多金融產品的共同特點:短期市場總是過度反應,收益率服從冪律尾分布,長期則回歸理性,收益率逐漸向正態靠攏。這樣的回報特點會給不同策略的魯棒性帶來巨大差異,價值投資聚焦長期,結果隨著周期拉長變得愈發穩定,而市場上林林總總的短期策略則極大地暴露在尾部風險中。
在冪律尾分布下,歷史極值或條件均值的風險視角有著巨大缺陷,尚未發生的尾部事件可能會極大的影響整體統計性質。因此任何短期策略想要長期存活,必須在極端條件下保護自身。隨著市場不斷發展,對尾部保護的需求逐漸演變為今天的期權合約,並發展出一系列量化定價方法。本書的期權部分主要從肥尾分布的角度切入,對合約的絕對和相對定價做出了思考。
讀塔勒布之前看尾部風險,如同身處黑暗,滿是難以量化的混沌與恐懼,讀塔勒布之後看尾部風險,朦朧間已然瞥見一抹光亮,儘管依然無法看清風險的全貌,但是已經能夠辨別可知與不可知,跳出被隨機性愚弄的輪迴。以上是一點個人感悟,也希望各位讀者可以從中有所收穫。
六、標普500分布
通過我們具備的各類工具,可以對美國標普500指數進行多角度統計分析。SP500作為金融市場中最重要的指數,其回報率的尾部滿足冪律分布,我們通過歷史收益率關注如下幾點:
累計峰度
SP500單日收益率呈現出很高的峰度,但是如果計算不同時間周期對數收益率的分布,根據大數定律該分布應該趨向於高斯分布。但是通過從歷史數據得到的峰度結果如下圖所示:
因此我們可以認為收益率的肥尾來自數據內部結構,也就是波動率集聚現象。
最大回撤
下面是n=5, 30, 100和252天的回撤,通過log-log圖可以看到回撤尾部滿足帕累託分布。
Kappa值
條件期望
四階矩不穩定性
下面的表格中展示了在SP500超過50年的歷史中,單日回報率對峰度的最大貢獻高達79%。這種超大單日極值貢獻在其他金融資產中也很常見,比如原油,白銀,其他商品和股票指數等。如此依賴極值也說明了金融資產回報率的峰度高度不穩定,甚至很可能並不存在。
極大值貢獻圖
從圖中我們可以看出SP500收益率呈現出非常陡峭的冪律分布特徵,對於三階和四階矩在50年範圍的回測上依然顯著不為0,因此不滿足大數定律。
極值分析
在整個歷史中,SP500的正收益極值突破了16次,負收益極值突破了9次。如果將收益率打亂重新進行極值分析,正負收益率突破次數的均值都在10次左右,此時代表肥尾之間無相關性。因此負收益率的尾部相對更加獨立,而正收益率由於比理論值增長更快,說明尾部極值間存在一定的相關性。
七、預測與不確定性
肥尾分布下的決策
對於不確定條件下的決策,關鍵在於確定所面臨概率與賠付的關係,其中賠付的重要性常常高於概率預測本身。在實際決策過程中,人們往往過度關注預測的正確與否,希望無限提高正確率,但是到頭來卻在賠付結果上吃了虧,形成決策上的巨大錯配。本章中我們對預測和賠付之間的關係進行探討。
首先我們要認識到:
一個例子是老闆問手下的交易員:你認為市場會上漲還是下跌?交易員信心滿滿的說會上漲,然後轉頭做空。老闆非常生氣,覺得受到了欺騙,因為他只能接受二元的狀態:上漲做多,下跌做空,卻無法理解大概率上漲對應「小幅上漲」而小概率下跌對應「大幅下跌」。交易員在這裡錨定的是期望而不是預測。
從統計的角度講,預測本身對應的是概率分布的零階矩,而賠付往往是概率分布的一階或高階矩。
可能出現的概率和賠付關係:
二元預測和賠付,如賭博,彩票,選舉結果,新藥開發等,只有成功和失敗兩種結果。這時預測或者觀點相當於一種投票機制,賠付和預測內在關聯,如果兩者脫鉤則會出現無風險套利機會,如荷蘭賭。
無邊界賠付,如戰爭傷亡數字,市場崩盤損失,通脹程度,新產品銷售和利潤率,保險保障等。這樣的非線性關係下會出現預測和結果方向相悖的現象,哪怕預測者只有小概率正確,由尾部帶來的超大賠付可能依然划算,或者預測者絕大多數時候正確,但是可能會被尾部帶來的超大損失擊潰。
在金融衍生品中,上述賠付的典型例子分別為二元期權和普通期權,如下圖所示:
特徵尺度
為了對衝尾部的風險,有人可能會問:在肥尾分布下,一個典型的或是常規的災難賠付會有多大?實際上在無特徵尺度的肥尾分布中,「典型」的尾部賠付很可能並不存在。為了區分隨機變量的薄尾和肥尾,我們定義隨機變量X分布的特徵尺度如下:
在肥尾分布中,由於尺度不存在,不論K多大都依然會有更大的條件期望,也即風險之上還有風險,想要完全對衝尾部的風險就只有通過無邊界賠付的產品,如期權。
上述定義也可以用條件賠付的形式表示,假設I為K值以上的條件賠付,g(x)為賠付函數:
總的來說,概率只是積分內部的核函數,真實世界中重要的是賠付,也即概率事件對每個人的實際影響。金融領域風險管理的本質在於改變賠付關係,而不在於追求正確預測,因為在肥尾分布下你很難進行「正確量級的預測」。因此只要在賠付關係上有利於自身,哪怕降低預測精度也無妨。反過來說,預測準確率的提高如果對應賠付的大幅惡化,這樣的準確並沒有意義。如人們所說,同樣是犯錯誤,把熊誤認為是石頭遠遠比把石頭誤認為是熊糟糕的多。
大選預測
上一節中我們談到了二元預測,比如美國大選,總統在民主黨和共和黨候選人中二選一產生。在金融衍生品領域,二元期權的定價正是描述這樣的過程。當選舉不確定性大幅提升的時候,風險中性定價會將對應的期權價格推向50%,並且越接近到期越趨向50%。這一點和直覺相悖:當底層資產波動率提高的時候,期權的波動率反而降低了。通過借鑑二元期權的定價方法,我們可以更好的對大選結果進行建模預測,比如對於如下問題:
目前民調顯示川普的支持率為30%,請問川普獲勝的概率是多少?
絕大多數人都會預測是30%,但是其實30%並不準確。因為30%只考慮了最新的支持率,遺失了民調的波動率信息。事實上如果我們知道民調的波動率很大,民眾忽而支持川普,忽而支持希拉蕊,這樣的條件會降低現有民調結果的置信度,川普實際獲勝的概率會高於30%。或從另一個角度出發,如果民調顯示川普支持率為0%,因為潛在的不確定性,我們無法斷定川普一定會落選,其獲勝概率依然高於0%。
為了定量求解獲勝概率,我們需要對期權定價做一些改進,因為期權標的資產收益率為無界變量,而這裡大選投票為有界量,因此我們加入代表投票票數的隨機變量Y,將滿足布朗隨機遊走的無界變量X映射到Y上,並使得Y為鞅過程。在非線性變換下,此時的X不滿足鞅過程。
可能有人會問為什麼不通過直接假設變量Y為有界Beta分布的形式來求解。原因在於數學上目前無法通過有界分布逆推隨機過程。採用影子隨機變量巧妙的解決了這一點,方便以期權定價求解獲勝概率,並可以延展到不同的時刻觀察獲勝概率變化。
由此構建下圖所示的結構,其中B為二元選舉結果,Y為投票數,X為定義在R上的影子變量
有了這樣的工具,我們可以通過不同時刻觀測到的支持率推出真正的大選獲勝概率,其無套利條件下的真實值會相對接近0.5,遠遠小於我們所看到的支持率波動。不過這裡有一個很重要的假設是波動率保持不變,實際上隨著大選的進行,有關候選人的信息逐漸披露,支持率的波動也將減小,真實世界的合理定價介於兩者之間。
八、有界肥尾分布
有界帕累託分布
在面對這樣的情況時,為了擬合併求解分布均值,目前有兩種方法:
(1)假設帕累託分布的尾部於H處截斷,將超出部分的概率重新按比例加回到[L,H]區域。
(2)假設H處為帕累託尾部的吸收態,超出H的概率通過狄拉克函數的形式加到H點。
這兩種方式在計算時由於概率密度的躍變,並不適用於極值理論。這裡提出第三種方式——通過無界的中間分布實現概率密度的連續,並求解條件均值。假設隨機變量Z滿足:
大規模戰爭和動亂的尾部概率
在人類歷史上,戰爭和動亂是造成大量人員傷亡的主要因素。傳統和戰爭相關的的統計分析主要聚焦於優化不完善和不可靠的數據集。這裡開闢一個新的視角,通過極值理論觀察歷史上戰爭造成人員死亡的分布,並按照有界帕累託分布,通過截斷尾部的形式估計傷亡均值,戰亂事件發生的周期和相關性。通過該研究嘗試回答一個問題:隨著歷史的發展,戰亂的發生概率或傷亡規模是否有降低的趨勢?
在研究中,我們主要著眼於造成五萬人以上死亡的戰亂事件,通過統計分析可以得到以下結論:
由於全球人口隨著時間不斷增長,為了保證可比性我們分別對原始數據和尺度重整數據做統計研究,其結論並無很大不同。在戰亂事件的定義上,由於「戰亂」概念本身比較模糊,不同類型的戰亂可能在同一時期重疊,也可能一個戰亂橫跨幾個時期,伴隨著饑荒瘟疫等因素。我們這裡將超過25年的戰亂拆解開來,比如蒙古當年在亞歐大陸的入侵,持續了125年以上,在多個地方有著不同的記載,因此被拆解為了12到55個不同的事件。原始數據中最大的死亡人數出現在二戰時期,而尺度調整後死亡人數最大的是中國唐朝的安史之亂。
另外,對已發生戰亂的分布進行統計存在生存偏差,我們得以生存的前提是尚未發生過毀滅整個人類的超大型戰亂,隨著人類掌握核武器等破壞性科技,這一極端風險也日益升高。
2)戰亂發生周期滿足齊次泊松過程,並無記憶性,也即無法證明隨著歷史的發展全球已經變得更加和平。
檢驗齊次泊松過程可以通過POT方法,觀察戰亂到達時間是否滿足指數分布,且發生時間之間不存在自相關性。
下表為超過1,2,5,10死亡人數的戰亂的平均發生時間和平均偏差。
下表為基於尺度重整數據的結果:
可以看到如果採用原始數據,一千萬人以上死亡的大型戰爭平均周期為101年,而偏差可以達到144年,因此在二戰以來短短不到100年的今天,我們並沒有辦法在統計上說明目前的世界已經進入長期和平的狀態。
3)通過分布擬合,如果未來發生大規模戰爭,雖然傷亡數字高度不確定,但擬合分布均值約為3倍歷史均值,歷史均值的視角大大低估了可能的傷亡。
大規模戰爭是高度不確定的尾部事件,基於上述數千年的歷史統計研究,我們雖然無法預知第三次世界大戰是否會發生,何時發生,或是會產生多少傷亡,但是至少從統計上可以認為其發生的風險並未降低。如果未來全球能繼續延續百年以上的和平,才會在尺度上影響到上述統計結論,證明我們進入了一個更為安全的歷史時期。
九、肥尾條件下的期權定價
期權是非線性的金融衍生產品,早在十七世紀的荷蘭就已經出現,當時著名商人和哲學家Joseph De La Vega曾描述過為期權定價和管理風險敞口的技巧。之後於1900年的法國,Louis Bachelier以數學模型確定了價格來自於最終賠付的期望,該方法並不限制標的資產的分布。後來更為人們所熟知的是Black-Scholes-Merton模型,使得連續時間下期權和標的資產的動態對衝組合滿足風險中性條件,並加入了收益率正態分布的假設。期權定價模型的優點在於將不確定的價格變化轉化為與資產價格關聯的確定性賠付,因此期權不屬於單獨的資產類別,也不存在CAPM理論下的風險溢價。
但是在現實金融市場中,BSM模型裡面幾個重要的潛在假設難以實現,比如假定無交易摩擦成本,無市場衝擊影響,和最重要的無價格跳躍。雖然學界在後續的衍生定價模型上對於上述假設進行了改進,但還是不能很好的適用真實市場。因為只有連續交易才能滿足時刻變化的Delta條件,而在收益率呈現出冪律尾分布的市場中,任何想要以動態對衝的方式複製期權收益流的行為都會面臨高昂的誤差成本。下圖中左為Black-Scholes世界中的動態對衝誤差,而右為真實的動態對衝誤差。對於套利組合來說,出現在1987年市場崩盤期間的巨大誤差很可能是災難性的。因此在肥尾條件下動態對衝無法有效降低組合的風險。
雖然依賴動態對衝對期權定價的方式有重大缺陷,但是由於看漲看跌期權可以複製出遠期合約,期權平價理論的適用範圍可以超出BSM的假設,不論標的遠期價格滿足風險中性測度與否,看漲和看跌期權都至少存在一定的對應關係。對於任意的行權價K和測度Q,我們都有:
如果對於不同的行權價K其平價定價出現偏差,就可以通過構建組合的模式進行多空套利,這種套利不需要面對BSM模型中的動態對衝誤差問題,因此更為實用。
對期權的一些認知誤區:
很多交易者選用VIX指數來押注極端尾部事件,但是VIX本身是由平值期權求得的,更貼近波動而非峰度。正確押注肥尾的方式是賣出平值期權買入尾部的虛值期權,以二階矩中性的方式單獨做多四階矩,押注波動率偏斜的增強。
對於押注風險事件的波動率策略,其回報和風險變動呈現出高度非線性關係,只看VIX來計算尾部期權的回報是錯誤的。假設VIX為10%時買入對應的期權,當VIX上漲4%時,對應的平值期權價格會上漲15%,而一個5倍標準差的價外期權會上漲4倍,10倍標準差的價外期權則會上漲144倍。
單獨購買期權如同購買保險,期權的價值只有在和標的資產組合的時候才能進行客觀衡量。一個合理的方式是通過計算持有標的+長期購買少量尾部期權的收益與風險。對衝基金Universa正是基於這一策略的長期正收益建立。