原標題:李迅雷:股市會在疫情形勢好轉之前率先見底
摘要
【李迅雷:股市會在疫情形勢好轉之前率先見底】唐軍、李迅雷稱,從2009年美國H1N1大爆發以及2003年「非典」期間美股、港股和A股表現來看,在疫情快速傳播期,股市會明顯調整,但幅度不會很大,且往往在疫情形勢好轉之前率先見底。(證券時報)
唐軍、李迅雷稱,基於數學模型的新冠病毒傳播預測,假定隔離和防控措施能達到或接近SARS後期的效果,則預計未來總患病人數將達到88500人或58000左右,新增確診人數將在2月17日(中性假設下)或2月11日(樂觀假設下)左右出現拐點。從2009年美國H1N1大爆發以及2003年「非典」期間美股、港股和A股表現來看,在疫情快速傳播期,股市會明顯調整,但幅度不會很大,且往往在疫情形勢好轉之前率先見底。
以下為研報全文:
疫情拐點何時出現——基於數學模型的新冠病毒傳播預測
主要內容&結論
主要內容:
1)基於SEIR流行病傳播模型測算基本傳染數R0(也叫基本再生數)來衡量傳染性的強弱普遍存在輸入參數不易確定、輸出結果對參數非常敏感的問題。國內外不同文獻對同一疫情(比如SARS)的測算結果可能相差甚遠。簡單取一組參數得到的輸出結果並不可靠。
2)本文對SEIR模型做適當簡化,減少參數,再針對新冠病毒已明確的具體信息設定參數區間範圍,再從多個維度選取校驗條件,利用計算機數值模擬的方法求取參數值。通俗的來講就是讓電腦程式在參數區間範圍內做大量嘗試,試探出較合理的參數值,使得各個校驗條件都能較好的相恰。
3)通過1月14日到22日武漢遷出人口排名前8的省市隨後一周的確診病例數與武漢遷出人數的關係,來反推武漢潛伏期感染者的比例和數目,獲得求解模型的重要約束條件。通過數值求解得到參數值,代入模型對新冠疫情進行評估和預判。
主要結論:
1)新冠病毒基本傳染數明顯大於SARS,但單次接觸的傳染概率可能略低,民眾無需恐慌。根據數值模擬確定的參數值,新冠病毒的基本傳染數(R0)遠高於SARS,即不採取防疫措施的情況下平均每個病人傳染的人數更多。但進一步分析表明,新冠病毒R0更高的主要原因可能是潛伏期末期具有傳染性和輕症患者比較多,潛伏期末期和輕症患者由於症狀不明顯,不會及時就醫住院或限制自己活動,使得暴露在易感人群中的時間(傳染期)更長。而單次接觸的傳染概率則可能略低於SARS。可見,潛伏期長和輕症患者多增加了疫情防控的難度,對病例的接觸者採取更早、更全、更嚴格的隔離可能是最有效的防控措施。
2)當前新增確診病例數大幅攀升(日新增病例超2500)可能與檢測確診效率提高有關,預計將很快回落(模型中性假設下預測值是1700左右)。1月25日之前,公布新增確診數大幅低於模型預測值,26日之後則大幅高於模型預測值,可能是因為確診檢測試劑盒供應充分了,將之前已經發病而沒有確診的病例確診了。
3)假定隔離和防控措施能達到或接近SARS後期的效果,則預計未來總患病人數將達到88500人(中性假設下)或58000(樂觀假設下)左右,新增確診人數將在2月17日(中性假設下)或2月11日(樂觀假設下)左右出現拐點。
4)新冠病毒的重症及致死率低於SARS、禽流感、H1N1等,由於潛伏期長且輕症患者較多,控制疫情傳播需要更加嚴格的隔離防控措施,對短期經濟會產生明顯影響。
5)從2009年美國H1N1大爆發以及2003年「非典」期間美股、港股和A股表現來看,在疫情快速傳播期,股市會明顯調整,但幅度不會很大,且往往在疫情形勢好轉之前率先見底。
風險提示:1)計算結果對參數較為敏感;2)政策實施對疫情有較大影響。
一、如何定量評估流行病的傳染性強弱?——SEIR模型
SEIR是經典的流行病傳播模型,這裡我們只介紹其原理和框架,然後引用一些參考文獻的結論計算基本傳染數,而不對微分方程的推導過程展開討論。SEIR模型將整個社群人口分為四類:
易感人群S類:對該病毒沒有抗體,接觸傳染期人群可能被傳染;
潛伏期人群E類:被感染後處於潛伏期的人群,還沒有傳染性,平均時長記為TE;
傳染期人群I類:代表潛伏期之後已具有傳染性的人群,傳染期的平均時長為TI;
隔離態人群R類:治癒並獲得免疫或被有效隔離或死亡,既不能傳染他人也不能被傳染。
特別說明:
1)SEIR模型中潛伏期(E類)是特指已感染但還沒有傳染性的時期,設這一時期的平均時長為TE。但通常對潛伏期的理解是已感染但還沒有症狀的這段時間(衛健委專家表示新冠病毒的平均潛伏期在10天左右),本次新冠病毒已發生過在沒有症狀的時候傳染給下一個人的案例。國家醫療專家組成員、北京地壇醫院感染性疾病診療與研究中心首席專家李興旺表示,「從一般的呼吸道傳染病規律來講,潛伏期末期,病人將要發病的時候可能具有一定的傳染率,早期一般不應該有傳染性」。因此,本文假定平均為10天的無症狀潛伏期中,沒有傳染性的潛伏期平均為6.5天(參考了SARS的相關數據),最後的3.5天具有傳染性,計入傳染期TI。
2) 傳染期的平均時長TI是指病人具備傳染性後到不會接觸不特定的易感人群為止,比如住院或居家臥床等,而不是從病人發病到痊癒的時間。查詢了大量文獻,發現在對各類疫情建立SEIR模型時,設置的傳染期時長通常都在3到5天,甚至更短,這顯然不是病人發病到痊癒的時間,比如SARS很多患者都需要住院治療很長時間。這樣理解下,症狀越重的病毒其平均傳染期TI就越短,因為患者會很快住院或散失活動能力,而症狀越輕的病毒則可能傳染期較長。
假設一個傳染期的人(I類)與易感人群(S類)接觸後易感者被感染進入潛伏期(E類)的概率為β,一個處於潛伏期(E類)的個體單位時間內將以的概率轉變為傳染期(I類)個體,一個傳染期(I類)個體單位時間內將以的概率轉變為隔離態(R類)個體。
圖表1:SEIR模型
則病毒傳播的過程可由這四類人群變化的微分方程來刻畫:
其中S(t)、E(t)、I(t)和R(t)分別表示t時刻社群中處於易感染態、潛伏期、傳染期和隔離態個體數目,N表示社群中個體總數目,且N=S(t)+E(t)+I(t)+R(t)。據參考文獻,基本傳染數可表示為:
其中λ=ln(Y(t))/t是指數增長率,對某一t時刻發生的累計病例數Y(t)取對數,再除以t。潛伏期和傳染期時長可分別表示為Tg=1/γ1和TI=1/γ2,序列間隔(serial interval)則為Tg=TE+TI。記ρ=TE/Tg為潛伏期佔序列間隔的比例,則基本傳染數可進一步表示為:
計算基本傳染數R0需要確定的參數有:
λ:其等於ln(Y(t))/t,即需要知道第一例病例發生的時間(確定起點以便計算t),以及之後某一時刻的累計病例數Y(t)。
Tg和ρ:只要確定了潛伏期TE和傳染期TI,Tg和ρ就都確定了。
實際測算中,這三個參數都不好確定。由於基本傳染數R0是指沒有人為的防疫、隔離等幹預的情況下平均每個病人能傳染多少個人。在實際情形中,在流行病傳播初期沒有強力的人為幹預,但也就缺乏必要的研究和統計,對病毒的潛伏期、傳染期以及病例統計數據都很不精確,但R0的數值卻對這些參數卻非常敏感。
以非典為例,查詢估算SARS病毒的基本傳染數R0的文獻,發現估算結果從1.1到4.2之間的都有,在2到3之間的比較多。我們以文獻[1]中關於SARS的一組參數展示一下計算R0的過程:
文中以香港2003年3月28日累計病例數425為依據,2003年2月15日為香港首例病例,作為起點,即Y(41)=425,取Tg=10,ρ=0.6。
λ=ln(Y(41))/41=0.1476,代入到R0的計算公式可以得到R0=3。
那麼對於本次新冠病毒要怎麼確定參數呢?在政府採取強力幹預前,只有武漢地區有確診數據,但有多個證據都表明武漢前期的確診數據可能失真了。比如有文章統計,武漢新冠病毒患者死亡率是湖北省外其他地方的30倍,這明顯不合理。可見根據官方公布的確診數來定一個Y(t)值是不可取的。
二、基於已公開信息構建新冠病毒傳播預測模型
由於前期的確診數據可能失真較嚴重,需要從其他已公開信息來估算早期病例數,從而計算R0並對未來疫情發展做出定量預測。
從武漢遷出人群的發病率反推武漢的疫情規模
受啟發於外省市新冠病毒患者的死亡率明顯低於武漢從而推斷出武漢確診數據可能失真,作者想到從武漢遷出人口的發病率倒推武漢的感染人數。
根據百度地圖發布的遷徙大數據,1月14日到1月23日期間,以武漢為遷出點,取遷入人數最大的8個省市為分析樣本,這8個省市期間從武漢遷入人數都超過2萬,統計1月21日以來的確診病例數。可以看到,在1月24日之前,累計確診的人數跟武漢遷出的人口數沒有明顯的正比例關係,可以推測在前3天的確診數據可能受各地確診檢測效率的影響。
圖表2:從武漢遷出人口最多的8省市累計確診數據
來源:百度地圖,各地衛健委
進一步,統計8省市武漢遷入人口的發病率(平均每萬武漢遷入人口的確診數據),由於遷入的時間分布非常接近,如果各地確診數據都比較可靠的話,發病率應該比較接近。為了反映各地確診數據的一致性,統計每天8省市發病率的標準差/均值,這一比率越小,代表8省市確診數據的一致性越高。
從圖表3可以看到,8省市確診數據在1月25日之後一致性明顯提高,可能是因為確診檢測效率大幅提高了(1月24日首個新冠病毒檢測試劑盒通過檢驗,隨後多家企業開始生產)。發病率數據的一致性在1月28日達到最高,隨後開始下降。
這是因為1月28日之後的確診數據可能受當地第二代傳染病人的影響,各地疫情發展的狀況是不同的,之前的確診病例主要是處於潛伏期的武漢遷入人員。因此取1月28日的發病率(1月22日至28日累計確診數除以武漢遷入人口數)來反推武漢在1月14日至21日處於潛伏期的新冠病毒感染者比例。之所以取22日至28日一個區間的累計數據來反推,是因為單日的確診數據可靠性比較低,很容易受確診檢驗效率的影響,即有可能前幾天發病的患者後幾天才確診。
取8省市1月28日發病率的中位數32人/每萬武漢遷入人口作為參考(取平均數也很接近)在1月14日至21日期間,遷出的約300萬+最終留在武漢的900萬人口中,潛伏期的感染者人數期間平均值大約為 1100萬*32/7天 = 5257人。
圖表3:武漢遷入人口的發病率(平均每萬武漢遷入人口的累計確診人數)
來源:百度地圖,各地衛健委
圖表4:8省市武漢遷入人口發病率的標準差/均值
來源:百度地圖,各地衛健委
簡化微分方程組,建立數值模擬模型
逐一來理解四個微分方程:
1)第一個微分方程是刻畫易感人群(S類)數量變化的。理論上講,如果某一病毒基本傳染數R0大於1,在不加防控的情況下它會傳染幾乎所有人群,但隨著被傳染的人和已治癒有抗體的人越來越多,易感人群數量越來越小,傳播的速度就會下降,因為傳染期人群與易感人群接觸的機會會減少,因此理論模型中需要對易感人群的數量進行刻畫。但是在現實的疫情中,除了極少數失控的疫情,絕大部分情況下,已感染的人數(含已治癒隔離的)佔總人口的比例非常小,易感人群數量可以近似認為是不變的,等於總人口(S(t)=N)。因此這個微分方程可以省去。
2)第二個微分方程的意思是單位時間內潛伏期人群(E)的變化等於新增加的感染者減去由潛伏期過渡到傳染期的數量。表達成離散的形式如下:
其中β是平均每個病人單位時間內的傳染人數,則,整個傳染期能傳染多少個人,就是基本傳染數R0的定義。
3)第三個微分方程是單位時間內傳染期人群(I)的變化等於新由潛伏期過渡到傳染期的人數,減去從傳染期進入到隔離態的人數。表達成離散形式:
4)第四個微分方程是單位時間隔離態的人數等於新增的從傳染期進入隔離態的人數。離散形式:
由此,我們得到3個離散的方程式,反映的是三個狀態量的迭代關係,即如果知道所有參數值,就可以從t-1時刻推導出t時刻的值,確定一個起始點就可以得到整個序列。
數值模擬求解
三個迭代方程涉及到3個參數:β、γ1、γ2,根據它們的定義可以轉化為另外三個參數:R0、TE、TI,其中:
1)R0、TI作為優化的目標參數,參考各類文獻兩者的數值模擬區間分別為[2,7]、[3,8]。
2)對於潛伏期時間,各參考文獻中大多認為SARS的潛伏期為5到6.5天,但明確表明SARS潛伏期內沒有傳染性,國家衛健委專家表示新冠病毒潛伏期為10天左右,但潛伏期可能有傳染性,考慮到兩者都是冠狀病毒,專家也表示兩者有同源性和很多相似的地方,將新冠病毒無傳染性的潛伏期時間TE假定為6.5天(SEIR模型中潛伏期不具有傳染性,假定新冠病毒10天左右的無症狀潛伏期裡後面3.5天有傳染性,計入到傳染期)。
3)約束條件:a、
b、在1月14日至21日期間潛伏期人群的平均人數在5257左右。兩個待定參數,兩個約束條件,理論上是可以求解的。
4)模擬優化過程:參數R0、TI各自模擬區間內隨機取值,通過3個迭代方程可以計算出E(t)、I(t)、R(t)的時間序列(以2019年12月8日為起點出現首個確診患者),通過時間序列可以計算λ以及1月14日至21日期間潛伏期人數,判斷約束條件是否接近。大量模擬後取約束條件最接近的參數值,作為近似解。
參數優化結果:
基本傳染數R0比之前大多估計都高一些,傳染期在不加幹預的情況下長達7天,可能與有大量的輕症患者以及發病前夕無症狀時就具有傳染性有關。因為沒有症狀或者症狀很輕會使得病人不會停止活動、更不會住院,平均傳染期就變長了。
三、高傳染性下防控措施能達效果嗎?
自然傳染數是指在前期沒有額外的防疫幹預措施的情況下,平均每個病人能傳染的人數。根據傳播動力學:
其中k是一個有傳染能力的患者平均每天與易感人群的接觸次數,b是每次接觸傳染成功的概率,D是可以傳播的時間,可以認為等同於TI。
新冠病毒R0明顯高於SARS主要是因為平均每個病人傳播的時間更長
比較新型冠狀病毒和SARS,考慮到新冠病毒傳播初期剛好遇到春運,人員流動性高,假設單位時間接觸次數比SARS時期高10%。
圖表5:新型冠狀病毒與SARS對比
可見,新冠病毒明顯高於SARS主要是因為平均每個病人的傳染期時間更長,而單次接觸的傳染概率可能略低於SARS。新冠病毒傳染期格外長可能主要是因為其有大量的輕症患者,不會及時就醫或採取措施,而會較長時間處於活躍的傳染狀態。
國家衛健委的專家:「說它是新型冠狀病毒肺炎,不如說是新型冠狀病毒感染,因為檢測陽性的患者不見得一定出現肺炎。就像流感、重感冒,有的輕症患者不需要住院便能治癒。病例數雖多,但大多數都是輕症。」而恰恰是輕症患者較多增加了不小的防控難度。
對防控措施應該有信心
採取防控措施就是要降低k、b、D這幾個參數值,從而降低傳染數。雖然新增確診數還在不斷攀升,但從1月23日之後採取的一系列措施來看,我們應該對控制疫情有信心。在流行病傳播模型裡,只要將基本傳染數R0降到1以下,疫情就不會失控。
假定R0就如前文測算的5.38,遠高於SARS。首先,交通管制、取消聚會等措施使得人員流動大幅下降,單位時間的接觸次數k下降70%甚至更多都有可能。
其次,通過宣傳和提醒使得民眾對疫情具有極高的警惕性,有輕微症狀的患者大多也會儘快就醫,從而減少傳染期的長度,假設傳染期的長度由7天降為4天,則D下降43%。
第三,通過佩戴口罩、消毒等防護措施,單次接觸傳染的概率假如能下降30%。則傳染數就下降為5.38*(1-70%)(1-43%)(1-30%)=0.64,明顯小於1,疫情就能較快控制住了。事實上,WHO專家曾表示,中國在2003年非典期間後期,嚴格的防疫措施使得SARS的基本傳染數下降到0.4。
防控措施的效果體尚未體現到新增確診數
為什麼採取了這麼嚴格的防控措施,新增確診數還在不斷攀升呢?首先,可能由於確診檢測試劑盒上市較晚,一些地方的基層醫院缺乏確診的條件或者確診效率很低,造成確診數據失真。可能存在前些天發病的病例過了幾天才有條件確診,這就可能造成近日新增確診數大幅增加。
其次,1月24日採取了進出武漢的交通管制,之前大量的人口從武漢外流到各地,按照10天左右的潛伏期,現在是發病的高峰期,隨著他們的確診,跟他們密切接觸者大多會進入隔離觀察,隔離觀察者中還是會有比較多的潛伏期感染者,因此接下來新增確診數可能還會保持高位,直到這批隔離觀察者的潛伏期過去,被確診,之後的新增確診數就會大幅下降。從時間上看,可能要到2月10日之後。
以上海為例,其近日公布的新增確診病例中,大部分還是曾湖北居住或旅遊,說明目前新增的確診病例主要還是原來潛伏期的感染者,嚴格的管控措施產生的效果還沒有反映到新增確診數據上來。
圖表6:上海每日新增確診病例中有湖北居住或旅行史的佔比
來源:上海衛健委
四、基於數學模型的全國新冠病毒患病人數預測:我們能打贏這場防疫戰
利用前文建立的迭代方程組和估算的參數,可以對未來疫情發展進行預測。但在採取嚴格防控措施後,基本傳染數下降到什麼水平目前還沒有數據可以估算,因為新冠病毒的潛伏期比較長,當前的新增確診數據還更多地受之前潛伏期感染人數的影響。
疫情發展預測:中性與樂觀假設
中性假設:
1)假設自1月23日後,民眾減少出行和聚會,單位時間接觸次數下降50%,由於提高了對疫情的警惕,有輕微症狀的患者會及時就醫,使得傳染期的時長從7天降為4.5天,由於佩戴口罩、消毒等,單次接觸傳染的概率下降15%。則基本傳染數將從5.38降為1.47。
2)假設自2月15日起,由於隔離觀察制度的嚴格實施,大部分新增病例都在隔離觀察名單裡,基本失去了再次傳染的可能,基本傳染數下降到0.5,稍高於非典後期(WHO研究認為非典後期在採取嚴控措施後R0降到了0.4)。
樂觀假設:
1)假設自1月23日後單位時間平均接觸次數下降55%,其餘與中性假設1)不變。
2)假設自2月10日起,隔離觀察制度開始起作用,基本傳染數下降到0.4。
在這兩種假設下,可以對未來累計病例數、新增病例數等作出預測,結果如下:
1)當前(2月1日)估算的累計病例人數為22732人,與公布的累計確診病例相差較大,可能主要是因為前期缺乏高效的確診技術手段,疊加上流感季,武漢醫療資源嚴重不夠,加上新冠病毒的輕症患者較多,症狀跟感冒類似,可能未確診前就已經痊癒了。
2)預計未來新冠病毒總患病人數最高將達到88500人(中性假設下)或58000(樂觀假設下)人左右,新增確診人數將在2月17日(中性假設下)或2月11日(樂觀假設下)左右出現拐點。
3)當前新增確診病例數大幅攀升(新增病例超2500)可能與檢測確診效率提高有關,預計將很快回落(模型中性假設下預測值是1700左右)。1月25日之前,公布新增確診數大幅低於模型預測值,26日之後則大幅高於模型預測值,可能是因為確診檢測試劑盒供應充分了,將之前已經發病而沒有確診的病例確診了。如果看1月24到2月1日期間總的新增確診量,則模型預估和官方公布的數據很接近,分別為13469人和13582人。
圖表7:中性假設下模型預測的新冠病毒確診數和實際公布的新增確診數
數據來源:模型預測,國家衛健委
圖表8:樂觀假設下模型預測的新冠病毒確診數和實際公布的新增確診數
數據來源:模型預測,國家衛健委
疫情影響分析:需要足夠重視,但無需恐慌
比較過去20年發生的比較大的疫情,這次新型冠狀病毒的傳染性比較強,可能只弱於2009年發源於美國的H1N1流感。但從死亡率來看(以湖北省外的數據為參考),或許只高於普通流感,比其他幾類都明顯更低。但即使採用湖北省外的數據,新冠病毒的致死率也是普通流感的10倍左右。
因此,政府和民眾採取足夠重視的防控和防護措施是必要的,但也無需恐慌,2009年席捲全球的H1N1疫情,感染人數和死亡人數都非常之高,但由於致死率較低,也沒有引起很大的恐慌。
圖表9:過去20年全球較大的幾次疫情情況
數據來源:WHO,中國疾控中心,美國疾病控制和預防中心(CDC)
說明:2009年H1N1美國的數據是CDC事後建模預估的,當時由於疫情發展失控,沒有統計和確認病例數了,據事後的研究,當時H1N1在墨西哥境內死亡率為2%,在其他地區的死亡率為0.1%左右。
股市短期可能反應過度,若超跌是買入機會
2009年美國爆發H1N1流感疫情,最後完全失控。期間美國股市僅在2009年5月、6月有小幅回調,幅度-6%左右。美國股市對疫情衝擊反應較小。
2003年SARS疫情期間,港股和A股做出了明顯反應,下跌幅度-14%左右,但隨後都反彈明顯,且反彈時間領先於疫情拐點。可見,股市可能在情緒影響下短期反應過度,隨後會修復。
在1月23日發布的《關注新型肺炎「概念股」的估值偏差》文中提到,「事件性的、一次性的利好,即使對當期業績影響很大(盈利翻倍),對股價的理論影響也很小」,其實反過來也一樣,事件性、一次性的利空影響,對公司價值的影響也是較小的,股價不應該反應過度。當然利空與利好不同的是:短期利空(如收入劇減、資金回籠困難等)可能引起公司短期周轉困難從而引發更大風險。因此也建議政府相關部門出臺一些措施,對疫情中遭遇短期困難的企業給予支持和幫助。
圖表10:2009年H1N1流感爆發期間美股表現
數據來源:WHO
圖表11:SARS期間美股、港股、A股表現
數據來源:中國網
風險提示:1)計算結果對參數較為敏感;2)政策實施對疫情有較大影響。(來源:李迅雷金融與投資)
(文章來源:證券時報網)
(責任編輯:DF506)