為什麼新冠病毒模型死亡預測差異這麼大?

2020-12-25 騰訊網

大數據文摘出品

身處新冠肺炎疫情之中,每個人心裡都在問,疫情到底有多嚴重?全球又一共會有多少人死於疫情?

鑑於有關新冠病毒的大量研究和數據收集,我們似乎可以很容易地找到答案。

很簡單嘛,死亡人數=易感人群數*感染率*死亡率。把這三個數字弄明白不就可以啦。

真的是這樣嘛?

先讓我們來看看一些關於美國疫情的模型預測數字。

根據《紐約時報》的報導,美國疾控中心(CDC)使用模型來預測疫情前景,得到的最好情況是將會有20萬美國人死亡

而另一份來自倫敦帝國學院的研究報告,則因其基於模型的恐怖預測直接上了新聞頭條,這份報告認為,如果人們不改變愛聚集等習慣行為,那麼新冠病毒疫情將造成220萬美國人死亡

不得不說,這兩種預測有著驚人的差異。這種差異就像是美國每年因受傷和暴力而喪生的人數和其他國家因戰爭而死亡的人數之間的差距。換句話說,一個是我們日常生活中面對的數字,而另一個則會永遠改變一個國家

那麼,為什麼差距如此之大?這就不得不說到模型這隻「小怪獸」的本質

使用數學模型來預測未來對專家來說很有價值,即使各種模型之結果可能存在巨大差異。

不過,要弄清這些不確定的結果及其隨時間的變化並不總是那麼容易,而且這麼燒腦的東西可能還有害身心。這就是為什麼我們要探究流行病模型,希望你了解這種不確定性後可以更好地理解各種預測。

回到我們的簡單數學模型。

死亡人數=易感人群數*感染率*死亡率

N(死亡) = N(易感人群) * 感染率 * 死亡率

看上去挺簡單的吧。然而,當你開始嘗試填入變量的值時,你會發現你根本不知道該填什麼。每個變量都有多種選擇,也取決於各人的知識差距。

比如基本的數據輸入。不同的國家和地區以不同的方式收集數據。沒有一個統一的表格可以讓我們輕鬆地比較世界各地的病例和死亡情況。即使在美國,許多醫生也認為因新冠病毒而死亡的人數遠超真正上報的數據。

類似的情況還存在於各國的檢測機制中。一些國家提供檢測給任何想要進行檢測的人,其他則不是。這使我們很難真正了解到底多少人實際感染新冠病毒以及有多少人檢測呈陽性。

而且,病毒本身的傳染性是無法預測的,其對某些社會群體的傷害會更大。這意味著,病毒的社會影響將由各地的人口統計特徵和醫療保健渠道所決定。

讓我們來具體看看這個模型涉及的數據吧。

病死率

一些人死於新冠病毒」,這也許是我們在這裡可以做的最後的一個絕對陳述。

很可惜,「一些」不是數字,不能用來進行數學計算。

事實上,從疫情一開始就計算病毒的致死率是不準確的。各社會群體之間的病死率差異很大。加州大學舊金山分校的生物統計學家Rae Wannier表示:「由於年齡是一個很重要的因素,你必須根據美國人口構成以及併發症的發生率來調整病死率。」(併發症是可能加重新冠病毒影響的其他潛在病症。)

換句話說,不是只有一個「病死率」,而是有很多個。美國的病死率將不同於糖尿病發生率較低的國家的病死率。同樣地,美國國內各地區的病死率也是這樣。如果病毒在有大量老齡人口的城市傳播,其病死率會比人口較為年輕的城市要高

但是,讓我們先看看全球的情況。中國或義大利的新冠病毒死亡率是否可以用來確定美國的病死率呢?當然有一定的幫助,但這只是降低了不確定性,並不能使其確定。

當然,不管怎樣,我們都不太可能知道這些地方確切的病死率。這其中有多種原因,首先是收集到的有關新冠病毒病例的基本信息並不準確。這些數據是許多主觀選擇的結果,而這些主觀選擇必須清楚且詳細地記錄下來,然後才可以認為這些數據是準確的。如何收集數據以及每次是否以相同的方式收集數據都是很重要的。

此外,未收集或不準確的數據也是個問題。要確定病死率,必須將死於該疾病的人數除以感染該疾病的人數。這裡,我們並沒有確切的受感染人數統計信息。因此,從數學角度來說,我們不知道分母是多少。(嚴格來說,我們可能也不確切知道分子是多少,但是我們可以假設病死人數比較接近正確值。)

鑽石公主號遊輪上的數千名乘客接受了新冠病毒的檢測。其結果可以給我們推斷其他情況的感染率和病死率做參考,但這種類比並不完美,因為大多數感染情況並不是發生在遊輪上。

在理想情況下,我們將測試群體中每個人是否感染了新冠病毒,從而可以肯定地知道有多少人感染,以及有多少人因此而死亡。但是,目前僅有極少數情況可以這麼做。以鑽石公主號為例,這艘遊輪在新冠疫情爆發後被隔離,船上幾乎所有人員都接受了檢測(3,711人中採集了3,063個樣本)。

鑽石公主號就是一個活生生的實驗室!它具有上文所述的那種數據記錄條件,這在實際情況中通常不會遇到。研究人員不僅能夠知道有多少人感染,而且還能知道有多少人完全沒有症狀,因此可以推斷出,在其他疫區可能有多少未檢測,未確診和未計算的人數。

這種特殊環境得到的結果表明,有很多人並不知道自己已經感染新冠病毒,因此病死率比其他檢測數據的結果要低。鑽石公主號上已確診並有症狀人群的病死率是2.3%,但是所有已確診病例(包括無症狀的病例)的病死率為1.2%。在冰島,一家名為deCODE Genetics的公司於3月13日開始為普通無症狀人群提供免費篩查。截至3月29日,deCODE 在8694份檢測樣本中檢出71名感染者,其中包括無症狀感染者。

同時,有症狀人數的比率(有症狀和無症狀的人數比)很重要,我們現在對此大多只是猜測。倫敦帝國理工學院的報告假設,三分之二的病例出現症狀就足以引起感染者的重視並進行自我隔離。從鑽石公主號的數據可以看出,確診時有一半的病例是有症狀的。有症狀人數比率的實際數字可以改變病死率的計算。

不過鑽石公主號的數據也並非完美,他們並沒有對所有人進行檢測,這種人口統計數據也不能代表廣大的人群。而且某些仍在治療的乘客仍然可能會死亡,這會增加病死率。但是目前在世界範圍內還找不到更可靠的統計數據。冰島的數據尚未公布是否以相同程度的方法進行採集。

在美國,這種廣泛的測試才剛剛開始,這確實很重要。但如果像某些州那樣主要對有症狀患者進行檢測,則得到的病死率將無法反映實際死亡情況(還是分母的問題)。並且在全美進行的測試還受到其他阻礙,例如普遍缺乏可用的檢測試劑盒以及某些私人實驗室不提供檢測呈陰性的人數

真實病死率還受到對重症患者救治能力的影響,這取決於醫院的綜合水平。如果重症患者都可以進ICU並使用呼吸機,那麼許多都是可以搶救回來的。但是ICU床位和呼吸機等資源是相對稀缺的,如果供不應求(某些地區已經是這樣的了),那麼沒有呼吸機的人就可能會死亡

這還會產生連鎖反應,其他事故或緊急情況的病人也可能會因缺乏醫院資源而受到影響,那麼某些可預防的死亡情況(與新冠疫情毫無關係)也將導致總體死亡人數增加,即使這不算作新冠疫情的死亡人數。

Wannier說:「物資供應和人員最終是否會短缺會極大地影響死亡人數,我們的醫療系統是否有足夠的承受能力也還不清楚。

感染率

關於死亡率的結論也適用於感染率:估值都會受到數據收集、抽樣和有症狀者比率的影響。

要知道感染率,我們必須找出病毒從一個人轉移到另一個人的頻率。你可能已經聽說過「基礎再生數」這個術語,即R0,這是追溯到易感人群中每個被感染者導致的新感染人數的平均值

首先,感染率取決於傳播方式。傳播方式可能的變化很大,又取決於各種社會行為,環境和政治決策。從一個國家到另一個國家,從一個州到另一個州,情況可能會不盡相同。它會隨著時間的推移而變化,這取決於我們採取何種措施來對抗該病毒。例如,在積水很多的地方,瘧疾的基礎複製數量更高。

因此,對冠狀病毒的潛在結果進行建模意味著要找出許多不同的傳播方式。這又涉及了更多變量。

比如說,接觸率。也就是在一個給定時間內與被感染者接觸的人數。這是人們唯一可以控制的事情,這就是為什麼每個人都居家隔離並保持社交距離的原因。

每個人的接觸率都不相同,這具體取決於他們的生活狀況和工作等因素,並且會根據公共衛生幹預措施和地點而變化。

然後是每例接觸的傳染率。不同的接觸場合會導致完全不同傳染率。很容易想像,露天馬拉松和教會活動的傳染率就會大不相同。

再來,還需要考慮有症狀比率。有些人認為,無症狀攜帶者的感染力不如出現症狀的人,因此有症狀比率也與傳播率有關。

當你嘗試計算接觸傳播時,病毒生物學也很重要。其中包括病毒可以在某個表面上生存多長時間,還有它可以在空氣中飛多遠。然後還有個體行為帶來的差異。

例如,吸菸者可能更容易受到病毒感染。他們的肺部可能更為脆弱。另外,由於吸菸,他們的手也更容易與嘴接觸。

最後,還有傳染性的持續時間:一個患者可以持續傳播多久?以及在發病過程中何時會存在傳染性?俄亥俄州立大學流行病學和人口健康計劃的負責人馬克·威爾說,這取決於病毒生物學和個體免疫系統。

所有這些參數都用於估算R0,即病毒的基礎再生數。

雖然基礎再生數假設所有人都易感,但一個有效的複製數量,取決於有多少人口易感。如此之多的人群被視為易感人群的原因之一是,以前都沒有人得過新冠肺炎。

一個好的模型還需要考慮再感染的問題:如果感染了這種病毒並康復的人對再次感染產生免疫,那麼易感人群就會減少。但是到目前為止,我們對這種病毒的感染後免疫性了解不多。

如果疫苗之類的東西被製造出來,易感性就又不一樣了。好了,我們已經說得足夠複雜啦。

綜合建模

要建立模型,你必須集成所有這些變量,並考慮它們的不確定性,它們彼此之間的關聯程度以及各種其他因素。

所有這些因素都可能會受到我們採取的幹預措施的影響,這些幹預措施包括社交距離,洗手,停課等。這是一個巨大的未知因素,可以極大地改變疫情爆發的形態,而且也會因國家,州甚至城市而異。

讓我們把它想像成做餡餅的過程。如果你有正規的菜譜,就可以很輕鬆地完成。但是,如果菜譜中說「根據你手頭上有的食物,添加3到15個切碎的蘋果,或者牛肉,或者白菜」,你還知道你做出來的是什麼貨色麼?

當然,你可以對正確的原料和數量作出假設。但記住哦,這只是假設。假設越多,最後餡餅的味道也會差得更遠。

在接下來的幾個月中,你一定還會陸續看到各類關於新冠肺炎的預測。他們不會全部一致。但是,僅僅因為它們基於假設並不意味著它們就一文不值。

畢竟,「所有模型都是錯誤的,但有一些卻很有用。

相關報導:

https://fivethirtyeight.com/features/why-its-so-freaking-hard-to-make-a-good-covid-19-model/

- DataCastle -

相關焦點

  • 全球確診新冠逾813萬,模型預測10月美國死亡數超20萬
    美國一項備受關注的預測模型顯示,到今年10月1日,美國新冠死亡人數預計將超過20萬;義大利羅馬現多起群體感染事件;因死亡人數兩天超過100例,伊朗或重新採取強硬的封鎖措施;為防止疫情擴散,土耳其42省被強制要求戴口罩。印度新德裡衛生部長出現感染新冠症狀。
  • 美國最新疫情預測模型顯示,死亡人數比之前預測的要高10%
    來源:福布斯中文網文/Lisette Voytko華盛頓大學新冠疫情預測模型更新了新冠肺炎死亡人數。本周三,該模型納入養老院疑似增長的新冠致死人數,死亡人數由此上調10%。該模型預計,美國到8月因新冠肺炎而喪生的人數將達到66,000。根據最新疫情預測模型,美國死亡人數將上調10%。圖片來源:視覺中國重要事實預測模型由華盛頓大學健康指標與評估研究所開發,所用數據包括了約翰斯﹒霍普金斯大學、世衛組織、各國政府提供的死亡人數統計。
  • 北京大學王亞沙:新冠肺炎傳播預測模型
    北京大學王亞沙帶來報告《新冠肺炎傳播預測模型》。王亞沙,博士、北京大學軟體工程國家工程研究中心副主任、教授、博士生導師,中國計算機學會高級會員、普適計算專委會常委、國家大數據標準委員會技術專題組組長。報告內容:首先介紹建立新冠病毒疫情分析預測的意義、數據來源和數據預處理方法,然後介紹報告人及團隊建立的多種疫情數據分析方法和疫情預測模型,接下來分湖北、湖北域外地區對模型預測結果進行了對比和討論,最後探討了相關方法和模型的可擴展性及其在其它領域的應用潛力。
  • 疫情拐點何時出現——基於數學模型的新冠病毒傳播預測
    2)對於潛伏期時間,各參考文獻中大多認為SARS的潛伏期為5到6.5天,但明確表明SARS潛伏期內沒有傳染性,國家衛健委專家表示新冠病毒潛伏期為10天左右,但潛伏期可能有傳染性,考慮到兩者都是冠狀病毒,專家也表示兩者有同源性和很多相似的地方,將新冠病毒無傳染性的潛伏期時間TE假定為6.5天(SEIR模型中潛伏期不具有傳染性,假定新冠病毒10天左右的無症狀潛伏期裡後面
  • 明年4月1日 美國或將有超56萬人因新冠肺炎死亡
    來源:央視當地時間12月18日,根據華盛頓大學的新冠病毒模型預測,到2021年4月1日,或將有562000名美國人死於新冠肺炎,這個數字大大高於上周預測的同樣截至4月1日的502000例死亡病例。根據衛生計量與評估研究所(以下簡稱IHME)的模型顯示,預報中新冠肺炎死亡病例增加的原因是近期病例和死亡人數激增,加利福尼亞州的上升幅度尤其大,這給醫院系統帶來了巨大的壓力。根據IHME預測,從今年12月至明年4月,美國將有47個州的醫院病床容量承受極端壓力,有49個州的重症監護病房不堪重負。
  • 生命方程式:新冠病毒大流行後面的數學模型方程
    在當前新冠病毒大流行的情況下,全世界許許多多的人,從各國政要到普通老百姓,都在思慮與談論著這場病毒大流行的種種趨勢。在病毒流行開始的國度,人們談論的流行趨勢會將是如何地增長、拐點將何時出現;在病毒流行發生拐點的的國度,人們談論的流行趨勢是將最後如何平息。簡言之,人們關心的是就如下圖所示的當前新冠病毒流行曲線的走向是怎麼樣的趨勢。
  • Nature深度用數據模型預測可怕結果
    智東西4月7日消息,當前全球累計新冠肺炎確診病例已超過135萬,現有確診病例995480例,逼近百萬大關!回顧最近一個月的全球防疫戰,多個政府態度來了180度大轉彎,英國即是其中的典例代表。不過,雖然英國的防疫措施正走向正軌,但不幸的是鮑裡斯自己已經感染新冠肺炎,希望其早日康復。▲英國首相鮑裡斯·詹森同樣的模型表明,如果不採取行動,美國可能面臨220萬人死亡。美國政府也迅速對人們行動採取嚴格的新管控措施。
  • 美媒:頂級模型預測,美國下月新冠死亡病例將增加15萬例
    【環球網報導 記者 張曉雅】新冠確診病例超2030萬例、死亡病例逼近35萬例,據美國《國會山報》報導,一項頂級模型預測,預計美國將進入新冠疫情最糟糕階段,下月死亡人數可能將增加15萬人。華盛頓大學健康指標與評估研究所預測顯示,美國未來一個月死亡人數可能會遠遠超過去年12月創下的紀錄。2020年12月,美國累計新冠死亡病例約77500例。
  • 最新研究:新冠病毒可在手機屏上存活一個月!
    全球新冠超3770萬例據美國數據統計網站Worldometer實時統計,截至北京時間10月12日6時30分左右,全球累計確診新冠肺炎病例37705125例,累計死亡病例1080602例。其中,美國累計確診新冠肺炎病例7986903例,累計死亡219676例。與前一日6時30分數據相比,美國新增確診病例38613例,新增死亡病例306例。近日美國各地新冠肺炎病例激增,有當地急診醫師擔心這可能意味著疫情將迎來「可怕的第二波」。
  • 柳葉刀|壓力荷爾蒙或可預測新冠感染者死亡風險
    研究者建議,皮質醇或可作為獨立的重症預測指標!為什麼是皮質醇皮質醇是腎上腺分泌的一種糖皮質激素,是幫助人體在壓力下「應激」的最重要激素。健康人安靜時皮質醇水平為100-200 nm / L,而睡眠時幾乎為零。顯然,這是一種波動性很大的激素。
  • 帝國理工預測新冠死亡病例數,美國鄉村疫情加劇_健康界
    迄今全球已超過350萬例新冠肺炎(COVID-19)病例和近25萬例死亡,近期(5月3日),英國帝國理工學院發表題為:「Short-termforecastsofCOVID-19deathsinmultiplecountries」的預測研究,預測未來一周報告的死亡人數,並分析了51個新冠傳播活躍國家的病例報告趨勢。
  • 中藥國家隊建立新冠病毒肺炎動物模型,為中醫藥抗疫提供實驗室數據...
    目前中國中醫科學院中藥研究所的ABSL-2生物安全實驗室建立了人冠狀病毒肺炎疫毒襲肺證病癥結合小鼠模型,並通過該模型評價了數十個中藥品種,包括國家級與省級新型冠狀病毒肺炎中醫藥防治方案推薦用藥
  • 老年人口預測模型與中國應用
    目前多數機構和學者,包括聯合國,均利用歷次全國人口普查的資料和近年《中國統計年鑑》公布的人口資料,根據不同的人口政策目標參數假設,即今後可能的人口政策取向,對未來我國人口老齡化的變化趨勢進行預測。由於使用的方法或選取的生育率、死亡率、遷移率的參數不同,人口預測結果往往並不一致。採用的方法主要有灰色預測模型、VAR模型、微分方程人口控制模型、多元回歸方程模型、隊列要素法等。
  • ...消息:美國新冠病毒確診超166萬,死亡人數逼近10萬,川普2016年...
    疫情最新消息顯示,據美國約翰斯·霍普金斯大學發布的全球新冠肺炎數據實時統計系統數據,截至美國東部時間5月25日晚6時,全美共報告新冠肺炎確診1660072例,死亡98034例。過去24小時,美國新增確診19442例,新增死亡355例。
  • 全球新冠病毒感染人數突破812萬 模型預測10月前美國...
    Worldometers世界實時統計數據顯示,截至北京時間6月16日15時33分,全球新冠肺炎累計確診病例超過812萬例,達到8128488例,累計死亡病例超過43.9萬例,達到439421例。  據美國有線電視新聞網(CNN)6月15日報導,美國一項備受關注的預測模型顯示,到今年10月1日,美國新冠死亡人數預計將超過20萬。模型還顯示,預計9月及10月的單日死亡人數將大幅上升。  華盛頓大學衛生統計評估研究所的一個模型預測,截至10月1日,美國預計將有201129人死於新冠肺炎,死亡病例的浮動範圍是171551例至269395例。
  • 谷歌用人工智慧技術預測病患死亡時間 到底是福是禍?
    生老病死是自然規律,死亡更是人類不可避免的過程,那麼死亡是否可以預測呢?在古代有不少奇人異士聲稱可以推算出壽命長短,但那畢竟沒有什麼科學依據。這兩年,越來越多的AI系統聲稱可以預測人的死亡時間,而且準確率越來越高。
  • 劍橋AI模型證明口罩逆天作用:100%人戴口罩,疫情不會擴散!
    為什麼中國和韓國可以在短時間內就壓制住病毒?為什麼日本在社會秩序照常的情況下疫情甚至一直不溫不火、沒有爆發?為什麼擁有發達醫療資源的歐美社會在疫情傳播過去之後一潰千裡?在本周發布的一項新的預印本研究中,劍橋大學,倫敦大學學院,巴黎高等經濟學院,香港科技大學和芬蘭家庭聯合會的研究人員提出了兩種人工智慧模型,旨在預測戴口罩對新冠病毒傳播的影響。
  • 為什麼需要動物模型來幫人類「試藥」?
    在藥物研發階段,科學家通常會人為建造各種帶病實驗動物體,通過觀測藥物在這些動物身上的作用效果,來初步預測藥物作用於人類的效果。為什麼需要動物來幫人類"試藥"?中科院雲南省動物模型和人類疾病機理重點實驗室主任陳策實表示,人類疾病的發生和發展十分複雜,以人本身作為實驗對象來深入探討疾病發生機制,在時間和空間上都存在局限性,許多實驗在倫理道義上和方法上也受到限制。而藉助於動物模型的間接研究,可以更方便、更準確地觀察模型的實驗結果並與人類疾病進行比較研究,有助於更有效地認識人類疾病的發生發展規律,找到防治措施。
  • 模型說:到秋天,美國新冠死亡人數將達到20萬,發生了什麼變化?
    白宮使用的一種有影響力的華盛頓大學模型預測,到10月1日,美國全國冠狀病毒死亡人數將超過20萬。美國健康指標與評估研究所模型預測,到10月1日,美國將有201129人死於冠狀病毒。麥卡奇奇新聞此前報導,該國早些時候曾預測到那個日期有169890人在美國死亡。幫助創建該模型的人說:「流動性的增加和社會距離的過早放鬆導致了更多的感染,我們在佛羅裡達州,亞利桑那州和其他州看到了這種感染。」「這意味著更多的預計死亡人數。」
  • 美報告日增確診病例超40萬 模型預測明年4月累計死亡超56萬例
    美報告日增確診病例超40萬 模型預測明年4月累計死亡超56萬例 2020-12-21 14:23:39參與互動   綜述:美報告日增確診病例超40萬 模型預測明年