COVID-19學術科普專題:計算實時再生數

2021-01-10 騰訊網

在前面我們已經介紹了基本再生數（R0）的原理和計算，詳情請點擊以下連結：

《COVID-19專題：關於R0，你想知道的都在這裡》

由於R0通常只用於估計傳染病早期的傳播力，為了遏制傳染病的流行，制定更為合理的防控措施，需要有一個指標能夠實時反映傳染病在人群中的傳播力，這個指標通常使用實時再生數（Time-dependent reproduction number, Rt）。

Part 1

什麼是Rt？

Rt是指t時刻平均一個發病的病例能夠導致的新發病例數。t表示一個時間單位，可以是小時、天、周等，最常使用的是天，也就是計算每一天的再生數。若Rt小於1，表示維持當前防控措施可以逐漸控制傳染病流行；若Rt大於1，表示傳染病將持續擴散，提示防控措施需要優化和加強。

Part 2

怎麼計算Rt？

Rt的概念發展了很多年，計算的方法在不斷改進，也在不同的統計軟體開發了多種算法。下面，我們利用R語言軟體中的「EpiEstim」包，基於貝葉斯框架，對Rt進行計算。

數據準備

數據的結構根據不同的情況有所差異。若是第一個時間點之後的病例均來自本地傳播（如COVID-19前期在武漢的流行），則僅需要2列數據，一列為發病（症狀出現）時間，一列為每天的病例數。但是，多數地方可能存在持續的輸入病例、由輸入病例導致本地病例的情況，這種情景至少需要3列數據，一列為發病（症狀出現）時間，一列為每天的輸入病例數，一列為每天的本地病例數。如表1所示，date表示發病日期，imported表示輸入病例數，local表示本地病例數。

表1 數據結構示例

計算Rt

計算Rt還需要一個特別重要的數據，就是代際時間分布（詳見「COVID-19專題：關於R0，你想知道的都在這裡」）。我們根據有無個案代際時間，將Rt的計算分為2種情況。前者可利用部分或全部病例的代際時間獲得分布；後者根據文獻已有的參數形成分布。

有個案代際時間的Rt計算

通過流行病學調查等方法，可以獲得病例的傳播關係，獲得案例之間的代際時間（如果只有部分關係，可理解為從整體中抽樣）。在「EpiEstim」包中，可以利用馬爾科夫鏈蒙特卡洛方法(Markov Chain Monte Carlo，MCMC)取得對這些代際時間進行重採樣。計算代際時間前需要將數據資料整理成類似表2的數據框。表2中每一行數據代表一個由感染者和被感染者組成對子。EL表示感染者發病時刻（整數型）的下邊界，ER表示感染者發病時刻的上邊界（ER≥EL，感染者在ER至EL期間發病）；SL表示被感染者發病時刻（整數型）的下邊界，SR表示被感染者發病時刻的上邊界（SR≥SL，被感染者在SR至SL期間發病）；type包括0,1,2，分別表示雙側不確定（感染者和被感染者的確切發病時間均未知）、單側不確定（感染者和被感染者只有一方有確切發病時間）和確切觀測（感染者和被感染者均有確切發病時間）。

表2 個案代際時間數據

由於公開數據中可獲得的COVID-19的代際時間對子較少，我們模擬了一些數據進行分析。

首先，基於MCMC對個案代際時間進行重抽樣。該過程依賴於利用dic.fit.mcmc函數，dat參數指定數據(si_data表示代際時間數據，結構如表2)，dist參數指定初始分布為gamma分布，init.pars為初始設置，burnin為去除初始抽樣的次數（初始抽樣不穩定），n.samples為重抽樣次數，seed為種子數。

code

library(EpiEstim)

library(coarseDataTools)

MCMC_seed

#使用MCMC進行重抽樣#

SI.fit

init.pars = init_mcmc_params(si_data, "G"), burnin = 1000,

n.samples = 5000, seed = MCMC_seed)

然後，將重抽樣結果通過coarse2estim函數轉化為所需要的格式，再放入estimate_R函數中進行計算Rt。estimate_R函數中，incid表示病例數據；method為代際時間的確定方法；si_sample為MCMC重抽樣之後的數據；config為貝葉斯框架的參數設置，n2表示後驗分布的採樣次數，seed表示種子數。

code

si_sample

overall_seed

R_si_from_sample

method = "si_from_sample",

si_sample = si_sample,

config = make_config(list(n2 = 50,

seed = overall_seed)))

plot(R_si_from_sample, legend=FALSE)

結果可以通過三個圖進行展示，分別為流行曲線圖、Rt圖，代際時間分布圖。

無個案代際時間的Rt計算

若無個案代際分布時間，可以參考一些已有的研究，如中國疾控中心團隊在《新英格蘭醫學雜誌》發表的文章發現，COVID-19的代際時間符合gamma分布，均值、標準差分別為7.5和3.4。

以某市公開的COVID-19個案數據為例，計算Rt。由於某市的病例持續存在輸入病例，我們需要區分本地和輸入病例。Incid表示病例數據，需要指定本地病例和輸入病例；代際時間分布的方法選擇參數法parametric_si；config確實參數，mean_si和std_si分別表示代際時間分布的均值和標準差，t_start和t_end用於設置平滑時間。由於每天的Rt波動較大，通常需要對其進行滑動計算，下例表示滑動時間為10天，若不設置t_start和t_end則默認平滑7天。

code

covid19.R

method = "parametric_si",

config = make_config(

mean_si = 7.5,

std_si = 3.4,

t_start = 2:(nrow(data)-10),

t_end = (2+10):nrow(data)))

plot(covid19.R,legend = FALSE, add_imported_cases = TRUE,

options_I = list(col = c("imported" = "red", "local" = "black"),

interval = 1,

ylab = "Incidence"), options_R = list(ylab = "COVID-19 R"))

從結果上看，某市Rt有波動，曾一度接近1，隨後快速下降，全程Rt均保持在1以下。這表明, 某市儘管面臨巨大疫情輸入壓力，但及時採取了一系列強有力防控的措施，有效地控制COVID-19本地疫情傳播，使之在低位水平發展。

出於分析或展示的需要，我們可以從計算結果中將Rt的數據提取出來，保存為數據框。提取數據的代碼如下：

code

dataRgd

RL=covid19.R$R$`Quantile.0.025(R)`,

RH=covid19.R$R$`Quantile.0.975(R)`,

date=seq.Date(from = as.Date(data$date[nrow(data)])-length(eR)+1,

to = as.Date(data$date[nrow(data)]),by="day"))

我們將數據提取出來後，用ggplot2進行重新繪圖。後面我們將針對COVID-19推出可視化的專題，歡迎大家繼續關注。

參考文獻

[1] Thompson R N, Stockwin J E, van Gaalen R D, et al. Improved inference of time-varying reproduction numbers during infectious disease outbreaks[J]. Epidemics, 2019, 29: 100356.

[2] LiQ, Guan X, Wu P, et al. Early transmissiondynamics in Wuhan, China, of novel coronavirus–infected pneumonia[J]. NewEngland Journal of Medicine,2020.

[3] 何冠豪,容祖華,胡建雄,劉濤,肖建鵬,郭凌川,曾韋霖,朱志華,龔德鑫,殷李華,萬東華,吳君樂,康敏,宋鐵,何劍峰,馬文軍.新型冠狀病毒肺炎兩種不同流行模式及其防控效果比較：基於廣州和溫州市的分析[J].中華流行病學雜誌,2020.

製作：胡建雄、何冠豪

審核：劉濤、肖建鵬

指導：馬文軍

關於我們

《數據分析和應用》公眾號隸屬於廣東省公共衛生研究院，旨在分享數據分析方法、案例應用，並總結實踐經驗。團隊學科背景包括衛生統計學、流行病學、環境衛生學、衛生管理學等，具有紮實的統計基礎，歡迎共同開展各類研究。

掃碼關注我們

郵箱：statistic@gdiph.org.cn

相關焦點

小學數學專題總結——數和計算

數和計算的相關內容，往往是小學數學中最關鍵、最基礎的部分，也是小學數學總複習階段最先複習的內容。接下來的內容，對「數和計算」這一專題進行一下總結概括，希望能夠對今年的小學畢業生進行總複習起到點撥思路的作用。一、數和數位小學範圍內的數可分為整數、小數、分數三種。小學範圍內的整數又稱「自然數」，指的是大於或等於0的所有整數。
【Economist】Covid-19 in 2020: The plague year

Another reason to expect change—or, at least, to wish for it—is that covid-19 has served as a warning.
【English Paradise】Chaguan: The stigma of covid-19

-19 in Xicheng, a district of Beijing.At the time of writing, Beijing has detected 44 cases of covid in the past month, after millions of tests. For comparison, London is finding more than 8,500 new cases a day.
Covid-19藥物治療的系統回顧和薈萃分析

Covid-19藥物治療的系統回顧和薈萃分析作者：小柯機器人發布時間：2020/7/31 23:04:52 加拿大麥克馬斯特大學Reed AC Siemieniuk團隊對covid-19的藥物治療進行了生活系統回顧和網絡薈萃分析
床旁診斷系統在COVID-19中的應用現狀—最新外文文獻翻譯

2020年9月23日，美國食品和藥物管理局（FDA）針對COVID-19的血清（抗體）床旁診斷（POC）測試發布了緊急使用授權（EUA）。自2020年7月以來，某些實驗室被授權將Assure COVID-19 IgG/IgM快速測試設備用於緊急情況下的抗體診斷，以幫助鑑定患者是否攜帶SARS-CoV-2抗體，以此反應患者近期或曾感染過COVID-19。
美國COVID-19疫苗研究最新進展

疫苗臨床試驗中期結果前景良好: 獨立的數據和安全監控委員會（DSMB）負責監督研究性COVID-19疫苗mRNA-1273的三期試驗，該委員會於2020年11月15日審查了試驗數據，並與試驗監督小組分享了其中期分析。
周濤:武漢肺炎基本再生數與SARS接近,確屬可防可控的傳染病

本文接下來分成五個部分：（1）簡單介紹一下什麼是再生數，以及對為什麼對於流行病控制而言，再生數最重要；（2）如何計算再生數；（3）具體用了哪些數據，算出來的結果是多少；（4）這個結果和其他疾病以及SARS比較是大是小；（5）為什麼說這是可防可控的，我們老百姓自己要注意什麼。一、什麼是再生數？
Covid-19血清學檢測診斷準確性的系統回顧和薈萃分析

在用於估計特異性的樣本中，83％來自流行之前或未懷疑有covid-19的人群。在LFIA中，商業試劑盒的合併敏感性為65.0％，低於非商業檢測的敏感性（88.2％）。在所有分析中都可以看到異質性。症狀發作後至少三周的敏感性為69.9-98.9％，顯著高於第一周（13.4-50.3％）。
UPDATES|PNG reports fourth COVID-19 death, French Polynesia ca..

p=pacnews&m=read&o=11289740125f3f1de2b2d23bc1e1412 NEW COVID-19 CASES REPORTED IN PNG TODAYhttps://covid19.info.gov.pg/index.php/2020/08/20/12-new-covid-19-cases-reported-in-png-today/or https:
中國力學學會2020年學術活動計劃

3月27-29日杭州5第五屆全國顆粒材料計算力學會議3月27-29日武漢6第五屆全國計算力學青年學術研討會3月27-29日南京7第二屆計算材料與力學專題研討會4月3-5日杭州8全國首屆極端力學學術會議4月10-12日
Are People Having Sex Susceptible to a COVID-19 Infection?

There is no evidence that the virus causing COVID-19 related infections is present in the semen or testicles of men.
NASA超級計算機助力COVID-19研究

美國國家航空航天局（NASA）正在發揮其超級計算能力的能力，以幫助解決關於COVID-19的一些最緊迫的問題，包括關於病毒如何與人體細胞相互作用的基礎科學、遺傳風險因素和潛在治療藥物的篩選。NASA已加入了一個機構聯盟，該聯盟正致力於將超級計算機資源與利用高端計算進行COVID-19研究的提議相結合。這項工作由白宮科學技術政策辦公室（White House Office of Science and Technology Policy）組織，參與的業界合作夥伴包括IBM、惠普企業、亞馬遜、微軟等。除此之外，能源部國家實驗室、國家科學基金會和許多大學也參與到了這項工作中。
積極發現與管理病例:遏制COVID-19大流行的關鍵措施

COVID-19的嚴重性和威脅研究顯示，COVID-19比季節性流感更嚴重、傳染性更強（表1），它的基本再生數（R0）是後者的2倍。[8,15]季節性流感通常是自限性的，僅1.8%的病例需要住院。[20]但是，在中國超過一半的COVID-19報告病例出現肺炎並需要住院。
「covid-19獻血群」裡好熱鬧!10名新冠肺炎康復者陸續獻血漿

2月28日，武漢市第四醫院楊莉、安坤龍、江金宇這三位工作人員的獻血照片一發到「covid-19獻血群」，群裡再次熱鬧了起來。三位獻血者同時捐獻血漿楊莉、安坤龍、江金宇都是武漢市第四醫院「covid-19獻血群」的成員，剛剛過了隔離期的他們，碰巧被安排到同一天在武漢血液中心進行恢復期血漿捐獻。
如何計算COVID-19的死亡人數?

美國國家醫學檢驗師協會（NAME）主席薩莉·艾肯博士說，許多COVID-19死亡證明正在由醫生處理，除非死亡發生在醫院外，在這種情況下，驗屍官或驗屍官會介入。在一些司法管轄區，包括芝加哥和密爾沃基等城市，體檢人員參與確定每一起疑似COVID-19病例的死因。在這些司法管轄區，醫療檢查人員甚至審查在醫院死亡的患者的醫療記錄，以確保症狀和任何檢測表明患者確實死於COVID-19。
中國化工學會生物化工2020雲端學術論壇——合成生物學專題海外...

中國化工學會生物化工2020雲端學術論壇——合成生物學專題海外專場即將召開 2020-07-29 15:26 來源：澎湃新聞·澎湃號·政務
街口鎮廢舊鐵皮回收實時通價格趨勢綠廣再生資源回收

街口鎮廢舊鐵皮回收實時通價格趨勢綠廣再生資源回收是家專業從事廢品回收、再生資源輪迴利用大型回收公司，以誠信、和良好的商業信譽業績廣州各區，在互惠雙贏基礎上以求長期合作。回收項目： 1.製冷設備:中央空調回收、空調回收、大小空調回收、冷櫃回收、冷庫系統等等。
「科普中國·數說科學」走進高校:百度百科開創新時代科普

如今，得益於大眾基礎教育的普及和豐富信息的可實時傳遞，科普質量已有顯著提高。科學世界觀已經深入現代人的物質與精神生活，讓人們能夠更加理性地看待大千世界，更加準確地感知宇宙蒼生。　　在科普信息化建設工程下，科普中國與百度百科權威設立「科普中國·數說科學」項目，基於大數據、人工智慧技術，對全網數據進行深度挖掘，分析網民網際網路行為，智能識別網民關心的熱點科學問題和科學熱詞，並使用直播、視頻、圖文、AR等多元化的信息技術手段，產出權威、客觀的精品內容。
伊朗科學家為COVID-19設計新的痰液檢測方法 30秒內可提供結果

根據患者體內covid-19的存在和嚴重程度對傳感器進行校準。結果會在30秒內顯示在顯示器上。Abdolahad Mohammad說，校準傳感器以與Covid-19的存在和嚴重程度相關是研究人員面臨的首要挑戰之一。為了了解Covid-19和其他呼吸道疾病之間的差異，研究人員對100多人進行了測試。

COVID-19學術科普專題:計算實時再生數

相關焦點

小學數學專題總結——數和計算

【Economist】Covid-19 in 2020: The plague year

【English Paradise】Chaguan: The stigma of covid-19

Covid-19藥物治療的系統回顧和薈萃分析

床旁診斷系統在COVID-19中的應用現狀—最新外文文獻翻譯

美國COVID-19疫苗研究最新進展

周濤:武漢肺炎基本再生數與SARS接近,確屬可防可控的傳染病

Covid-19血清學檢測診斷準確性的系統回顧和薈萃分析

UPDATES|PNG reports fourth COVID-19 death, French Polynesia ca..

中國力學學會2020年學術活動計劃

Are People Having Sex Susceptible to a COVID-19 Infection?

NASA超級計算機助力COVID-19研究

積極發現與管理病例:遏制COVID-19大流行的關鍵措施

「covid-19獻血群」裡好熱鬧!10名新冠肺炎康復者陸續獻血漿

如何計算COVID-19的死亡人數?

中國化工學會生物化工2020雲端學術論壇——合成生物學專題海外...

街口鎮廢舊鐵皮回收實時通價格趨勢綠廣再生資源回收

「科普中國·數說科學」走進高校:百度百科開創新時代科普

伊朗科學家為COVID-19設計新的痰液檢測方法 30秒內可提供結果