這個春節,疫情牽動著全國人民的心。相信大家都在以史無前例的熱情關心著國家大事。
筆者也一樣,每天睜眼第一件事,就是打開手機看最新疫情動態以及累計確診人數。相信大部分人獲取數據的途徑是丁香園/丁香醫生的疫情地圖,方便又準確。
圖片來源:手機截圖
談到這,肯定有小夥伴覺得筆者有打廣告的嫌疑。筆者摸著良心回答:其實沒有打廣告,原本是想低調,可實力不允許呀!
因為,丁香園疫情數據已經登上《柳葉刀》!
圖片來源:《柳葉刀》
02 月 20 日,《柳葉刀·數字健康》發表了一篇論文——《Early epidemiological analysis of the coronavirus disease 2019 outbreak based on crowdsourced data: a population-level observational study》
在這項觀察性研究中,研究人員使用了丁香園的眾包數據(類似於大數據,解釋起來有些複雜,可先簡單理解為大數據)用於重建有關中國 COVID-19 的患者級別的信息。
圖片來源:文獻截圖
下面,我們一起來看一下具體內容。
研究背景
隨著新型冠狀病毒(COVID-19)的爆發,疫情已經迅速播散到中國及世界其他地方,並有可能成為世界性流行病。
目前,急需對流行病學數據進行實時分析,以提高民眾對疫情的認識,並為制定幹預措施提供依據。
在過去,實時分析可揭示疫情爆發的最初幾周新型病原體的傳播能力、嚴重性和自然史,例如 SARS 和伊波拉病毒。
詳細分析患者的病例,可以得到很多有用的信息。例如,可推斷流行病學的關鍵參數:潛伏期和傳染期以及感染病毒後的檢測,隔離和報告之間的延遲,進一步分析感染患者的年齡特徵,按發病日期繪製流行曲線並進行推斷等等。
但是,在最需要信息的爆發早期,有關患者的信息很少,官方數據也未公開。
基於先前整理新聞報導以監測伊波拉病毒傳播的經驗(文章截圖如下,感興趣的小夥伴可自行搜索),在《柳葉刀》的這篇文章中,研究人員提出了一項從各種在線資源中收集有關 COVID-19 患者信息的研究策略。
傳染病建模團隊,使用這些在線數據做流行病學評估。
圖片來源:Oxford Academic
該研究中,研究人員用了丁香園的眾包數據,用於重建有關中國 COVID-19 的患者級別的信息。
文中介紹:「丁香園是一個 2000 年建立的,由中國醫師、醫療保健專業人員、藥房和醫療機構組成的面向中國醫療保健的社交網絡。該在線平臺,通過整理新聞媒體、政府電視臺以及國家和省級衛生機構的報告的數據,實時展示了中國 COVID-19 爆發的數據。」
這些數據包括截止至具體時間的 COVID-19 累計感染人數,疫情分布圖以及實時中文(直接或通過國家媒體)發布的衛生當局公告。
此外,還查詢了國際媒體資源和國家衛生機構的網站,以整理有關 COVID-19 國際傳播的數據。
研究人員密切監測 2020 年 1 月 20 日至 2020 年 1 月 31 日之間丁香園的更新情況,以便實時提取每個患者的關鍵信息,並報告每日病例數。
對相關數據進行統計分析,結果如下。
統計分析結果
年齡特徵
該研究包括 2020 年 1 月 13 日至 2020 年 1 月 31 日報告的 507 位患者,包括中國大陸的 364 位和中國以外的 143 位患者。
報告截止時,存活的 COVID-19 患者,中位年齡為 45 歲;報告截止時,死亡的患者,中位年齡為 70 歲;很少有患者小於 15 歲。
根據中國的年齡人口統計數據調整,證實兒童感染較少。
來自眾包數據的 COVID-19 患者的年齡分布
圖片來源:《柳葉刀》
時間特徵
下圖為按發病日期展示了病例的增長情況,結果表明到 2020 年 1 月 13 日報告時病例數激增。
基於眾包數據和官方來源的按地點劃分的 COVID-19 流行病的每日時間線
圖片來源:《柳葉刀》
如下圖所示,報告日期顯示了省級流行曲線。
截至 2020 年 1 月 31 日,中國大陸 30 個省中有 16 個報告了 100 例以上的確診病例。
2020 年 1 月 18 日至 2020 年 1 月 31 日期間,湖北省以外的幾個省的新報告病例持續增長,這與本地的持續傳播相符。
2020 年 1 月中國省級 COVID-19 流行病的每日時間線
圖片來源:《柳葉刀》
如下圖所示,在整個研究期間,中國大陸症狀發作到進入醫院或診所就診之間的中位延遲時間為 2 天(延遲時間從 2020 年 1 月 18 日之前的 5 天減少到此後的 2 天)(Wilcoxon 檢驗 p = 0.0009)。
一些省份(如,天津、雲南)延誤時間較短,而湖北省的早期病例的特徵就是延誤就診時間較長。
症狀發作與在醫院或診所就診之間的延遲(A)
在醫院或診所就診與確診 COVID-19 之間的延遲(B)
圖片來源:《柳葉刀》
對於國際旅行者,症狀發作與在醫院或診所就診之間的中位延遲時間為 1 天,比湖北省或中國大陸其他地區的患者短(Kruskal-Wallis 檢驗 p
基於對 33 名有武漢旅行史患者的研究,研究人員估計 COVID-19 的中位潛伏期為 4.5 天。
研究總結
從《柳葉刀》的這篇文章中,我們可以得出很多結論:感染人群嚴重偏向年齡較大的群體,受感染的兒童少得多。此外,可根據從武漢返回患者的旅行史的數據,以及症狀發作的日期,從而可以估測潛伏期。
總體而言,該研究方法的新穎之處在於依靠中國社交媒體和新聞報導的獨特來源,匯總並整理了相關信息。
這種方法有助於獲得有關臨床和人口統計信息的可靠且準確的數據。另一方面,令人放心的是丁香園專門保留了一個板塊用來揭穿有關 COVID-19 爆發的假新聞和謠言。
總之,從人群中收集的流行病學數據可用於監測新興疫情,例如 COVID-19 和伊波拉病毒。
如果沒有其他可用數據,這些工作可以幫助在疫情爆發的早期階段生成和傳播詳細信息,從而可以預測影響幹預措施的關鍵參數。
然而,研究人員表示,儘管數據源有用且及時,但不能替代官方統計數據。
眾包數據不會涵蓋所有病例。此研究包括 2020 年 1 月 31 日之前確診的 507 例患者的詳細數據,約佔所有報告病例(9000例)的 5%,在整個 COVID-19 病例中所佔的比例要小得多。
此外,還有一個原因是,丁香園不會在官方數據之外生成數據,而是提供公眾和衛生部門之間快速溝通的渠道。
在網際網路+醫療迅猛發展的今天,傳統的尋醫問藥模式早已改變。網際網路+醫療,甚至在科研領域都牢牢佔據了一席之地。
網際網路本身巨大的流量基礎和迅速傳播力,帶給未來的發展機遇和挑戰都是巨大的。
以丁香園為例,其在此次疫情中為大眾、科研人員及醫務人員提供了種種便利,可以說,網際網路+醫療在未來大勢所趨。
文章來源:科研論文時間
封面來源:站酷海洛 Plus
參考文獻來源:
https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30026-1/fulltext