隨著新冠肺炎疫情在全球持續肆虐,掌握確診病例、死亡病例的實時數據對於疫情防控十分重要。
多國媒體或政府衛生部門在進行疫情信息更新發布時,都在引用美國約翰斯·霍普金斯大學的疫情數據圖。而其背後的創作者和維護者除了學校副教授勞倫·加德納外,還有兩名來自中國的博士生董恩盛和杜鴻儒。他們都是約翰斯·霍普金斯大學土木與系統工程系博士一年級學生。
圖源:央視新聞客戶端
As COVID-19 spreads across the globe, reporting data of new and total confirmed cases on a daily basis has become quite an important routine for news agencies around the world. Currently, most of the mainstream media are referencing the data from Johns Hopkins University's online dashboard when they report about the outbreak.
董恩盛(右)、杜鴻儒今年1月在美國參加學術會議。圖源:Twitter
據央視新聞報導,數據地圖由中國博士生董恩盛等人發起並維護。早在去年5、6月份的時候,董恩盛與導師勞倫·加德納便在一個針對美國麻疹病毒風險性分析項目中做了一個類似的數據可視化地圖,當時引來一些美國主流媒體的報導。所以,在技術思路上是比較成熟的,這份新冠肺炎疫情圖表也很快就能調試上線。1月21日,在一次博士生組會上,董恩盛的導師、系統科學與工程中心副教授勞倫·加德納和大家聊起新學期的計劃,得知中國的新冠肺炎疫情後,便問恩盛是否做個數據圖表。
董恩盛的研究方向是疾病模型,也就是用數學模型和計算機代碼來解釋一些流行病學、公共健康方面的問題,對全球流行病的發展趨勢做基本的判斷和推測。當時他已經在搜集數據準備做這個事情了,兩人一拍即合,七八個小時後,第一版疫情可視化地圖就做好了,1月22日,這個網站便正式面世了。
Launched on January 22, this real-time tracking map is created and maintained by Lauren Gardner, an associate professor in the Department of Civil and Systems Engineering at Johns Hopkins University, together with two Chinese students, Dong Ensheng and Du Hongru, first-year PhD students at the university's Center for Systems Science and Engineering.
"On January 21, we (Dong and his tutor) reached an agreement to make the interactive dashboard. I spent about seven to eight hours that night to complete the first edition. Then my tutor posted this dashboard on Twitter at around 11 a.m. on January 22," said Dong.
視頻來源:央視新聞
董恩盛和導師做這個圖表最開始的初衷只是為下一步的學術研究做數據收集和準備工作,沒想到隨著疫情發展,會成為全世界普遍關注的統計參考,這也讓他和團隊感到責任更重了,更需要夜以繼日地保持數據嚴謹和準確。如今,這個網站已經成為多國政府高層、公共衛生學者和主流媒體引用最多的疫情數據來源,更新和運營這個網站成了董恩盛的「主業」。
Their original intention to create this dashboard was to collect data for academic research. However, with the development of the epidemic, it has become the most cited source of epidemic data for government officials, public health scholars and mainstream media in many countries. Updating and operating this website has become Dong's "main business."
起初,董恩盛和他的導師手動整理數據,每天早晚各更新一次。但隨著疫情形勢的變化,這種方式變得不可持續,於是項目轉為半自動化更新,杜鴻儒也加入數據收集和圖表的製作中來。
到了3月初,這個數據小組將美國疫情信息具體到縣一級層面。「因為美國郡縣大概有3000多個,再加上世界上有200多個國家和地區,人工完成非常吃力。」董恩盛告訴《中國新聞周刊》,於是小組招募了一些志願者,把人員分了很多組,有的組負責國外,有的組負責美國國內不同地區,然後24小時不間斷地發布最新數據。
董恩盛他們的團隊也從最開始的兩三個人,發展到現在包括本系其他博士研究生以及其他學院志願者,再加上合作提供技術支持的公司,一共有近50人的團隊。
Dong and his tutor updated the map data manually twice a day, in the morning and evening. But as the pandemic unfurled, they found that manual updates were unsustainable, so they decided to automate parts of it and invited Du to work with them.
As the coronavirus continues to spread, the data that needs to be tracked is increasing. Dong's team has gradually grown from two or three people to now nearly 50 people, including other doctoral students in the department, volunteers from other colleges and some technicians from the company which provided technical support.
董恩盛(左) 和杜鴻儒 (右) 圖源:央視新聞
2月1日杜鴻儒加入後主要負責自動更新代碼的編寫以及將採集的數據和WHO發布的數據做對比,確保數據的一致性和準確性。
Joining the team on February 1, Du's main work is to write code for automatic updates and compare the data they collected with the numbers released by the World Health Organization (WHO), ensuring data consistency and accuracy.
杜鴻儒表示:「最難的就是這些數據源格式不同,語言通常也不同,我們需要把各個數據源匯總,整理、清洗成我們需要的格式,再上傳到這個數據圖表中。」
"The most difficult thing is that these data sources are all in different formats and often different languages. We need to gather each data source, organize and adjust them into the format we need, then upload it to the dashboard," said Du.
視頻來源:央視新聞
根據約翰·霍普金斯大學數據圖表官方介紹,其數據來源包括:世界衛生組織(WHO),中、美、歐的官方衛生和疾控部門,各地媒體,以及第三方數據平臺如丁香園等。
The data sources include the World Health Organization, the U.S. Centers for Disease Control and Prevention, the European Center for Disease Prevention and Control, the National Health Commission of the People’s Republic of China, local media reports, local health departments, and the DXY, one of the world’s largest online communities for physicians, health care professionals, pharmacies and facilities.
在3月6日於華盛頓國會山舉行的一場簡介會上,勞倫·加德納介紹,這個數據圖表受到關注有一段時間了,現在平均每天點擊量為10億,最高峰一天點擊達20億。其間有過幾次高峰,例如,當義大利疫情暴發時,許多義大利民眾湧入網站,義大利用戶數超過了美國。
圖源:Facebook
董恩盛說:「這個是我們(疫情圖)大概的使用量,是我們一個圖層的使用量。截止到3月31日,我們在全球大概已經有155億次的使用量了。」
As of March 31, the website had over 15.5 billion visits worldwide, said Dong.
視頻來源:央視新聞
除了能親身參與這樣一項引起全球關注的項目給自身帶來的榮譽感,以及在短時間內掌握多領域的專業知識,對董恩盛和杜鴻儒來說,維護這一網站對兩人的責任感和學術嚴謹性都是一種鍛鍊和提升;另外,當疫情在全世界持續影響下,兩人也都認為世界各國要加強合作,學習中國成功的防控經驗,早日控制疫情在全球的蔓延。
杜鴻儒說:「從數據上來看,美國目前是全世界(疫情)最嚴重的。中國疫情防控對其他國家都是很好的榜樣,我希望世界上各個國家可以參考中國的防控手段,希望能早日控制全球的疫情。」
綜合來源:中國新聞周刊,CGTN,jhu.edu,央視新聞