每天點擊量超10億,霍普金斯大學兩名中國博士生製作全球最可靠疫情圖

2020-12-22 澎湃新聞

以下文章來源於中國新聞周刊 ,作者彭丹妮

中國新聞周刊

這裡是《中國新聞周刊》掌門周刊君,影響有影響力的你。和我一起撥開迷霧,追尋真相,守望時代。

來源:微信公眾號「中國新聞周刊」(ID:chinanewsweekly,記者:彭丹妮);視頻來源和部分素材:微信公眾號「中央廣電總臺中國之聲」

一張黑底、紅點,左右兩側列著各國確診、死亡和恢復病例的地圖,成為近來一些國際新聞的背景圖片。美國副總統彭斯去衛生部視察時,美國衛生部就用這張地圖監測全國病例,義大利總理、德國內閣開會時,身後電子屏幕也正在依靠這張地圖展示疫情實時情況。

這個數據地圖由美國約翰·霍普金斯大學系統科學與工程中心(CSSE)一年級中國博士生董恩盛等人發起並維護。最初,他只是想要通過追蹤數據來觀察一場疫情從生到死的整個過程,用這些數據作為他研究疾病的工具,如今,這個每日點擊量超過10億的網站,已經成為多國政府高層、公共衛生學者和主流媒體引用最多的疫情數據來源,更新和運營這個網站成了董恩盛的「主業」。

董恩盛(右)、杜鴻儒今年1月在美國參加學術會議。(圖片來源twitter)

「無心插柳」的網紅數據項目

1月21日寒假過後,在一次博士生組會上,董恩盛的導師、系統科學與工程中心副教授勞倫·加德納和大家聊起新學期的計劃,聽說中國的新冠肺炎很嚴重,便問董要不要做個數據儀錶板?

董恩盛的研究方向是疾病模型,也就是用數學模型和計算機代碼來解釋一些流行病學、公共健康方面的問題,對全球流行病的發展趨勢做基本的判斷和推測。當時他已經在搜集數據準備做這個事情了,兩人一拍即合,七八個小時後,第一版疫情可視化地圖就做好了,1月22日,這個網站便正式面世了。

視頻來源:微信公眾號「中央廣電總臺中國之聲」

去年5、6月份的時候,董恩盛與勞倫·加德納便在另一個流行病風險性分析項目中做了一個類似的數據可視化地圖,當時引來一些美國主流媒體的報導。所以,技術思路上是比較成熟的,很快就能調試上線;另一方面,由於他的中文優勢,去中國國家衛健委上面抓取數據即可,所以早期團隊在中國疫情上比全球其他一些數據來源更及時。

起初幾天,數據都靠他手動整理,每天最多能保持4~5次更新。2月1日之後,這種方式變得不可持續,於是項目轉為半自動化更新:中國的疫情數據來自丁香園的自動更新,而其他國家的數據依然需要人工審核。為了發現各國新增病例,他們的監測渠道包括世界衛生組織(WHO)、推特、新聞報導、地方衛生部門提供的數據等等。這一階段,另一個博士生杜鴻儒也加入數據收集和圖表的製作中來。

到了3月初,這個數據小組將美國疫情信息具體到縣一級層面。「因為美國郡縣大概有3000多個,再加上世界上有200多個國家和地區,人工完成非常吃力。」董恩盛告訴《中國新聞周刊》,於是小組招募了一些志願者,把人員分了很多組,有的組負責國外,有的組負責美國國內不同地區,然後24小時不間斷地發布最新數據。

2月19日,董恩盛、杜鴻儒與勞倫·加德納發表在《柳葉刀》雜誌上的文章介紹了這項工作。文章對比了約翰·霍普金斯大學系統科學與工程中心、WHO和中國疾控中心的數據報告。結果發現,他們的病例數據與後二者報告一致,而且他們在捕獲新國家或地區中首次報告的COVID-19(新冠病毒)病例上更加及時。

董恩盛說,WHO分為不同區域,各區域會及時更新數據,但是等到匯總到總部正式發布時,通常是第二天了——當然,也有極個別意外,尤其是最初全依賴人工操作時。有一個周六的早晨澳大利亞報告了首例確診病例,但因為董恩盛當時在睡覺,就沒有及時更新。

這個過程中還有很多具體的困難。比如,2月中旬部分「鑽石公主號」郵輪旅客撤回到美國。由於患者具體位置不明,他們就選擇了將點標記在美國相對的地理中心——堪薩斯州。但有些美國人放大地圖,最後發現這個點落在他們小區上,以為自己小區竟然有病例,便層層上報,後來學校讓他們趕緊調整一下,於是標記點暫時放回了日本橫濱港。

如何統一好數據的定義也是個問題。雖然用戶看到的是「確診病例」「死亡人數」這些標籤,但團隊實際面對的卻是各國甚至同一國家對於這些概念不同的定義。比如,董恩盛說,一開始美國CDC統計的「確診病例」需要核酸檢測呈陽性加上CDC認定才算確診,但是他們採用「推定陽性病例」的估算,亦即確診數據是指由州或地方實驗室確認的病例,但未經CDC證實,因此數字要比CDC的大一些。

可靠的數據是研究和決策的基礎

在線科技出版物Digital Trends3月28日發表文章《最可靠的新冠疫情儀錶板》,其中提到六種可視化疫情數據通報平臺,約翰·霍普金斯的這套系統獲得最高評價。原因是該平臺「可視化設計最好,導航明晰、閱讀方便,且是六個平臺中更新最頻繁的。」

美國疾控中心(CDC)也是其中一個平臺。不過,該網站標註:該頁面從周一中午至周五定期更新,顯示的數據為截至前一天下午4時的統計結果。另外還有文字提示:CDC與各州和地方的公共衛生部門報告的病例存在差異,各州通報的病例為最新數據。董恩盛說,疫情早期CDC的數據精度比較低,它只是報告每個州病例數量範圍。這樣的運作模式使得CDC的數據可視化不如約翰·霍普金斯大學的這個數據項目受歡迎。

在3月6日於華盛頓國會山舉行的一場簡介會上,勞倫·加德納介紹,這個儀錶板受到關注有一段時間了,現在平均每天點擊量為10億,最高峰一天點擊達20億。其間有過幾次高峰,例如,當義大利疫情暴發時,許多義大利民眾湧入網站,義大利用戶數超過了美國。

視頻來源:微信公眾號「中央廣電總臺中國之聲」

由牛津大學創立的「用數據看世界」網站解釋,他們在監測全球各國新冠疫情數據時,最初參照3個數據源:世衛組織、歐洲疾病預防控制中心(ECDC)以及霍普金斯大學。目前他們已經放棄從世衛組織獲取數據,一方面是因為世衛在3月18日修改了每日統計截止時間,另一方面在於其資料庫曾出現過錯誤。

「誰在使用這個儀錶板?據我所知,幾乎每個人都在使用。它幾乎在所有的社交媒體渠道上走紅,一直火到美國地方政府、州、聯邦政府、公共衛生機構。」勞倫·加德納說,這說明人們對於可靠的、值得信賴的、客觀的信息有巨大需求,所以她認為,非常重要的是看到這種(需求與滿足之間的)差距,並且支持這類數據可視化工具走向公眾。

約翰·霍普金斯大學是美國的一所研究性大學,也是全美最近連續33年來科研經費開支最高的大學,其公共衛生學院多年來排名全美第一。

霍普金斯團隊較高質量的數據成為諸多研究團隊進行學術研究的基礎,是科學界了解新冠疫情的重要信息來源。董恩盛說,每天他們都會在固定時間發布準確的數據,全世界的學者都可以看到,這方便學者們進行基於時間序列的疫情分析,「而時間序列分析在流行病學,尤其是對於疾病的預測方面有非常關鍵的作用。」

現在,該數據地圖的自動化程度越來越高了,而且學校也給予了很多技術和人力支持。接下來董恩盛希望配合他的導師,利用這些數據研究一下哪些地方比較容易受到新冠病毒的攻擊,疫情什麼時候會出現拐點等等。

兩人都認為世界各國要加強合作學習中國成功的防控經驗

除了能親身參與這樣一項引起全球關注的項目給自身帶來的榮譽感,以及在短時間內掌握多領域的專業知識,對董恩盛和杜鴻儒來說,維護這一網站對兩人的責任感和學術嚴謹性都是一種鍛鍊和提升;另外,當疫情在全世界持續影響下,兩人也都認為世界各國要加強合作,學習中國成功的防控經驗,早日控制疫情在全球的蔓延。

杜鴻儒說:「從數據上來看,美國目前是全世界(疫情)最嚴重的。中國疫情防控對其他國家都是很好的榜樣,我希望世界上各個國家可以參考中國的防控手段,希望能早日控制全球的疫情。」

第四屆「中國青年好網民」

優秀故事徵集開始啦!

掃描下方圖片二維碼了解詳情

共青團中央微信平臺

「疫情謠言粉碎機」上線了!

掃描圖片二維碼辨別疫情謠言

掃描圖片上的二維碼

定製標準版團旗、團徽,下載團歌

編 輯 | 賀琳子(中國傳媒大學團委)

校 審 | 任曉蓉

原標題:《每天點擊量超10億,霍普金斯大學兩名中國博士生製作全球最可靠疫情圖》

相關焦點

  • 美國權威疫情地圖由中國博士生操盤,每天點擊量超10億
    美國《科學》雜誌網站4月6日刊文,介紹了目前最受關注的全球疫情數據來源之一——美國約翰斯·霍普金斯大學疫情可視化地圖的開發者。這個疫情可視化地圖是在約翰斯·霍普金斯大學的一位教授指導下,由她的兩名中國博士生董恩盛、杜鴻儒共同完成的。
  • 日點擊量10億的全球疫情地圖背後 是倆中國博士生
    然後全天隨時監控疫情數據,動輒還要以近乎7×24(每周每天連續24小時)的方式連軸轉……   新冠疫情暴發幾個月以來,這是約翰·霍普金斯大學博士生董恩盛和杜鴻儒每天的常態。   全球政府、媒體、專業人士奉為圭臬,日點擊量超過10億次的約翰·霍普金斯大學全球新冠疫情數據地圖,就誕生在這所學校兩名中國博士生的個人電腦上。
  • 美國疫情數據更新圖來源創作者居然是JHU來自中國的兩位博士生!
    近期,新冠肺炎疫情在全球多國爆發,很多主流媒體或政府衛生部門在進行疫情更新發布時,都引用了美國約翰斯·霍普金斯大學的疫情數據更新圖。一張黑底、紅點,左右兩側列著各國確診、死亡和恢復病例的地圖,成為近來全球主流媒體在報導新冠肺炎疫情時普遍採用的背景圖片。
  • 霍普金斯大學疫情地圖背後:核心團隊是兩位中國年輕人
    美國約翰斯·霍普金斯大學的新冠肺炎疫情追蹤地圖,平均每日全球點擊量高達10億次。其核心團隊是兩位風華正茂的中國年輕人和他們的年輕女導師。不僅對各國政府和公共衛生機構的決策者很重要,對製作風險評估和疫情走勢預測模型、進行社會人口學分析及其他領域的研究者很重要,也對疫情陰影籠罩之下的所有人都是如此。這張仍在不斷豐富細化的疫情地圖,平均每日全球點擊量高達10億次,最高日點擊量達到45億次。它是各國政府、研究人員和主流媒體引用最多的疫情數據來源。
  • 海外戰「疫」:霍普金斯大學疫情地圖背後 核心團隊下的兩位中國...
    繪製全球疫情實時地圖的中國留學生 美國約翰斯·霍普金斯大學的新冠肺炎疫情追蹤地圖,平均每日全球點擊量高達10億次。其核心團隊是兩位風華正茂的中國年輕人和他們的年輕女導師。董恩盛,30歲;杜鴻儒,25歲,都是去年秋天進入約翰斯·霍普金斯大學的在讀一年級博士生 身為中國學子,董恩盛和杜鴻儒對新冠疫情的擔憂和關注,早於大部分美國科學家。
  • 為何統計疫情數據的不是美國政府,而是約翰霍普金斯大學?
    1月22日,該校系統科學與工程中心製作了「全球新冠病毒擴散地圖」,數據來自世界衛生組織、美國疾控中心、Worldometers.info網站、BNO通訊社以及各國政府和衛生部門,將疫情通過可視化方式向公眾展示。這一切和一名工程學教授有關係。
  • 日點擊超10億的霍普金斯大學疫情圖,由兩個中國博士生製造
    每天早上起來第一件事,就是打開電腦查看網頁、郵箱,看看有沒有數據需要更新更正。然後全天隨時監控疫情數據,動輒還要以近乎7×24(每周每天連續24小時)的方式連軸轉……新冠疫情暴發幾個月以來,這是約翰·霍普金斯大學博士生董恩盛和杜鴻儒每天的常態。
  • 疫情數據界的網紅,霍普金斯大學是怎樣做到的
    ▲霍普金斯大學(圖片來自學校官網)文 | 陶短房隨著新冠疫情的「國際化」,疫情暴發之初「隔岸觀火」的美國在不長時間裡躍居全球累計確診病例之冠。而霍普金斯大學則自1月22日起建立新冠疫情信息中心網站,提供全球各地不間斷實時數據,這其中自然也包括美國。據稱「自2月1日起開始匯總全美各地衛生部門數據,並參考權威媒體錄入數據」。
  • 統計發布美國疫情數據的約翰霍普金斯大學,是什麼來頭?
    早在1月22日,該校系統科學與工程中心就製作了「全球新冠病毒擴散地圖」,數據來自世界衛生組織、美國疾控中心、Worldometers.info網站、BNO通訊社以及各國政府和衛生部門,將疫情通過可視化方式向公眾展示。
  • 日點擊10億全球疫情圖背後,是倆中國博士生
    每天早上起來第一件事,就是打開電腦查看網頁、郵箱,看看有沒有數據需要更新更正。然後全天隨時監控疫情數據,動輒還要以近乎7×24(每周每天連續24小時)的方式連軸轉……新冠疫情暴發幾個月以來,這是約翰·霍普金斯大學博士生董恩盛和杜鴻儒每天的常態。
  • 今天全球疫情數據出現「烏龍」!霍普金斯大學數據為何常比世衛組織高
    隨著疫情在全球蔓延,多國主流媒體或政府衛生部門在進行疫情更新發布時,都在引用美國約翰斯·霍普金斯大學的疫情數據更新圖。 很多人都有疑問,絕大多數的國家和地區都由政府機構統一公布數據,但是在美國,為什麼不是美國疾控中心公布數據(CDC),而採納約翰斯·霍普金斯公布的數據。
  • 國際觀察|約翰斯·霍普金斯大學如何成為全球疫情數據網紅?
    霍普金斯大學的全球疫情分布圖(網站截屏)導師Lauren Gardner(左一)隨著疫情在全球範圍內愈演愈烈,各國數據成為人們關注的焦點。其實很少有人知道,這張每日實時更新,有著黑底、紅點,左右兩側列著各國確診、死亡和治癒病例的疫情地圖,開發團隊三名核心成員中的兩位,是來自中國的約翰斯·霍普金斯大學博士生——董恩盛和杜鴻儒。關注1他們是如何收集和發布疫情數據的?
  • 全球疫情實時地圖與繪製它的中國留學生「圖」
    董恩盛(右)和杜鴻儒(左)在約翰斯·霍普金斯大學疫情追蹤地圖背後付出大量心血和勞動。(受訪者供圖)美東時間5月7日,美國約翰斯·霍普金斯大學的疫情追蹤地圖顯示,全球新冠病毒感染確診病例已超過375萬,死亡病例超過26萬;美國確診病例超過122萬,死亡病例超過7.3萬。
  • 約翰斯·霍普金斯大學疫情數據圖的「走紅」,揭秘霍普金斯大學
    約翰斯·霍普金斯大學疫情數據圖的『走紅』,相關數據顯示,從該疫情數據1月22日上線以來,每日平均使用量從1月底的2億次,在3月初上升到每日12億次,高峰時每日近20億次。隨著新冠病毒在全球範圍蔓延,透明、真實的疫情數據備受關注。統計數據的機構和網站如此之多,為何約翰斯·霍普金斯的數據更受青睞?這是一所什麼樣的學校?在科研、教學等方面有什麼特色?
  • 約翰霍普金斯大學裡的中國學生
    約翰霍普金斯大學是美國長期排名前20的大學,在美國街頭和美國人聊天,問到這所大學,基本都知道它的化學方面的專業非常有名。2019年,霍普金斯大學的一教授喜獲諾貝爾獎;2020年,這所大學在一次每天被世界提起,就是關於疫情的事實動圖,也是這所大學裡的師生製作的。特別指出的是,製作這疫情發展情況動圖的是兩位來自中國的學生。
  • 全世界都在盯的疫情地圖,由兩位中國留學生領銜繪製!
    美國約翰斯·霍普金斯大學的新冠肺炎疫情追蹤地圖,平均每日全球點擊量高達10億次。其核心團隊是兩位風華正茂的中國年輕人和他們的年輕女導師。董恩盛,30歲;杜鴻儒,25歲。他們都是去年秋天進入約翰斯·霍普金斯大學的在讀一年級博士生身為中國學子,董恩盛和杜鴻儒對新冠疫情的擔憂和關注,早於大部分美國科學家。
  • 為何美國疫情數據由約翰斯·霍普金斯大學發布,而不是政府?
    隨著新冠肺炎疫情的蔓延,你可能會在新聞中看到很多消息來源於「約翰斯·霍普金斯大學(Johns Hopkins University)」的疫情地圖。自1月22日推出以來,該可視化地圖報告了中國各省級病例情況以及美國、澳大利亞、加拿大等國的疫情情況。
  • 新華社、美聯社、BBC都在用,霍普金斯大學疫情數據為何比美國CDC...
    記者:王詩堃原標題:全球病例已超120萬!霍普金斯大學疫情數據為何比美國CDC權威?關注國際疫情的讀者一定對這段話不陌生:「 美國約翰·霍普金斯大學最新統計數據顯示,美國新冠肺炎確診病例已超過X萬例……」這個實質上的第三方數據整合項目,卻在時效性、直觀性等方面完爆美國疾控中心(CDC)。不少電視臺在播報疫情新聞時,直接對著大屏幕上的約翰·霍普金斯大學數據「儀錶盤」解讀。
  • 全球疫情數據出現「烏龍」,這個數據你是否還有很多問號?
    目前,約翰斯·霍普金斯大學官網已更正數據,最新數據顯示美國累計病例仍為58萬例左右,全球累計確診數並未破200萬。疫情數據為何由美國一所大學發布?隨著疫情在全球蔓延, 多國主流媒體或政府衛生部門在進行疫情更新發布時,都在引用美國約翰斯·霍普金斯大學的疫情數據更新圖。
  • 約翰霍普金斯大學工程師繪製疫情全球發展儀錶盤 監測正在進行……
    新冠病毒導致了很多嚴重的事情,大家也在持續關注著新冠疫情,一起看看約翰霍普金斯大學工程師們統計的表格吧。看到紅色約翰霍普金斯大學的工程師們發明了一個創新的儀錶盤,全世界都實時觀察到了新冠疫情。我們仍然在觀察這些點點滴滴。