Nature:新冠流行難預測,超級計算機和氣象學家來幫忙

2020-12-01 澎湃新聞

原創 Leo 集智俱樂部

導語

流行病傳播模型是政府決策的重要參考,而預測疾病傳播的模型通常會依賴於數百個參數——這就會引入不確定性。當流行病預測模型的參數多到有點誇張時,預測出來的結果恐怕可靠性不足。最近的Nature官網的一篇報導,介紹了科學家怎樣藉助超級計算機和氣候模型來改善一個經典的流行病傳播模型。

一個「失敗」的新冠傳播模型

在一群計算機科學家耗時數月審核了一個最具影響力的流行病傳播模型 CovidSim 後,他們認為:如果希望對新冠流行趨勢的預測更加可靠,流行病學家可以嘗試使用氣候模型。

倫敦帝國理工學院開發了流行病預測模型 CovidSim。在說服英美政府為降低死亡人數而制定的封鎖政策中,CovidSim 模型給出的預測結果起到了一定的推進作用。然而,其可靠性卻也一直受到懷疑。

2020年3月31日,川普查看CovidSim模型的預測圖

CovidSim模型的早期預測顯示,如果各國政府不採取行動,英國最多將有50萬人死亡,美國最多將有220萬人死亡。這一度成為英美兩國政府決策的重要參考。

近日,受倫敦皇家學會委託的研究員使用超級計算機,對CovidSim進行了深入研究。這項研究結果於11月發布於預印本平臺 Research Square 。

論文題目:

Model uncertainty and decision making: Predicting the Impact of COVID-19 Using the CovidSim Epidemiological Code

論文地址:

https://www.researchsquare.com/article/rs-82122/v3

領導該課題的倫敦大學學院化學家兼計算機科學家 Peter Coveney 表示,他們的研究表明,CovidSim 對輸入數值微小變化的敏感程度被人們忽略了,因此預測結果高估了封鎖政策能減少的死亡人數。

論文通訊作者 Peter Coveney

Coveney 不願批評由流行病學家 Neil Ferguson 領導的帝國理工學院研究團隊。畢竟,Coveney 贊同這個團隊做出了最好的預測工作。Coveney 表示,CovidSim 的確表明,如果什麼措施都不做確實會造成嚴重的後果。但流行病學家應該對「集成」模型('ensemble' models)的模擬效果進行壓力測試。

類似於機器學習中的多個模型相結合的集成學習(Ensemble Learning)概念,「集成」模型也包含著數千個不同版本的小模型。這些模型運行在不同的輸入條件和假設中,以應對不同的概率的場景。從天氣預報到分子動力學,在計算量很大的領域中,這種概率混合方法都很常見。

Coveney 的團隊已經為 CovidSim 做到了這一點。其研究結果表明:如果該模型作為一個整體「集成」,運行後得到的一系列可能的死亡人數,其平均值是原來預測結果的兩倍——並且更接近實際數值。

Coveney 說:「雖然 CovidSim 被捧為最複雜的流行病學模型,但與真正複雜的超級計算應用程式相比,它就像一個玩具。」英國皇家學會大流行建模快速援助(Royal Society’s Rapid Assistance in Modelling the Pandemic,RAMP)倡議的一部分就是基於 Coveney 所做的性能檢查。

超級計算機捕捉複雜參數變化

Coveney 團隊使用了位于波茲南超級計算和網絡中心的 Eagle 超級計算機對CovidSim 進行了6000次獨立的運行測試。每次測試都有一組獨特的參數。這些參數表示了流行病的一些特徵:包括病毒的傳染性和致命性、人們在各種環境中潛在的接觸者數量以及居家工作等政策的執行情況等。在三月份帝國理工的團隊做出預測的時候,這些參數依然依賴於推測:其中一些來自關於病毒本身的初步數據,另一些則是基於對過往流感等傳染性疾病的經驗。

預測疾病傳播的模型通常會依賴於數百個參數——這就會引入不確定性。發起建立 RAMP 的人群中就有一種隱憂:流行病預測模型的參數多到有點誇張,預測出來的結果恐怕可靠性不足。

他的團隊從 CovidSim 代碼中發現了940個參數,其中對結果影響非常大的有19個。而且,不同的預測結果中三分之二的差異其實是由三個參數造成的:在出現症狀且具有傳染性之前的潛伏期長度、社交隔離的執行情況以及感染者的隔離期。

研究表明,這些參數的微小變化可能會對模型的輸出產生巨大的非線性影響。例如,數千次模擬測試中的大多數結果表明,在封鎖政策下,英國的死亡人數遠遠高於帝國理工的初步預測——在某些情況下,甚至高出5-6倍。平均死亡人數也是帝國理工預測人數的2倍。

在一個模擬的情景中,假設英國每周有60人需要住院接受重症監護,那麼三月份的報告預測英國共計將有8700人死亡。Coveney小組得出的結果表明,這一數字平均約為15,000人;在某些情況下,甚至可能超過40,000人。很難將這些預測與英國新冠肺炎死亡的實際數字進行比較,因為封鎖政策開始的時間比任何模型假設的結果都晚了一周,那時已經有大量的感染者在傳播疾病了。

Coveney 表示,帝國理工的團隊做錯了——他們正確地運行了模擬,但是不知道如何從模型中得出包含概率的混合結果。這意味需要做另一番計算。Coveney 也認為,不應將該模型作為一個整體「集成」運行其得到的結果用來決策是否改變防疫政策。但是英國愛丁堡大學的流行病學家和數據科學家 Rowland Kao 指出,政府應當比較、綜合多種預測模型的結果。如果基於單一的模型來做決策,就太草率了。

引入氣候模型和貝葉斯工具

帝國理工團隊的領導者 Ferguson 認同了 Coveney 的大部分意見。但他也表示:「只不過,在三月份我們尚無能力進行這樣的模擬測試。」Ferguson 同時表示,帝國理工團隊已經對模型進行了很大的改進,現在模型已經可以得到包含概率的混合結果了。例如,他們現在使用貝葉斯概率來表示 CovidSim 輸入的不確定性。這種做法在一些流行病學模型中很常見,例如口蹄疫。

還有一個更簡單模型的預測結果被用來建議英國政府本月應重新執行封鎖政策。這種模型比CovidSim更靈活:「基於不確定性方面的考量,如果我們可以一周多次運行模擬程序,實時擬合數據要容易多了。」Ferguson 表示。

Coveney 表示,「這樣聽上去就像是在做正確的改進,且與我們的預測結果也一致了。」

Ferguson 表示,技術方案的選擇通常取決於對計算能力的權衡。「如果你想一板一眼正確地描述所有的不確定性,用一個計算難度較小的模型會更加容易。」

英國牛津大學的氣候物理學家 Tim Palmer 認為,使用貝葉斯工具是進步的做法。Tim 率先在天氣預報中使用了集成建模。但也只有通過在最強大的計算機上運行的集成建模技術,我們才能得到最可靠的流行病預測。在政府間氣候變化專門委員會(Intergovernmental Panel on Climate Change,IPCC)的協調下,這些新技術提高了氣候預測模型的可靠性。

Palmer 也表示,流行病模型預測也需要類似IPCC的機構,我們需要某些國際間合作的設施,我們可以在這樣的設施中開發流行病模型。情況緊急,這件事的推進將會很倉促,但是我們需要某種國際組織來綜合全世界的流行病學模型進行預測。

Simulating the pandemic: What COVID forecasters can learn from climate model

翻譯自:https://www.nature.com/articles/d41586-020-03208-1

作者:Leo

審校:趙雨亭

編輯:鄧一雪

複雜科學最新論文

集智斑圖頂刊論文速遞欄目上線以來,持續收錄來自Nature、Science等頂刊的最新論文,追蹤複雜系統、網絡科學、計算社會科學等領域的前沿進展。現在正式推出訂閱功能,每周通過微信服務號「集智斑圖」推送論文信息。掃描下方二維碼即可一鍵訂閱:

推薦閱讀

集智俱樂部QQ群|877391004

原標題:《Nature:新冠流行難預測,超級計算機和氣象學家來幫忙》

閱讀原文

相關焦點

  • Nature:新冠流行難預測,超級計算機和氣象學家來幫忙
    最近的Nature官網的一篇報導,介紹了科學家怎樣藉助超級計算機和氣候模型來改善一個經典的流行病傳播模型。在一群計算機科學家耗時數月審核了一個最具影響力的流行病傳播模型 CovidSim 後,他們認為:如果希望對新冠流行趨勢的預測更加可靠,流行病學家可以嘗試使用氣候模型。
  • 神預測!中國超級計算提前半個月預測了美國的寒潮
    氣候變化莫測,一直以來想要確保氣象預測的準確性實屬困難。但是,伴隨現代超級計算機的誕生讓過去的不可能成為了可能!事實證明,現代的超級計算機可以相當準確地預測極端天氣災難,至少技術上可以。據《華盛頓郵報》報導,美國氣象學家稱,一股北極渦旋在1月分裂成兩個環流,形成了兩股冬季風暴,14日和16日接連橫掃美國中部和南部地區。
  • 科學家利用超級計算機或可預測氣候變化
    一個世紀前,科學家通過手工計算了解了大氣吸收和發射能的量;如今,他們使用超級計算機,可以對地球氣候變化進行日益精準的預測。氣候相關的問題無處不在:南水北調、修建防波堤、推廣以色列水源存儲和管理模式、未來夏季氣溫超過38度的天數增多等。
  • 最新颱風預測!7、8、9、10、11號颱風扎堆生成?超級計算機:有可能
    ——和前幾個月的颱風持續「難產」相比,這兩天,西太平洋突然風起雲湧,大量颱風胚胎從中誕生。比如美國超級計算機最新預測中就指出,南海7號颱風登陸後,剩下的季風系統可能重新發展成為新颱風(颱風1)。而菲律賓以東到關島附近的洋面上,在季風水汽的支援下,處於熱帶輻合帶中的颱風胚胎94W最終可能發展出兩個新颱風(颱風2&颱風3),而遠洋的颱風胚胎93W則可能在副熱帶高壓的引導下持續西北行,將發展為新颱風(颱風4)。
  • 英媒:解釋奇怪的新冠肺炎症狀 超級計算機幫忙了
    據英國《獨立報》網站9月14日報導,多虧美國田納西州一臺超級計算機的演算,研究人員才可以更好地了解為什麼由新冠病毒引發的新冠肺炎會對人體造成如此嚴重的傷害。報導稱,田納西州橡樹嶺國家實驗室擁有世界速度第二快的超級計算機——「頂點」超級計算機。該實驗室的研究人員利用這臺機器處理了1.7萬份基因樣本中的4萬多個基因數據,以更好地了解新冠肺炎。據國際《元素》雜誌報導,橡樹嶺國家實驗室的科學家們對超級計算機產生的數據進行了大量分析,並最終取得突破,從而提出「緩激肽假說」。
  • 「Nature子刊」基因生物標記物可快速準確預測肝毒性和潛在的肝癌
    農用化學和製藥公司開發新產品時,必須先進行廣泛的潛在毒性測試才能獲得監管部門的批准。該測試通常需要冗長而昂貴的動物研究。人類營養學系副教授Zeynep Madak-Erdogan說:「這項研究的目的是從肝臟中識別出最小的指標,以預測毒性和潛在的肝癌。」她補充說,通常情況下,公司會通過長期的動物實驗來做到這一點。他們跟蹤動物長達一年,以了解它們是否會在暴露於這些化合物後患上肝癌。這些研究需要成千上萬隻小鼠或大鼠,並且需要大量的時間來照顧動物,收集樣本並分析數據。
  • 史上最晚颱風要來我國?超級計算機:可能性不大,更需警惕寒冷
    部分超級計算機的預測中認為,隨著幅合帶活躍,在12月中心西太平洋和南海將可能還有新颱風活動,甚至還有颱風可能登陸我國海南!如果這一預測實現,那這可能是史上最晚登陸我國的颱風。但這種預測實現的可能性是比較低的,且不說目前只有一部分超級計算機支持,不同超級計算機模式之間分歧很大,就從海水溫度水平上說,目前我國南部沿海的水溫已經普遍下降,廣東廣西海南沿海水溫基本全線跌落到25度以下,廣東福建沿海還低於22度,這個海水溫度已經不適合颱風維持了,登陸就更難了。
  • 德勤2019年預測之量子計算機:下一個超級計算機,但不是下一個...
    德勤對2019年及以後的量子計算機(QC)做出了不止一個,而是五個預測:1. 如果有的話,量子計算機幾十年來都不會取代傳統計算機。預計2019年或2020年將首次證明「量子霸權」,有時被稱為「量子優勢」:舉個例子就是量子計算機將能夠執行一項經典(傳統電晶體)電腦無法做到的特定任務。基於數字的計算機可以在實際的時間內解決或使用實際數量的資源。
  • 超級計算機準備預測英超聯賽積分榜超1/4排名
    上周末英超聯賽的大幕已經落下,在經過了一個賽季的預測後,現在我們可以回過頭來看看超級計算機預測的準確性。2018-19賽季上演了英格蘭足球史上最富戲劇性的一次爭冠大戰,曼城直到最後一天才鎖定冠軍。歐冠入場券的爭奪也是十分激烈,雖然遭遇了來自阿森納和曼聯的挑戰,但切爾西和熱刺還是鎖定了前四。此外,在積分榜的另一端,卡迪夫城和富勒姆在一個賽季後重返英冠聯賽,哈鎮也一同降級。當然,也有狼隊這樣成功的故事,他們在升級後第一年就取得了第7的排名,與以前的沃特福德和萊斯特城有著相似的經歷。大量有趣的故事和更為豐富的曲折劇情讓賽季前的預測看起來有些荒誕。
  • 超級計算機:或靠近我國
    從9月24日午後的風雲4號高清衛星雲圖上看,我國東部海區風平浪靜,暫時已沒有新颱風要活躍的跡象。而從更大範圍的西太平洋衛星雲圖上看,無論是菲律賓以東、關島還是更遠洋靠近換日線附近的海區,基本上都是一片細碎的雲,整個西太平洋上基本都是風平浪靜的狀態,看起來颱風塔巴暫時將西太平洋的能量抽光,颱風活動可能要暫時沉寂一段時間了。
  • 超級計算機為什麼還在「夜以繼日」地計算π?答案很難想到
    超級計算機為什麼還在「夜以繼日」地計算π?答案很難想到在我們小時候學習數學的時候,小編最驕傲的就是能夠背圓周率,有的時候我們同學之間還會進行攀比,怎樣把這個圓周率給背到後面的多少小數點。但是其實有關於現在的圓周率,其實還沒有被算計,現在的超級計算機的出現還是能夠幫助我們在這一方面進行進一步的探索,只不過超級計算機還是在進行計算當中。那麼既然去學院一個沒有辦法計算出來的數據,為什麼超級計算機還是要繼續的運營呢?這根本就是在浪費時間嗎?所以今天來給大家探尋一下其中的奧秘。
  • 未來發生的事,可不可以被超級強大的計算機預言?
    就像現在我們已經在超級計算機預測天氣、國家安全等事件一樣,到未來可能用超級計算機預言更多更小的事情也會變成現實。職場問題原創內容源自我的公眾號:網際網路吧  (ID:hulianwanba)就像每日心選之前用美劇《疑犯追蹤》來解讀人工智慧技術一樣,其實對於未來事件的預測對於每個人而言都是非常巨大的誘惑力
  • 計算機建模專家打造領先天氣預報模型—新聞—科學網
    這場雪並不像預測的那樣糟。這很有可能是個大雪天。 在地球物理流體動力學實驗室(GFDL)辦公桌的另一邊,Shian-Jiann(S. J.)Lin對此並不相信。他是用兩萬行計算機代碼將大氣分到盒子中,從而精確解析描述全球空氣漩渦方程的大師。數十年來,Lin的項目一直驅動很多氣候模型的長期模擬,包括GFDL的模擬——美國國家海洋與大氣管理局(NOAA)皇冠上的一顆明珠。
  • Nature:計算機預測技術對數十億種藥物-蛋白質相互作用進行排序
    近日,研究者們提出了一個計算機模擬工作計劃,擬以公共資料庫中存儲的藥物信息和蛋白質信息為基礎,對數十億種可能的藥物與蛋白質之間的對接進行評價。藥物信息挖掘研究者們利用谷歌的超級計算機檢測數十億種藥物-蛋白質相互作用。Cardozo承認道,計算機模擬僅僅是新藥研發過程中的一個初始步驟。
  • 國家超級計算中心,將賦予鄭州怎樣的超級力量
    建設國家中心城市,離不開強大的科技創新能力,特別是「國字號」基礎設施和戰略平臺助力。國家超級計算鄭州中心的獲批,給中原發展再添強大引擎。6個「哥哥」無論是剛獲批的鄭州中心,還是已經建成的6個「哥哥」,都不是平地起高樓,而是依託於具備一定基礎的科研院所或機構。天津中心實行理事會領導下的主任負責制,理事長由天津市濱海新區和國防科技大學主要負責同志兼任。濟南中心建設主體為山東省計算中心,隸屬山東省科學院。
  • Nature:強度媲美鋼的超級木頭!
    2月8日,Nature在線發表了美國馬裡蘭大學胡良兵教授和李騰教授研究團隊關於超級木頭的最新發現。該研究團隊發明了一種簡單有效的方法可以把原生木材直接處理成為一種超強超韌的高性能結構材料。https://www.nature.com/articles/nature25476方法分為兩步,首先去除木材中部分木質素,然後在100攝氏度的溫度下進行壓縮。通過簡單的兩步處理方式獲得的超級木頭的各項機械性能,包括拉壓彎強度、韌性、剛度、硬度、抗衝擊性能等, 都超出原生木材10倍以上。
  • 日本團隊使用超級計算機配合衛星 預測颱風暴雨
    據日媒報導,日本理化學研究所和氣象廳的團隊在本月17日的美國科學雜誌上發表文章稱已研發一種方法:使用超級計算機「京」分析氣象衛星「向日葵8號」的觀測數據,捕捉曾難以用於天氣預報的雲層高度和厚度,更加準確地預測颱風和集中暴雨。
  • 用超級計算機,解決了「湍流」難題中的一個!
    本文參加百家號科學#了不起的基礎科學#系列徵文先進的超級計算機模擬,已經解決了湍流流體流動中的一個難題,這個問題可能會促使更高效的渦輪和發動機誕生。當流體(如水或空氣)流動足夠快時,流體(將經歷湍流——流體內部的速度和壓力似乎是隨機變化的。
  • 超級計算機:還不確定
    在這一堆混戰的颱風胚胎當中,颱風劍魚的殘餘重新「復活」的可能性比較渺茫,颱風胚胎96W所在的海域緯度又比較偏高,成為新颱風的可能性也很低。對比起來,位於美國關島以南、太平洋深處的颱風胚胎95W則似乎擁有了最適合的條件——充足的發展空間,充沛的海洋能量,還有源源不斷的季風水汽支援,這或許意味著這個在西太平洋深處的颱風胚胎將是接下來最可能發展成為新颱風的那一個。
  • 超級計算機:進我國東海可能性在增大
    雖然說隨著17號颱風塔巴的消逝,西太平洋最近已經沒有新颱風在活動,而且這兩天我國南方多省和東部沿海也相當乾燥,水汽活動相當不活躍,這樣來看,西太平洋似乎要進入颱風沉寂期了。9月末就進入颱風活躍期,這似乎有點不太對勁,畢竟秋颱風季節往往是西太平洋一年中颱風活動的高峰期之一。