我國疫情預測模型遭權威期刊退回!鍾南山等人用 LSTM 力證「早發現...

2020-12-05 手機鳳凰網

對病毒在人群中傳播的智能預測模型構建與驗證是當前的工作重點。

不過,在 2020 年 2 月 27 日廣州市政府新聞辦舉辦的疫情防控專場新聞通氣會上,鍾南山院士在談到疫情的預測時表示:

疫情開始時,國外有流行病學家用權威的試驗模型,預測 2 月初中國感染新冠肺炎人數將達 16 萬人。這是沒有考慮到國家的強力幹預,也沒有考慮春節後的延遲復工,我們也做了預測模型,2 月中旬或下旬達到疫情高峰,確診病例約六、七萬人,投到國外權威期刊,被退了回來,感覺和上面的預測水平差太多,還有人給我發微信說「你的話幾天之內就會被碾個粉碎」。但事實上,我們的預測更接近權威。

西方的傲慢與偏見?

鍾南山院士此言一出,引發網友熱議。

一方面,不少網友認為包括權威期刊審稿人在內的眾多西方學者帶有預設立場,因此投稿被退可以說是一種惡意揣測。

另一方面,網友認為由於社會背景、文化、制度等方面的差異,出現所謂的「偏見」也無可厚非。正如鍾南山院士所說,國外並不了解我國國情,沒有考慮到國家的強力幹預和春節後的延遲復工起到的積極作用。

【雷鋒網註:圖源新浪微博】

雷鋒網注意到,雖然鍾南山院士並未詳細介紹被退回的疾病預測模型,但知乎一位名為「瘋狂紳士」的計算機軟體背景人士認為,鍾南山院士的模型叫「具有飽和發病率 SIQS 傳染病模型」。根據其解釋,任何傳染病都具有飽和發病率,即不可能完全被消滅。

該網友提到,SIQS 實際就是在 SEIR 的基礎上加入了幹預手段(比如這裡就指國家利用早發現、早隔離的手段進行了強烈幹預)。而所謂的 SEIR 正是一種常見的傳染病模型,此前有關 SARS 的傳播動力學研究大多也都採用了 SEIR 模型。

【圖源百度百科】

實際上,這一表述也與鍾南山院士當天在會上的觀點類似:

我們在傳統模型基礎上加上兩個影響因素,第一個是國家強力幹預,第二個是春節後的回程高峰。

利用 AI 以 SARS 數據為基礎進行訓練

另外雷鋒網了解到,2020 年 2 月 28 日,鍾南山院士等人在醫學期刊 JTD 發表了一篇名為《公共衛生幹預下 COVID-19 流行趨勢的 SEIR 和 AI 預測修正》(Modified SEIR and AI prediction of the epidemics trend of COVID-19 in China under public health interventions)的論文。

根據論文,研究團隊將 2020 年 1 月 23 日前後的人口遷移數據及最新的新冠肺炎流行病學數據整合到 SEIR 模型中導出流行曲線。值得一提的是,團隊還利用 AI ,以 2003 年 SARS 數據為基礎進行訓練,從而更好地預測新冠疫情。

具體來講,研究人員通過引入移入參數 In(t)和移出參數 Out(t)修改了原始 SEIR 方程,進而解釋動態易感 [S] 和暴露 [E] 種群狀態。修改後的模型如下圖。

值得一提的是,研究團隊使用 LSTM(長短期記憶)模型——一種用於處理、預測各種時間序列問題的循環神經網絡(RNN),預測新增感染數隨時間的變化。

對於基本訓練數據集,研究團隊使用了 2003 年 4-6 月 SARS 的病例統計,同時納入 COVID-19 流行病學參數,如傳染概率 b、傳染係數(率)β、潛伏率 σ、退出率 γ 等。

此外,由於數據集相對較小,團隊開發了更簡單的網絡結構防止過擬合,並使用 Adam 優化器優化模型并迭代 500次。

根據上述方法,研究團隊預測,疫情將在 2 月底達到高峰,並在 4 月底得到基本控制。同時,如果國家實施的幹預措施推遲 5 天,中國大陸的疫情規模將增加 3 倍;如果取消湖北檢疫站點,將導致湖北省在 3 月中旬出現第二次疫情高峰,同時疫情可能持續至 4 月下旬——這些結果都得到了機器學習預測的證實。

在雷鋒網編輯看來,對於我國預測模型被國外權威期刊退回一事,我們應該持一個更加開放的態度,畢竟國內外預測模型的準確性孰優孰劣尚未可知。而且,被期刊退稿在科研過程中也並不稀奇,疫情當前,科學工作者的國別、立場不該是我們最關心的問題。

相關焦點

  • 鍾南山:疫情不一定發源在中國
    鍾南山:我們的預測是4月底基本控制(疫情);疫情首先出現在中國,不一定是發源在中國。據人民日報客戶端消息,鍾南山在會上表示,我們自己的團隊也在傳統模型基礎上加上兩個影響因素(國家強力幹預和春節後的回程高峰消除)之後,也做出了預測模型,我們預測高峰應該是在2月中接近二月底。2月15日數字果然下來了。我們的預測是4月底基本控制。
  • 鍾南山:有信心在四月底基本控制疫情,疫情首先出現在中國,不一定...
    但是大多數真正對突發性的傳染病重視度不夠,所以沒有進行持續的科學研究,這次新發的疾病,我的感覺是在治療上束手無策,只能根據很多原理,用現有的藥來治療,在十幾天二十天這麼短的時間裡,能夠研發新藥根本是不可能的,這是需要長期積累的,這也體現出我們預防和防控體系的問題。」鍾南山表示,我們這個世紀已經有三次冠狀病毒感染,所以凡是發現冠狀病毒感染,凡是一看有聚集性,馬上要非常嚴格處理。
  • 時間序列的LSTM模型預測——基於Keras
    那麼面對時間序列的預測問題,我們可以用傳統的ARIMA模型,也可以用基於時間序列分解的STL模型或者Facebook開源的Prophet模型。在機器學習或者人工智慧大熱的現在,深度學習等機器學習方法也可以用於時間序列的預測。今天介紹的就是如何基於Keras和Python,實現時間序列的LSTM模型預測。
  • 鍾南山領銜在頂級醫學期刊發文 鍾南山團隊論文詳情
    鍾南山領銜在頂級醫學期刊發文 鍾南山團隊論文詳情  2月29日,記者從廣州醫科大學獲悉,28日,鍾南山院士團隊論文在國際頂級醫學期刊《新英格蘭醫學雜誌》在線發表。該研究指出,嚴格、及時地採取流行病學措施,對遏制疫情迅速蔓延至關重要,對於疾病的有效治療方法仍需持續不斷努力探索。
  • 歐洲同行求助,鍾南山全程英文分享中國經驗:四個「早」是防控疫情...
    疫情發展趨勢預測 鍾南山提出,很多研究團隊公布的預測模型並沒有納入「政府及時幹預」等參數,因此預測結果並不準確。鍾南山所在團隊此前設計的預測模型(模型使用的數據截至2月9日)納入了更全面的參數,包括國家強力幹預、春節後回流高峰消除等。
  • 世衛力證中國清白後,美疾控中心承認:美國疫情早於中國數周出現
    據海外網12月1日報導,美國疾控中心的科學家承認,最新證據表明,早在2019年12月中旬,新冠病毒就出現在了美國,比中國首次發現新冠病毒提前了數周,比美國公共衛生部門公布首例確診病例早了一個月。美媒指出,這份報告足以證明,美國出現新冠病毒早於中國數周,中國絕不可能是新冠病毒的發源地。事實上,隨著科學家深入調查,越來越多的證據浮出了水面。法國科學家發現,早在2019年的12月,法國住院患者的樣本就存在新冠病毒。
  • 鍾南山團隊用大數據、人工智慧預測疫情走勢
    會上,廣州醫科大學呼吸疾病國家重點實驗室PI楊子峰表示,疫情發生後,作為鍾南山院士團隊的一員,他也第一時間投入到應急工作中來。廣州醫科大學呼吸疾病國家重點實驗室PI楊子峰。「每一次新發的重大呼吸道傳染性疾病對我們來說都是從零開始的認識過程。」
  • 鍾南山團隊已建起新型冠狀病毒感染的肺炎預測模型,可預測4天後走勢
    據廣州日報,連日來,鍾南山院士團隊已建立起相關的預測模型,可預測4天後走勢!據悉,前期,廣醫一院、呼吸健康研究院鍾南山院士團隊已經探索並建立起流感病毒預測模型,進行了探索性的預測,發現預測值跟真實值幾乎重疊,有效預測流感4天後的流行走勢(圖1、圖2)。
  • 鍾南山:實現疾病的早發現早幹預,將是我們最大的成功
    來源:科技日報科技日報記者 葉青 通訊員 林捷最近,黑龍江、青島、成都等地發現零星新冠肺炎病例。「國內疫情防控面臨兩大風險,一是境外輸入;二是出現傳播路徑新情況,即新冠病毒從原來的人傳人到現在通過環境傳人。
  • 預測精準度明顯優於國外預測模型
    深圳特區報廣州11月28日電(記者 劉良龍)11月27日晚,廣東省南山醫藥創新研究院發布消息稱,由國家呼吸醫學中心、廣州呼吸健康研究院、國家呼吸系統疾病臨床醫學研究中心開發的全球新冠疫情科學預測系統(公測版)正式上線。
  • 使用LSTM深度學習模型進行溫度的時間序列單步和多步預測
    本文展示了如何進行多步預測並在模型中使用多個特徵。本文的簡單版本是,使用過去48小時的數據和對未來1小時的預測(一步),我獲得了溫度誤差的平均絕對誤差0.48(中值0.34)度。利用過去168小時的數據並提前24小時進行預測,平均絕對誤差為攝氏溫度1.69度(中值1.27)。
  • Nature 子刊重磅:騰訊與鍾南山團隊發布新冠危重症 AI 預測模型 Cox
    模型,可分別預測5天、10天和30天內病情危重的概率,有助合理地為病人進行早期分診。這項成果已在2020年7月15日發布於國際頂級期刊《Nature》子刊《Nature Communications》。
  • 鍾南山院士權威談疫情:全球4月底可望控制下來,中國不會有「第二波...
    疫情席捲全球,確診病例逼近90萬人,死亡病例也已超過4萬4000人。中國抗疫權威鍾南山1日表示,隨著各國採取強而有力的措施,疫情到4月底應該能夠控制下來。對於中國國內疫情,鍾南山也樂觀認為不會造成第二波高峰。
  • 全球新冠疫情科學預測系統上線 鍾南山參與開發
    (抗擊新冠肺炎)全球新冠疫情科學預測系統上線 鍾南山參與開發中新網廣州11月27日電 (蔡敏婕)廣東省南山醫藥創新研究院27日晚發布消息稱,全球新冠疫情科學預測系統(公測版)上線。在新冠肺炎疫情暴發之際,中國工程院院士鍾南山、廣州呼吸健康研究院院長何建行帶領核心研究團隊並聯合第三方專業的人工智慧團隊對中國,尤其是高風險地區的疫情進行了流行預測,此本土開發的預測模型為中國抗擊疫情提供了科學支撐。
  • 前沿研究丨鍾南山院士:中國抗擊新冠病毒肺炎疫情的戰略與進展
    近日,中國工程院院士、著名呼吸病學專家鍾南山教授科研團隊在中國工程院院刊《Engineering》2020年第10期「新冠病毒肺炎專刊」上撰文,總結了中國抗擊新冠病毒肺炎疫情的戰略與進展。迅速宣布「人傳人」,鑑別中國境內疫源區並採取「封城」及交通限制等,是實現「早發現、早診斷、早隔離、早治療」的前提,也是遏制大流行病迅速蔓延的關鍵步驟。確定傳播途徑和感染源,迅速部署非藥物幹預措施,為控制全國範圍內的疫情提供參考策略。目前如何管控境外輸入病例,從而避免局部地區疫情的相繼暴發仍是一個挑戰。
  • 鍾南山發布會講話全文來了!全程高能
    對此提出兩個應對措施:一是武漢一定要控制住,大大加強支援武漢的醫護力量和物資力量;加強全國聯防聯控,「早發現、早診斷、早隔離是最古老也最有效的方法」。所以沒有發生全國性的大爆發。從國家戰略層面看,對病情預測怎麼樣?
  • 鍾南山團隊新研究:如延後5天採取隔離,全國感染或達35萬!相關論文...
    大數據文摘出品作者:曹培信、牛婉楊、劉俊寰2月28日,《胸部疾病雜誌》(Journal of Thoracic Disease)刊發了鍾南山院士團隊最新研究文章。研究基於優化模型SEIR和人工智慧預測:中國新冠肺炎疫情在2月下旬達到高峰,4月底趨於平緩。
  • 2020年這次疫情會鬧多長時間?不知道你怎麼看?看專家的相關預測
    而目前疫情的發展趨勢確實是有那麼一點符合老祖宗的智慧了。但是,我們要相信我們可以有現在的成就,更多的是我們全國人民的共同努力。那麼2020年這次疫情會鬧多長時間?不知道你怎麼看?今天相關專家帶我們一起來預測一下。
  • 全程英語,鍾南山院士與歐洲分享中國經驗
    疫情發展趨勢預測鍾南山提出,很多研究團隊公布的預測模型並沒有納入「政府及時幹預」等參數,因此預測結果並不準確。鍾南山所在團隊此前設計的預測模型(模型使用的數據截至2月9日)納入了更全面的參數,包括國家強力幹預、春節後回流高峰消除等。
  • 鍾南山院士與歐洲分享中國經驗
    新冠肺炎病毒基本特徵與檢測首先,鍾南山介紹了此次新冠肺炎疫情的基本特徵:包括病毒的基因序列情況、人傳人性質以及多種傳播途徑等等。談到新冠肺炎病毒的檢測,鍾南山介紹了團隊開發的快速IgM(免疫球蛋白M)檢測試紙,可以作為核酸檢測的補充手段。