梁建章:用統計學思維確定防疫隔離天數

2021-01-08 網易財經

當前,中國正在傾全國之力來控制疫情。可喜的是,很多地區的疫情開始趨於穩定。但與此同時,整個社會也在為此付出高昂的經濟代價。如何在防治疫情和恢復之間找到平衡點,會成為目前乃至今後一段時間內的難題。至於解題的關鍵,就是需要來精準計算不同措施的綜合成本和各種情況的概率。從根本上看,傳染病其實是個隨機事件,所以在防治疫情的過程中,我們需要運用更多統計學的概念,來幫助各方面理性對待各種隨機現象,從而避免過度恐慌,做出正確的判斷和決策。下面我們舉兩個例子:

有關潛伏期的擔憂

比如,鍾南山團隊近日在網站上發布最新論文,披露了針對1099例新冠病毒感染者的回顧性研究成果。這篇論文對未來的疫情防治工作提供了重要的決策支持,但其中提到的潛伏期最長可達24天的結論,卻引起不少人的恐慌——原來不是一直說潛伏期最長14天嗎,現在怎麼變成24天了?到底是前面的結論錯了,還是病毒已經變異得更加可怕了?當前各地執行的14天隔離期是否需要延長到24天?

其實大可不必如此恐慌,幾乎所有涉及到群體生理乃至其他特徵的結論,都具有一定程度的不確定性。要更好地理解這些結論的意義,需要對統計學知識有個基本的了解。在流行病學中,疾病的潛伏期通常可以用對數正態分布來近似,這種近似的合理性往往可在病原體繁殖動力學上得到一定解釋。簡單來說,這相當於假設 log(潛伏期) 服從正態分布。對數正態隨機分布都存在一個長尾,儘管長尾部分的概率很小但不是零,如果樣本量足夠大,長尾部分的小概率事件還是有可能發生的。

鍾南山團隊在論文中提到潛伏期的中位數為3.0天,這意味著 log(潛伏期) 的均值為1.1。在均值已經確定的前提下,log(潛伏期)的標準差越大,潛伏期的尾部概率也越大。根據鍾南山團隊的論文,1099例中潛伏期最長為24天。我們使用蒙特卡洛模擬方法可以推算出,當 log(潛伏期) 的標準差為0.64,1099例中最長的潛伏期的中位數為24天。這個對數正態分布中,百分之九十以上的患者的潛伏期在7天以內。(具體計算:(Log 7-log 3)/0.64= 1.32σ,可以查正態分布的計算表格,就可以得到超過1.32個方差以外的概率<10%)

我們還可以模擬出,任意一個病例的潛伏期超過14天的概率為0.838%,超過24天的概率為0.062%。顯而易見的是,觀察到的病例越少,這些病例中的最長潛伏期也越短。如果我們只觀察83個病例,那麼其中最長潛伏期的中位數就只有14天。如上所述,當觀察病例達到1099時,最長潛伏期的中位數就會達到24天。

所以,不用質疑鍾南山以前的結論,或者據此擔心病毒發生了變化。其實還是同樣的病毒,同樣的潛伏期隨機分布,只是在樣本量增加之後,長尾的小概率事件就有可能發生。專家們當然還會據此進行更深入的研究,而普通人卻不必為極小概率而過度恐慌。

做個簡單的類比. 如果觀察1000人,最高的身高可能是1.9米,如果觀察10000個人,最高就可能超過2米,我們都知道,世界上存在著身高2.2米以上的人類,然而,在實踐中的建築標準只要房門高度達到2.0米就夠了。同樣的道理,不要因擔心現有的檢測和隔離制度會因為一兩個極端病例而被徹底顛覆。

有關氣溶膠的擔憂

近期還有一個引發了不少恐慌情緒的關鍵詞,叫做「氣溶膠」。因為曾有人公開表示,目前確定的新冠肺炎傳播途徑,除了原先眾所周知的直接傳播和接觸傳播之外,還有氣溶膠傳播。一時間人們又變得緊張了起來,以為只要感染者曾經路過某個區域,然後由其呼吸所產生的「氣溶膠」,就可能導致之後途經該區域的其他人感染病毒。

對於這種「氣溶膠傳播」的說法,之後又有其他權威專家表示,目前尚沒有證據顯示新型冠狀病毒通過氣溶膠傳播。但即便在澄清之後,部分公眾仍然對於這個概念心有餘悸。其實在我們看來,這種情緒同樣屬於過度恐慌。至於消除恐慌的關鍵,依然是懷著科學精神,從統計學的角度來尋求答案。

病毒傳播其實也是一個隨機事件,不排除有極小概率以某種特殊方式進行傳播,但關鍵是概率到底有多低?如果在現有已經確診的幾萬個病例中,僅有幾例是因為特殊方式被傳染的,那麼更精確的表述,應當是在四個九的可靠性下,病毒只是通過近距離途徑傳播。至於「氣溶膠傳播」,如果僅僅存在理論上的可能性,實踐中卻很難達到符合條件的場景,那麼對於絕大多數人來說,仍然只是極小概率的威脅。

還有,我們在看待各類數據的過程中,還必須把各種測量誤差考慮進去。在目前的檢測中,必然存在一定數量的假陰性和假陽性的誤差。假設,現有檢測方式存在假陽誤診概率(即沒有患病的情況下被錯誤診斷),人群中又有一定比例的人具有一般感冒的症狀,當我們測試幾十萬到幾百萬的人群時,不免有相當數量的被確診,但是實際真的只是普通流感患者。而且這些誤診的人完全沒有到武漢或者緊密接觸武漢的歷史。如果硬是要把這些誤診的人尋找傳染源的話,那就需要偵探小說的想像力,會誇大了這個病毒的真實傳染性。又會引發新一輪的沒有必要的恐慌。

結論

所以說,消除恐慌最有效的方式,就是學會從研究概率和統計學的角度來看待消息。公眾千萬別因為外界對於少數不幸事件的聚焦,就喪失從整體統計中獲取信心的思考。更為重要的是,決策者也需要以冷靜而客觀的態度,來分析目前呈現出來的各項數據,據此在制定政策時實現平衡,避免在過度恐慌的背景下出現極端做法,為追求所謂的「零風險」,而徹底犧牲其它領域,導致整個社會為此付出過於高昂的成本。正如我們之前文章中所分析的那樣,如果經濟遭受沉重打擊,那麼由此產生的副作用,最終也會導致人均壽命的下降,以另一種形式付出生命的代價。還有些情況下,過度恐慌所造成的極端決策,會直接導致其他各類風險的上升。比如曾有新聞報導提及,在湖北省黃岡市黃梅縣,母親要帶著女兒接受白血病的二期治療,卻因為封路而無法前往武漢,險些造成悲劇。

我們在隔離方面也是要更加精準。目前對於很多返程人員,部分地區要求一律自行隔離14天。表面上看,這自然是為了將風險降到最低點。但實際上,返程人員到底來自疫情嚴重地區還是其他地區?返程之前在當地是否接受過隔離?這些變量會導致傳染風險出現天差地別的變化,如今一刀切地全都要求隔離14天,顯然並不是最科學的做法,同時也可能稀釋基層日趨緊張的防治資源。

現在很多地方,交通設施和小區採取以戶籍作為隔離依據的粗暴方式,使得很多人在各地被重複隔離甚至無家。更為理性而有效的做法,應當在國家出面,組織專家,出臺評估風險的相關規則以及針對不同風險等級的不同措施,避免各地制定重複和過激的限行和隔離政策。政府還可以利用移動通信技術,根據個人在短期內的旅行軌跡,來估算相關人員的感染風險,進而作為各地採取限制措施的依據。如果國家的隔離和限行規則能夠執行到位,確保現在進入低發地區的人都是低風險的,那麼在這些地區也不需要大面積帶口罩,這樣口罩也就夠用了。另外隔離時間也不應追求要做到零風險,對於無症狀者甚至不需隔離14天,只要下降到和當地普通人群差不多就可以放行。按照我們本文簡單模擬估算的數學模型,隔離7天就能成功排查出百分之九十以上的感染者,也就是說把風險降低到了只有原來的百分之十。如果,對於很多人群可能隔離7天就夠了,那麼就會大幅降低經濟和社會成本。(需要提醒讀者的是,我們的模型只是基於鍾南山的文章非常有限的幾個數據,一線的專家應該可以給出更加精確的模型)

未來這段時間裡,疫情防治即將進入最關鍵的攻堅戰。值此時刻,對任何一種隨機事件的描述,都應該從概率和統計的角度進行考慮,要理解隨機事件不可能實現絕對的零風險,並且避免為不切實際的追求付出額外代價。相信所有人都希望,整個社會最終能用最小的代價,來獲取最好的疫情防治效果。要想實現這個目標,就需要綜合各類數據進行精準的統計和概率計算,幫助我們制定科學理性的控制疫情的政策。

本文來源:網易財經 作者:梁建章 黃文政 責任編輯: 鍾齊鳴_NF5619

相關焦點

  • 梁建章:用統計學思維精準控制疫情
    編者按:本文作者梁建章 黃文政,創業邦經授權轉載。當前各地執行的14天隔離期是否需要延長到24天?其實大可不必如此恐慌,幾乎所有涉及到群體生理乃至其他特徵的結論,都具有一定程度的不確定性。要更好地理解這些結論的意義,需要對統計學知識有個基本的了解。在流行病學中,疾病的潛伏期通常可以用對數正態分布來近似,這種近似的合理性往往可在病原體繁殖動力學上得到一定解釋。簡單來說,這相當於假設 log(潛伏期) 服從正態分布。
  • 富士康工程師因不能返臺投訴,在大陸隔離時間不算派駐天數
    集微網消息(文/小山)據經濟日報報導,一名派駐在深圳富士康的臺灣工程師向該報投訴稱,原本公司規定派駐滿35天可放返臺假7天,但現階段抵達深圳,當地法規要求隔離14天,而公司又規定隔離時間不累計至派駐天數中,因此要待到49天以後才能申請返臺。該規定已引起諸多工程師不滿,希望集團能做出修改。
  • 梁建章:抓住絕佳時機吸引國際人才
    文/梁建章 攜程網聯合創始人、董事局主席 來源:經理人傳媒旗下《經理人》雜誌自七月以來,備受關注的「五個一」政策①終於出現了一些積極的變化。比如從第一季度就開始停飛中國的英國航空,自8月9日起將恢復倫敦—上海航線,每周兩班。在此之前,法航、漢莎航空以及中韓航司也都相繼突破了「五個一」的限制。
  • 梁建章、黃文政:抗擊疫情與全球合作
    圖片來源@視覺中國 文丨梁建章 黃文政 中國近期的防疫工作重點,已經從國內防控轉向防止疫情境外輸入。包括在國與國之間的入境限制方面,國際形勢也從「外國限制中國人入境」變成了「中國限制外國人和海外華人入境」。
  • 你真的懂了什麼是統計學嗎?其實統計學也是科學思維的訓練
    孫振球主編的醫學統計學 醫學統計學其實是一門非常考驗個人邏輯思維能力的學科。從醫學統計學的定義裡我們可以完全貫穿基礎統計學的所有章節。從統計描述到統計推斷,各個章節內容嚴整,無毫髮爽。其實醫學統計學也是如此,我們不僅僅需要掌握每一種統計學方法的定義、使用條件,更需要的是在實驗設計階段或者在給出的待處理的數據面前找到適合它們的正確的統計學方法,這才不失為一個成功運用統計學的醫學人才。這裡面不僅僅需要完整的貫穿於整個基礎統計的邏輯思維,也需要我們能夠「照方抓藥」,我覺得這是非統計學專業的醫學工作者學習醫學統計學的最根本的目標。
  • 螢石居家隔離人員防疫解決方案 開創「人機聯防」新模式
    當前,疫情防控進入關鍵階段,各地正積極落實疑似人員的集中隔離政策。除了人力以外,科技也在積極參與這場疫情防控戰,螢石推出居家隔離人員防疫解決方案,開創"人機聯防"新模式,用"智慧"助力疫情防護。雖然年初疫情期間的高強度"實戰"讓各居民區的幹部、社工都練就了過硬的本領,但面對疫情常態化下出現的新情況、新挑戰,"智慧"社區防疫顯得更為重要。螢石疫情隔離方案簡單高效螢石居家隔離人員防疫解決方案,由螢石智能家居攝像機+螢石雲+手機/電腦組成。
  • 梁建章直播之餘還寫了本科幻小說 網友:這是在布局火星旅行?
    梁建章的個人IP,在這次疫情中與攜程深度融為一體,他像是攜程「星際戰艦」的掌舵人。在攜程直播間裡,梁建章百變coser造型出場,4個月11億、為1000多家高星酒店帶貨超100萬間夜、1秒售出8間房、為境外高星酒店帶貨1個億。
  • 統計學的實質是什麼?--寫給所有將要或者正在學習統計學的朋友們
    他提出了假設檢驗思想,也就是統計學的最為核心的思維與方法。現代統計學的發展直至今日,仍然主要以Fisher的思想體系為基礎。統計學思維認為,客觀世界存在著一些普遍性的規律。這些規律,雖然是確定的,但是不可知的。因為客觀世界的規律是所有群體表現出來的特徵,統計學稱之為總體的特徵。總體特徵可否直接得到?不能。人類能夠聽到的、見到的、感覺到的,只是總體客觀世界的局部反映而已。
  • 沒「隔離」就開店?化解矛盾、推動治理,檢察人在防疫志願工作中...
    居委會反饋,自重點地區返滬的人員必須進行隔離,且明確規定不能開店,但對該店店主這樣自非重點地區返滬的人員,對其的要求是自行居家隔離,對於他是否能開店,並未做嚴格規定。因此,對於他的處置頗為為難。  獲得反饋後,鬱衛平沒有因為已將該問題上報居委會就對該問題置之不理,他拿出平時在第六檢察部服務群眾的精神,細心思考後續處置辦法。
  • 統計學知識大梳理(終極篇)
    用數據說話,讓你的說服力爆表。現在職場上的人們,誰不要給領導匯報工作,或者團隊之間討論問題。當你匯報和討論的時候,光說,「我覺得」,「我保證」,「根據我的經驗」,這些個詞太沒有信服力了。必須說數據,擺事實。利用清晰的數據傳達具有強有力說服的信息。體驗一種與眾不同的思維方式。很多人的思維方式,非黑即白。
  • 玉環全力守牢冷鏈食品防疫安全關:已集中隔離密切接觸者,核酸檢測...
    發現這一情況後,玉環市迅速採取貨物封存、人員排查隔離、場地消殺等應急處置措施,對城關中心菜市場進行全面清洗消毒,對陽性樣本所在攤位及周邊環境進行終末消毒、封鎖,對儲存過該批次貨物的場所進行終末消毒。目前,玉環市已集中隔離密切接觸者,並採集咽拭子進行核酸檢測,已出檢測結果均為陰性;採集城關中心菜市場外環境及重點食品樣本,經核酸檢測均為陰性。
  • 梁建章:一開始不習慣 現在我認為自己是一名導遊
    近日,攜程集團董事局主席梁建章在接受中新經緯專訪時做出如上表述。對於2021年的旅遊業,梁建章還有何預測?其執掌的攜程又將有哪些新動作?以下是中新經緯採訪梁建章實錄(略有編輯):01「我認為自己只是一名導遊」中新經緯:2003年「非典」期間,你曾採取系列措施力救攜程。2020年的新冠肺炎疫情,攜程採取的自救措施有哪些不同?
  • 越南確定開放國際航線準入越南條件,部分人士入境後只需隔離5天
    越南確定重新開放國際航線時進入越南的條件,部分人士入境後只隔離5天從國外返回越南的人員必須具有當地衛生當局頒發的核酸檢測陰性的報告,並且必須根據法規進行檢測和隔離。在接受國際航班的越南機場,越南機場當局將與相關部門協調,以執行防疫法規,旅客接受檢疫部門的檢測。
  • 中藥香囊、八段錦、防疫茶……荔灣推出「最老廣」的隔離服務
    目前,納入隔離醫學觀察人員總計為1380人。在嚴防境外疫情輸入方面,江帆介紹荔灣區主要從建網、搭橋、築牆、送暖四方面落實防控工作。建好垂直高效的「服務網」。荔灣區成立了入境人員服務組,下設調度、文秘、督查、綜合、信息、保障6個專班。
  • 飛機上有湖北籍乘客,10名持綠碼被隔離乘客:浪費防疫資源
    但沒想到,因為機上有一名湖北籍或者到過湖北的乘客,導致這名乘客前後3排包括程小姐在內的10名人員,全部被集中隔離,而他們都持有健康綠碼。對於這種情況,程小姐覺得川航沒有提前告知,既耽誤自己的行程,又浪費防疫資源。
  • 【美國CDC新防疫指南將縮短隔離時間】兩位知情人士稱,美國疾病...
    2020-12-02 10:04:13來源:FX168 【美國CDC新防疫指南將縮短隔離時間】兩位知情人士稱,美國疾病控制與預防中心(CDC)周二告訴總統川普的冠狀病毒工作組,其新指南將把新冠病毒暴露人群的隔離時間縮短至多一半。
  • java計算兩段時間的重複天數
    最近在做一個功能,需要統計請假天數,按月統計。而實際的請假數據就包括跨月的情況,所以就出現一個這樣的問題。要計算本月內的請假天數。實際上就是求兩個時間段內的重複天數。大概有三種思路:一、常規思路以程式設計師的常規思維來看,計算兩個時間段內的重複天數,分為多種情況。包括 包含、相交、相離 另外還需要處理邊界值。每種情況又有細分,比如包含,如果是請假範圍包含月份範圍,則取月份範圍。如果月份範圍包括請假範圍,則直接取請假範圍。
  • 人口經濟學家梁建章:不生孩子的蝴蝶效應 正在影響20年後的中國人
    攜程集團董事局主席、北大光華學院經濟學研究教授梁建章在直播中做出了「從人力資源角度看中美科技競爭」的主題分享。一邊是不願生,一邊是求著生,中國年輕人與社會的生育矛盾,也深刻影響著中國在國際格局中的競爭力。人口數量作為人才儲備的分母,是考察一個國家人力資源的重要指標。
  • 數據分析必備——統計學入門基礎知識
    ——數據說·夢想季 導讀:要做好數據分析,除了自身技術硬以及數據思維靈活外,還得學會必備的統計學基礎知識!因此,統計學是數據分析必須掌握的基礎知識,即通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。
  • 劍橋詞典選出年度熱詞「隔離」,阿卡索外教用行動打破「隔離」
    日前,作為英語世界三大最為權威的詞典之一的《劍橋詞典》,公布了自己的2020年度熱詞——隔離(quarantine)。根據數據顯示,今年「隔離」一詞的搜索量最多,並且也是唯一一個在搜索高峰數量和總體瀏覽量兩項統計中都名列前五的詞彙,其最明顯的搜索高峰出現在3月18至24日的一周,當時很多國家受疫情影響啟動了封鎖政策。