新型冠狀病毒肺炎的疫情,咱們中國疫情防控的進展非常迅速,湖北之外的很多城市已經很少發現新增的患者,開始慢慢恢復正常的生活秩序。
而更嚴重的問題在其他國家:全球除中國以外的患病人數已經超過1萬,韓國、日本、義大利、伊朗和美國都出現了社區傳播的跡象。因為患者基數龐大、傳播隱匿性強,我們人類可能將不得不面對和這種病毒、這類傳染病長期共存的新趨勢。
浙江大學教授、「得到」作者王立銘老師,一直在關注這次疫情的進展。在這個月的《巡山報告》中,他想和你討論一個被很多人關注的問題:新冠病毒到底是從哪裡起源的?歡迎你查看下面的文章。
源頭不一定在武漢
由於這次新冠病毒是2019年冬天從武漢流行起來的,而且最初不少患者都和武漢地區的華南海鮮市場有過密切接觸,因此一直以來的一個主流認知是,這種病毒的源頭就在武漢,就在華南海鮮市場。
在新冠病毒剛開始流行的2019年,武漢地區的醫生們根據患者的生活軌跡,推斷出「這種疾病大概和華南海鮮市場有關係」。這當然是很合理的推測。這個推論對於他們準確和及時地認識到這種全新疾病的存在,有很大的幫助。
這不難理解。新冠肺炎的症狀本身並不特別典型,不容易和其他的病毒性肺炎區分。在疾病剛出現的時候,人們還不知道它的病原體是什麼,更沒有基於核酸或者抗體的疾病檢驗手段,要是連「華南海鮮市場」這個抓手都不存在,醫生們就更難確認他們面對的是一種什麼疾病了。
不過,即便是在2019年12月份,也已經出現了和華南海鮮市場沒有明確接觸史的患者。實際上,目前有據可查的第一個發病的新冠肺炎患者,就沒有去過那個市場。這就讓這種病毒的源頭變得撲朔迷離。
我得強調一下:有些早期確診的患者和華南海鮮市場沒有密切接觸,這本身既不能說明新冠肺炎和華南海鮮市場有關,也不能說明新冠肺炎和華南海鮮市場沒有聯繫。
道理稍微有一點繞,但是我相信你能夠理解:雖然這位患者是有據可查的第一個發病的患者,我們有時候會叫他「一號病人」,但他是不是歷史上第一個新冠肺炎患者,也就是所謂的「零號病人」或者「初始病例」呢?我們並不確定。
也有很大的可能是,那些更早發病的患者由於症狀輕微,沒有就醫自己就好了;或者他們就醫了,但是被醫生當成其他疾病治療了;又或者雖然他們感染得早,但是潛伏期更長,所以反而發病時間更晚。如果真是這樣的話,早期沒有華南海鮮市場接觸史的患者,完全可能是被這些至今還沒有找到的患者感染的。
基於同樣的理由,儘管武漢特別是華南海鮮市場周邊是本次疫情的暴發源頭,這是有充分依據的。但是,我們實際上也沒有證據證明新冠肺炎就一定是起源於武漢,起源於華南海鮮市場。新冠病毒確實有可能是在其他的時間和地點第一次進入人體,然後開始人際傳播的。
這種一開始比較「安靜」,突然在某個環境因素催化下開始暴發的傳染病,歷史上比比皆是。比如說著名的1918年大流感,在1918年初暴發的時候並沒有特別兇險,但是在當年夏天,流感病毒突然進化出了超高的致死能力。
這個很讓人頭疼的問題,進一步證明了病毒溯源研究的重要性。
我們需要仔細研究新冠病毒的人際傳播規律和進化歷史,搞清楚它從天然宿主到中間宿主再到人類世界的完整鏈條。這些信息不光能幫助我們更好地理解這個敵人,也能幫助我們切斷傳播鏈條,預防它再次暴發。
目前,雖然新冠病毒的天然宿主應該就是蝙蝠,但是蝙蝠體內的哪種病毒、通過什麼途徑進化出了能夠感染人類的新冠病毒,通過什麼樣的中間宿主的傳導,這些進化過程又發生在什麼時間和什麼地點,仍然有太多的未知數。
方法一:追蹤華南海鮮市場
想要搞清楚病毒的真正源頭和傳播路線,一個辦法就是先從武漢、特別是華南海鮮市場入手。畢竟那裡仍然是最可疑的地點,不是第一現場,也是第二現場。
但麻煩的是,因為2019年12月底武漢的醫生就推測新冠肺炎和華南海鮮市場有關,所以當地有關部門在2020年元旦就已經關停和清理了那個市場,市場內販賣的各種動物也不知去向。這個操作本身當然是合情合理的,但遺憾的是,清理的時候可能沒有注意採集那些動物樣本,留待日後研究。所以現在,我們就沒有辦法知道,那個市場裡販賣的動物、特別是野生動物身上,是不是真的攜帶新冠病毒了。
歷史上,在SARS的研究過程中,科學家們之所以能夠鎖定果子狸作為病毒傳播的中間宿主,正是因為他們在SARS暴發地附近的市場裡的果子狸身上,找到了一種和SARS冠狀病毒相似度高達99.8%的病毒。
儘管後來中國的疾控部門宣稱,他們從海鮮市場的環境樣本,也就是土壤和水裡,檢測到了病毒的基因序列,但是這種環境檢測的作用,遠不如真的找到一隻或者一批確實攜帶病毒的動物標本。
當然,我猜想我們仍然可以通過追蹤海鮮市場的工作人員和進貨渠道,進一步尋找可能的病毒源頭。但是這些研究,可能需要等到武漢地區的生活秩序恢復正常,才有可能開展。
方法二:追蹤病毒基因序列的變異
既然如此,我們只好退而求其次採用第二個辦法——利用病毒基因序列變異和進化的規律,通過分析目前存在的病毒樣本,去做追根溯源的工作。
這個研究的邏輯本身很簡單。我打一個通俗的比方。比如,我們從三個患者身上分離出了新冠病毒,通過檢測病毒的基因序列,發現患者1身上的病毒有基因突變X,患者2身上的病毒有基因突變X和Y,患者3身上的病毒有三個基因突變——XYZ。那麼,一個最簡單的推測就是,病毒的傳播應該是1早於2、2早於3,並且它們在這個過程中逐漸積累了更多的基因突變。
這個時候,如果你又找到了第四個患者,他身上的病毒沒有XYZ的突變,但是有突變W,那你也可以推斷,這個患者身體裡的病毒,大概和患者123的關係更遠一些,可能不是一個家族的。
實際上,這並不是一種全新的方法。進化生物學家們一直在用類似的辦法分析地球生物彼此的關係。
在2004年,中國科學家們也用類似的方法繪製了SARS冠狀病毒的傳播和進化路線,取得了很大的成功。
陸續發表的三項研究
在過去這段時間,有三篇論文陸續發表。
2020年2月22日,中科院西雙版納植物園的科學家們在論文開放平臺上發了一篇論文;
2020年3月2日,協和醫學院、疾控中心和美國加州大學的科學家們在另一個開放平臺bioRxiv上發表了一篇;
2020年3月3日,北京大學的科學家們在國家科學評論(National Science Review)雜誌上發表了另一篇。在這三個研究中,他們都用了剛才咱們說到的這個思路,研究新冠病毒的源頭和進化傳播路線。
三項研究的思路大同小異,但是結論有些技術性的差別。我們就用西雙版納植物園的那項研究,來具體看看科學家們到底做了什麼,又說明了什麼問題。
在這篇論文裡,科學家們分析了從世界各地的患者身上分別提取的90多個新冠病毒的基因組序列,並根據這些基因序列的差異大小,把它們分成了ABCDE五組。
然後利用咱們剛才討論的邏輯,以及新冠病毒起源於蝙蝠的假設,猜測了不同組別之間的傳播順序,結論大致是A-B-C-D/E。而在這個進化和傳播鏈條上,武漢地區採集的病毒主要屬於C組,A組和B組的病毒樣本則來自武漢之外。其中,A組來自深圳患者,B組來自美國患者。
既然更古老的病毒來自武漢之外,於是研究者們就得出了「病毒可能來自華南海鮮市場之外,只是在華南海鮮市場暴發」這樣的推論。
實際上,對於「新冠病毒2019年12月出現在武漢」這個說法,我也一直是比較懷疑的。一個直接的證據是,至今為止完成了基因組測序的新冠病毒大概有130多個,它們來自世界各地的患者,但是這些病毒之間基因序列的差異非常微弱,沒有明顯的變異和進化方向。
這一點和2003年的SARS病毒截然不同,SARS病毒在傳播過程中一直在發生高強度的變異。
這說明了什麼呢?一個通俗的理解就是,這次的新冠病毒已經進化得很適應人體,不需要再進化了。
我們知道,新冠病毒是一種來自動物的病毒,在進入人體之前並沒有未卜先知的能力去適應人體。所以,可能的解釋只有兩個——要麼這個病毒在去年12月第一次進入人類世界的時候,就恰好具備了比較完備的各種特性;要麼就說明,它可能在此之前就已經進入人類世界默默傳播一陣子,逐漸進化出了適應人體的特性,然後才在武漢暴發。
我個人會覺得,後一個解釋更符合常理。
這些研究存在的問題
但是猜想歸猜想,再合理的猜想也需要具體的研究數據做支撐。而剛才這項研究看起來很合理,但本身的說服力其實並沒有那麼強。
這裡面大概有兩個原因。
首先,根據基因組序列的變化給病毒分類,進行傳播和進化鏈條的研究,本身當然是重要的研究思路,但是這些研究必須和病毒在真實世界裡的表現結合起來,才能說明問題。
比如前面提到,攜帶A組病毒的深圳患者和攜帶B組病毒的美國患者,雖然確實是在深圳和美國華盛頓州被確診的,但是仔細調查發現,他們在2019年12月到2020年1月這段時間,都曾經在武漢旅行和探親。
考慮到那時候,武漢地區已經有了一批新冠肺炎患者(有些模型估計至少有數千人的規模),那這些患者在武漢停留期間被感染的可能性,顯然比他們在深圳和美國被感染的可能性大得多。
而且,雖然這些患者可能並沒有親自去過華南海鮮市場,但我們仍然無法確定他們是不是被某些華南海鮮市場的密切接觸者傳染的。
也就是說,這個證據本身並不能說明更古老的A組和B組病毒不是起源於武漢地區、不是起源於華南海鮮市場。
說得更廣泛一點,基因組信息要結合大量真實世界的信息,才能發揮更大的作用。
比如說,我們根據基因組序列的變化把病毒分成幾類,如果每一類都正好對應了病毒傳播的時間、地域、路線,或者對應了病毒的繁殖速度和毒性的變化,又或者對應了人被感染之後症狀的差異,那就可以很放心地說,這種病毒的分類是有生物學現象的支持的,是有道理的。
而現在,這三項研究提出的病毒分型,在基因組序列層面當然是成立的,但目前都還沒有找到生物學依據和支持。因此,這種分類的價值以及能解決的問題,就需要打一個大大的折扣。
這項研究的說服力沒有那麼強的第二個原因是:利用基因變異的規律分析病毒的傳播和進化鏈條,這個方法成立的前提是,病毒在傳播過程中確實發生了大量的基因變異。只有這樣,我們才能通過分析這些基因變異尋根溯源。
但是剛才也提到過了,新冠病毒的基因突變其實非常稀少。在至今被測序上傳的130多條病毒序列中固然發現了100多個突變位點,但是大量的病毒只攜帶區區幾個基因突變,而且彼此之間的基因突變還不重疊,沒有形成特別明確的「熱點」。這就給繪製它們的傳播和進化鏈條造成了很大的麻煩。
我還是打個通俗的比方。剛才咱們講過患者1、患者2和患者3的例子,但如果這三個患者身上病毒的基因突變不是X、XY、XYZ,而是XY、XZ和W,我們就很難判斷他們三者的傳播順序了。
當然,你可以大概猜測XY和XZ的關係應該大於XY和W的關係,但是誰先出現、誰傳給誰,就很難分析了。對不對?
換句話說,在我們討論的這項研究中,科學家們固然給病毒分成了五組,然後根據它們和蝙蝠病毒的區別大小,計算出了一個A-B-C-D/E的傳播鏈條,但是由於病毒的基因突變太少,也因為我們還不能完全確定新冠病毒到底來自哪一種蝙蝠病毒,這個鏈條本身的可靠程度是不太讓人放心的。
換一個算法、換一個統計學模型、換一個起源假設,可能結論就會大相逕庭。
比如,剛才提到的3月2號和3月3號發布的另外兩篇論文,科學家們就根據不同的計算模型,把這些病毒分成了兩類(也就是S型和L型),而不是五類,而且也分別猜測了這兩類病毒可能的傳播和進化順序。所以你看,使用不同的病毒序列、用不同的分析方法和統計學標準,我們得出其他的分類方法也不是不可能。
而要解決這兩個問題,唯一的辦法就是測出大量病毒的基因序列,用數量進行暴力攻擊,然後再結合相對應的患者的發病時間、地域、活動軌跡、疾病情況等等開展分析,才能得到更可靠的結論。
但問題是,至今為止全世界有超過9萬例新冠肺炎患者,卻只有130多條基因組序列被分析和上傳。這顯然是遠遠不夠的。
更麻煩的,還有基因序列的代表性問題。在患者最為集中的武漢地區,被上傳的病毒序列只有20來條。不僅低得不成比例,而且大部分還都來自12月底和1月初這段時間。而對病毒攜帶者進行更詳細的追蹤和分析,目前還遠沒有做到。
要 點 小 結
好了,說了這麼多,我們簡單小結一下:
1.從科學上說,我們確實還不知道新冠病毒真正的源頭是哪裡。它可能源自世界上任何地方,然後在2019年12月的武漢出現了第一次大暴發。
2.鑑於華南海鮮市場內的動物樣本可能已經被破壞,我們最大的希望是利用病毒基因組序列繪製傳播和進化鏈條,找到病毒的最初源頭。這正是這次我們討論的三篇論文試圖解決的問題。它們的研究思路和方法都是合理的,但是目前我們掌握的病毒基因組序列數量太低、代表性太差,類似研究的結論可信度需要打一個大大的問號。
3.在掌握更多的數據得到更可靠的結論之前,武漢地區仍然是最值得我們繼續挖掘和分析的第一或者第二案發現場。分析武漢地區病毒的傳播規律、人群的歷史感染率,是研究課題的重心。
4.想要真正展開這樣的研究,要在全世界範圍內,特別是對武漢地區內部的新冠肺炎患者,做大規模的病毒基因序列分析。這本身應該沒有特別大的技術障礙。目前在不少地方,給疑似新冠肺炎患者做核酸檢測已經非常常規,用同樣的樣品做一下基因組測序也很方便。而且,我們還需要一個機制來保護檢測者的權益,也保證這些基因組序列信息的分享和使用。
5.這些病毒的基因組序列信息,如果能夠結合真實世界的信息,特別是患者發病的時間、地點、症狀,將會起到更大的作用,幫我們徹底搞清楚病毒的傳播規律,設計相對應的防控措施。