2020年1月31日,印度理工學院德裡分校的研究人員在bioRxiv上發表了一篇論文,稱新型冠狀病毒是人為改造的病毒,因其刺突蛋白S蛋白上含有四個插入片段,這些片段與HIV-1的某些片段完全同源或具有相似性。
這篇未經審稿的論文掀起了諸多討論,雖然已被撤稿,但依舊給人們留下了疑問。2月14日,杜克大學醫學中心的Chuan Xiao等人在Emerging Microbes & Infections雜誌上發文,分析了新冠病毒中這四個插入片段與hiv-1等其他基因的同源性,駁斥了2019-nCoV可能是通過人為獲得HIV-1基因組中的一些基因片段而產生的「生化武器」這種觀點。
當一種新的病原體肆虐人類世界之時,探尋它的起源往往是一個亟待解決的關鍵問題。了解病原體的來源對阻止其進一步傳播以及加快疫苗研發等都是至關重要的,特別是對那些跨越宿主障礙的動物源性傳染病來說。例如目前已為人熟知愛滋病病毒、非典型性肺炎病毒以及中東呼吸症候群冠狀病毒等均是典型的例子。
然而,揭示一種新的人類病原體的來源需要廣泛而有力的科學證據,這是一個非常複雜的過程,往往耗時經年,不幸的是,在確認新病原體的真正來源之前,總有些陰謀論搶先浮出水面,稱新病原體是人為製造的。然而歷史終將給出答案,陰謀論終將被科學推翻。
2019年12月,中國首次報導了一種新型致病性冠狀病毒,這一病毒迅速擴散到25個國家。目前,它已經感染了45000多人,並已造成了1000多人死亡。科學家們僅用了兩周左右的時間就完成了這種新病毒基因組的測序工作,並於1月12日公布了結果。
1月13日,世界衛生組織 將這種新的病毒暫命名為2019-nCoV。進化分析顯示2019-nCoV是冠狀病毒的新成員,能夠感染人類。基因分析表明2019-nCoV與冠狀病毒同源,但它不同於引起非典和中東呼吸症候群的冠狀病毒,而是與2013年從雲南蝙蝠身上分離到的蝙蝠冠狀病毒RaTG13具有高度的遺傳相似性,這表明類RaTG13病毒很可能是當前2019-nCoV的源頭,但並非直接來源。
由於暫時無法獲知2019-nCoV的確切來源,人們開始猜測2019-nCoV可能來源於人為的基因改造,甚至有人認為這可能是一種生物武器。對此,媒體紛紛出來闢謠。然而,最近的一項發表在預印本上的非正式的研究報告表明,與其他冠狀病毒相比,在2019-nCoV的刺突糖蛋白中有四個插入片段,而刺突糖蛋白正是病毒進入靶細胞的關鍵蛋白。
該研究聲稱,這些插入片段與來自三個不同國家的某些獨特HIV-1毒株的囊膜糖蛋白或Gag蛋白中高度可變區 的基因序列相同或相似。結合蛋白結構模型分析,作者推測這些與HIV-1蛋白相似的插入片段可以增強病毒對宿主細胞上特異性受體的親和力,並擴大2019-nCoV宿主細胞的範圍。這項研究暗示2019-nCoV病毒可能是通過從HIV-1基因組獲得特定基因片段而人為產生的。
我們將2019-nCoV病毒、其他冠狀病毒和HIV-1病毒的序列與GenBank資料庫的序列進行了仔細的比對,並沒有發現這四個插入片段是HIV-1所特有的,亦或是2019-nCoV病毒從HIV-1獲得了這些插入片段的證據。
首先,在GenBank資料庫中對這些病毒基因進行序列比對的結果表明,前100個相同或高度同源的序列均來自哺乳動物的宿主基因、昆蟲、細菌等。比對結果只有幾個顯示與冠狀病毒同源,但它們均與HIV-1病毒無關。病毒序列資料庫的比對結果還顯示,這些序列廣泛地存在於從噬菌體、流感到巨型真核病毒等不同類型的病毒中 。
這些結果清楚地表明,插入的基因序列廣泛存在於包括病毒在內的各種生物體中,絕不是HIV-1所特有的。當用2019-nCoV病毒的序列在整個資料庫中進行檢索時,我們發現它與冠狀病毒的匹配程度更高,僅有少數與HIV-1相匹配。並且,雖然有19條記錄顯示插入片段1和2與HIV-1能夠完全匹配,但插入片段3和4與HIV-1的匹配率很低。
另外,插入片段4能夠與HIV-1基因組中的多個不同基因片段進行模糊匹配,這表明它們之間的同源性太低,因此並不可信。此外,在HIV資料庫中檢索這四個插入片段,我們也能得到相似的結論
在任何HIV-1中均未發現與插入片段3和4完全匹配的序列,這也說明插入的基因序列廣泛的存在於包括病毒在內的各種生物體中,並非HIV-1所特有的。另一方面,HIV-1囊膜蛋白中與之匹配的的區域都具有高度可變性,常常存在大量的插入和缺失突變,這也表明這些片段對於HIV-1囊膜糖蛋白的生物學功能來說並不是必需的。
同時,與插入片段1和2完全匹配的序列僅能在少數的HIV-1病毒株中檢測到,說明在數以萬計的天然HIV-1中同時存在這四個插入突變的序列也是非常罕見甚至並不存在。這也解釋了為什麼這四個插入片段獨立存在於不同的HIV-1基因組中的原因。由於這些插入片段與HIV-1的同源性低,在HIV-1序列中也非常少見,因此我們認為HIV-1並非是2019-nCoV基因組中插入序列的來源。
表1. 4個插入序列與序列資料庫對比搜索結果
其次,這些插入片段不僅存在於2019-nCoV病毒中,還存在於其他三個源於蝙蝠的β屬冠狀病毒中:包括分離自浙江並於2018年上傳到GenBank資料庫中的ZC45和ZXC21病毒,以及於2013年分離自雲南的RaTG13病毒。
與ZC45和ZXC21相比,RaTG13與2019-nCoV更為相似,它們的刺突蛋白的相似性為97.7%。在RaTG13基因組中,其中兩個插入片段與2019-nCoV中的插入片段完全相同,第三個插入片段僅有一個絲氨酸到異亮氨酸的替換,第四個插入片段的C端缺失4個胺基酸。
與RaTG13相比,ZC45和ZXC21與2019-nCoV的差異更大,但是這兩種病毒也有與插入片段1、2和3類似的序列。此外,許多其它的冠狀病毒在插入片段1的位點上都有類似的插入僅序列有些許差異。這些結果清楚地表明,在2019-nCoV被發現之前,這四種插入序列中的三種均天然存在於三種蝙蝠的冠狀病毒中。這無疑駁斥了2019-nCoV可能是通過人為獲得HIV-1基因組中的一些基因片段而產生的「生化武器」這種觀點。相反,2019-nCoV更可能來源於類RaTG13的冠狀病毒。
第三,2019-nCoV中的插入片段1和2與某些HIV-1 gp120分離株中的V4和V5區域具有相同的6個胺基酸基序,它們在結構上相互接近,由LE loop將二者分隔開。然而,位於2019-nCoV插入片段1和2之間的插入片段3的序列與HIV-1 gp120的V1區域相似。V1區域位於gp120蛋白序列的另一側,離V4和V5區域較遠,因此它不可能與gp120中的V4/V5區域具有相互作用。但是在2019-nCoV刺突蛋白的結構模型中,V1區域恰恰位於V4和V5之間。
插入片段4被發現與HIV-1的Gag蛋白上區域相同,但這一蛋白與病毒的入侵無關。另外,這個插入位點與其它幾個位點相距太遠,無法與2019-nCoV刺突蛋白中的其他三個插入片段形成同一個的結構單元。因此,綜上所述,雖然預印本的作者指出2019-nCoV 從HIV-1中獲得一些結構上看似不相干的部分進而產生了一個獨特的蛋白結構,該結構有利於增強刺突蛋白與受體的結合能力,但是我們並不認為這種結構有任何選擇優勢或理論根據。
圖1. 2019-nCoV和蝙蝠冠狀病毒的序列和結構分析。(A)刺突基因序列的系統進化樹。(B)2019-nCoV和蝙蝠冠狀病毒序列之間疑似插入位點的序列比對。比對結果中胺基酸的缺失用「-」表示。插入片段的序號在比對結果的上方標示。(C)CoV刺突蛋白和HIV-1 gp120中四個插入片段的結構對比。2019-nCoV的結構使用默認參數在TASSER伺服器進行建模。1~708位殘基中僅有相關結構域用絲帶圖展示,不包括305~603位殘基。這四個插入片段分別用紅色、藍色、綠色和品紅色顯示。HIV-1 gp120結構(PDB 1GC1)用絲帶圖展示。V4、V5、V1/V2和LE loop分別用紅色、藍色、綠色和黑色展示。
這三個蝙蝠冠狀病毒株如何獲得這些插入片段目前尚不得而知。對於病毒而言,若要從其他生物體獲得額外的插入序列,通常需要它與其他生物體有直接的相互作用,通過同源或非同源重組的方式獲得插入序列。因此只有當兩種病毒共同感染同一個細胞時,蝙蝠冠狀病毒才可能從HIV-1獲得基因片段。
由於蝙蝠冠狀病毒和HIV-1的宿主細胞不同,因此兩者交換遺傳物質的機會幾乎可以忽略不計。但由於這些基序廣泛存在於各種哺乳動物細胞中,因此蝙蝠冠狀病毒更有可能從它們感染細胞的基因組中獲得這些基序並進行重組。想要回答這一問題,科研人員應該對野生動物和家畜中的冠狀病毒進行更廣泛的研究。
鑑定這三種蝙蝠冠狀病毒和最近流行的2019-nCoV毒株中的插入片段的來源對我們理解冠狀病毒如何突破宿主障礙,由感染動物跨越至感染人類、適應人類這些過程至關重要。目前的數據表明,RaTG13與2019-nCoV的關係最為密切。但由於它們之間的遺傳差異太大,因此RaTG13並不能作為2019-nCoV的直系祖先。其他與2019-nCoV關係更為密切的病毒,例如以果子狸為中間宿主的SARS和以駱駝為中間宿主的MERS,是否為其直接來源仍有待研究。
人們需要更多的研究以確定2019-nCoV的真正來源。但病毒的溯源需要對各種野生動物和家畜進行篩選,這一過程可能需要很長時間。因此無論如何,減少或避免與野生動物的直接接觸,對防控未來可能產生的新型流行性感染病依然至關重要。
得益於生物信息學分析工具的快速發展,現在大家都能夠對新序列進行廣泛快速的分析。我們必須進行全面透徹的分析才能充分理解新的基因組信息隱含的真正生物學意義。那些有偏見的、片面的以及不正確的分析所得的結論則會助長陰謀論,阻擋科學發現的進程,極大的影響公眾衛生的防控工作。