來源:科學大家
出品:新浪科技《科學大家》
撰文:尹燁 華大基因CEO
近日,大家都在問我下面這個信息是不是真的?真是造謠一張嘴,闢謠跑斷腿。造謠只要臆想+博眼球即可,而闢謠是要有嚴謹的數據和邏輯支撐的。特別是要闢以科學論文為基礎的謠言,那是要掉層皮的……
可是如果不闢謠,這陰謀論調一夜之間就會傳播成百萬群體,比當前的疫情還可怕……
算了,看看還有幾個還沒睡的小夥伴,來來幫個忙,咱們用神文的數據做個生物信息分析吧,用實錘砸向陰謀論者!
由於分析過程比較燒腦,不想看過程的直接看結論:
1.文章最驚掉眼球的發現——4個肽段,並非HIV特有,在多個物種(包括真核生物、原核生物)中都有比對上,which means: 也沒啥稀罕的;
2.經過比對6種代表性冠狀病毒,發現也能找到這些肽段,所以並非新冠獨有!而且,絕大部分HIV都未包含前3個肽段,且它們處於HIV的高突變區;(說到這裡,是不是論文賴以依存的基石都已近崩塌了呀)
3.再來回答一個問題:這些插入片段是如何自然發生的?這要講一講微生物「水平基因轉移」這一特殊的能力。額,這個要1-2句話解釋清楚實在太難了。
下面開始硬懟,為了雅俗共賞,特有「術語版」和「說人話版」。
來自神秘東方古國印度的「驚天大作」
術語版
1月31日,BioRxiv預印本網站刊登了一篇來自印度理工學院德裡分校研究人員的文章:Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag。
該論文聲稱通過比對2019新型冠狀病毒的插入序列,發現有四小段與HIV-1 gp120和Gag蛋白具有相似性。據此,有人聲稱新型冠狀病毒是人工製造的,也有人聯想到前一陣抗愛滋病藥物可能對抑制新型冠狀病毒有效的新聞,病毒與愛滋病病毒有關的謠言四起。
此文章一出學術界譁然,以及有眾多遺傳學家、生物學家發聲批判此文章的譁眾取寵與斷章取義;最後,2月2日凌晨,該論文的作者之一在BioRxiv回應稱將撤回稿件。
一群印度研究人員,在一個未經專業意見審核的網站上,公布了一個不靠譜但很嚇人的結論,發現了這次的新冠病毒裡面居然有愛滋病病毒的插入序列!
細思恐極!這肯定不能是病毒自己幹的啊,這一定是人工合成的,要不然怎麼能用治療愛滋病的藥物治療這個病毒呢?再一想,武漢病毒所可是有最高等級病原安全P4實驗室啊,而正好他們去年也發現了另外一種新冠狀病毒,這個病毒看來未必是華南海鮮市場的野生動物,也不一定是蝙蝠,很有可能是P4實驗室發生了洩漏啊……
科學辨真偽:用數據說話
既然都是搞學術的,那我們就以學術的方式來為大家拆招,一起來看看這篇所謂的」論文「是如何分析科學問題和得出結論的。
術語版
他們收集了NCBI上55株可用的冠狀病毒序列,從中選出32株代表性基因組進行了進化樹分析,發現與2019-nCoV在序列上最相近的是SARS-CoV。接下來,他們比對了2019-nCoV和SARS-CoV的spike糖蛋白的胺基酸序列,發現在2019-nCoV的spike糖蛋白中存在4個新插入片段。這4個插入片段,在除2019-nCoV外的其他54個冠狀病毒基因組中都沒有發現。並在全部已公開的28株2019-nCoV基因組中發現這4個插入片段的核酸序列都是保守存在的。
為了鑑定這些插入序列的來源,他們以這4個插入序列的胺基酸序列為輸入進行了比對,發現這4個插入片段都在HIV-1中存在。插入片段1-3比對到了HIV-1的gp120基因,插入片段4比對到了HIV-1的Gag基因。但比對到gp120的3個片段分別處於gp120的V4、V5和V1可變區,並且這4個插入片段並不是廣泛存在於HIV-1的gp120中,僅限於主要來自非洲和東南亞的特定HIV-1序列。
根據蛋白建模之後他們發現這些插入位點雖然處於非連續位置,但在2019-nCoV的spike糖蛋白中,它們摺疊成識別宿主受體的結合位點的一部分。他們推測,這些插入通過形成一個親水環可能促進病毒和宿主之間的相互作用。
文章認為雖然這些插入片段很短,但4個插入片段都能與不相關的病毒(HIV-1)匹配上,他們認為這不是偶然(原文:This uncanny similarity of novel inserts in the 2019- nCoV spike protein to HIV-1 gp120 and Gag is unlikely to be fortuitous.)直指2019-nCoV存在非自然形成的可能(這跨越天馬的想像力!)。
印度科研人員們用這次的新冠狀病毒,和之前公布的54種原來就存在的冠狀病毒做了比較(類似「大家來找茬」這樣的玩法),然後居然發現,這次的新冠狀病毒居然獨有4個片段是之前沒有的。
再進一步分析,這些片段居然是愛滋病病毒獨有的,這些特定型別的愛滋病病毒還主要來自非洲和東南亞。
再進一步分析,這些插入雖然不連續,但是可以大大加強病毒的傳染能力。
最後得出了時空穿越版的結論:這玩意不是自然形成的!(潛臺詞:一定是人工合成的,2019-CoV:我真不是人整出來滴;HIV:我惹誰了麼?)
闢謠
下面闢謠開始,謝謝我的生信小夥伴們給力的工作:
一、這4個片段為HIV特有麼?非也
術語版
針對印度人文章發現的4個插入片段進行分析後發現:
1)4個肽段的長度非常短;
2)將4個肽段序列在NCBI進行比對,發現每段都能比對上多種物種,包括真菌,細菌,果蠅,線蟲,瘧原蟲等。4個肽段比對結果的E value都很高(E value 越高說明比對可靠性越差,一般小於0.00001 (10e-5)才認為可信),說明這些序列隨機匹配的可能性非常高(圖1);
(NCBI比對前100結果統計 )
圖1:肽段1與NCBI比對結果
這些序列非但不是HIV特有,而且上百個物種,從病毒到昆蟲都可能存在。相當於說,所有的狗都有尾巴,你專門拿了一隻狂犬病的來說,尾巴只有狂犬病的狗才長。
二、其它冠狀病毒沒有這4個片段?非也;HIV都包含這4個肽段?也不是!
術語版
1)文章的4個肽段來源於spike protein,將新型冠狀病毒的spike protein和其他六個有代表性冠狀病毒的spike protein(中東呼吸綜合症病毒 MERS-CoV, 豬瘟病毒 SADS-CoV, 03 SARS病毒 SARS_CoV_BJ01, 03 SARS病毒 SARS_CoV_GZ02,蝙蝠來源的Bat_SARS-like_CoV_ZXC21,Bat_SARS-like_CoV_TG13)比較發現:從spike protein進化樹來看,和新型冠狀病毒2019-nCoV最近源的冠狀病毒是一個蝙蝠來源的Bat_SARS-like_CoV_TG13(圖2)。
圖2:2019-nCoV spike protein與其它冠狀病毒spike protein的進化樹
通過比較胺基酸序列進一步發現,在這個同源的病毒中,能找到新型冠狀病毒的 4 個肽段,其中肽段2和3完全一致,肽段1有1個胺基酸不一致,肽段4有5個胺基酸不一致(文章中在核酸水平進行了比較)。而 2015年分離的Bat_SARS-like_CoV_ZXC21的第1個和第2個肽段與新型冠狀病毒的 4 個肽段具有少量的相似性(第1個有3個胺基酸一樣,第2個只有2個胺基酸不一樣),剩餘的其他病毒序列和這四個肽段差異性較大(圖3)。所以,這4個片段並不是2019-nCoV單獨特有。
圖3:4個肽段在7個冠狀病毒spike protein的序列比較
HIV都包含這4個肽段?也沒有!what?
文章指出這4個肽段分別在HIV的envelope glycoprotein和gap protein具有同源序列。分析比較四個肽段序列和 HIV 的 envelope glycoprotein (NCBI 414 個蛋白序列)和 gap protein (NCBI 396 個蛋白序列)相似度發現:除了文章中提到的序列以外,絕大部分 HIV 的蛋白序列都不包含前3個肽段序列(見下表),而且這些序列處於HIV的高變區(圖4)。第4個肽段總體還是比較保守,前面4個胺基酸能在另外15個HIV中找到,肽段PRR也能在多個HIV中找到,最後的胺基酸A在文章提到的序列中特異。但是該肽段在細菌噬菌體內能找到完全一樣的序列(圖4)。
圖4:4個肽段在HIV中的序列比較結果
在進化上,文章提到的10個具有肽段1的HIV序列單獨為一個進化分支, 4個具有肽段3的HIV序列單獨為一個進化分支,而這些肽段只是少部分HIV特有,並不是所有HIV共有的序列特徵(圖5)。
圖5: HIV envelope glycoprotein 進化樹
印度團隊的生物信息分析能力太弱,得出了極其不嚴謹的結論。
三、這些插入片段不可能是自然發生的?那是你不懂微生物的「轉基因」
術語版
微生物有種特殊的能力,就是「水平基因轉移」。目前已知在阿米巴原蟲中存在可能的病毒水平基因轉移情況。病毒Mimivirus和Sputnik都會感染阿米巴原蟲,但Sputnik需要在Mimivirus已感染的情況下才能夠在細胞內增殖,並且Sputnik中有13個與已知基因無相似性、但其中三個卻與mimivirus基因相關,說明Sputnik和mimiviru間很可能發生了水平基因轉移。(https://www.nature.com/articles/nature07218)理論上,如果病毒同時感染一個細胞,是有可能發生病毒間的水平基因轉移的。
蝙蝠是唯一自帶飛行動力的哺乳動物,相比於其他哺乳動物,其飛行活動需要消耗大量的能量。在高強度運動下,運動產生大量的自由基在細胞內堆積會破壞DNA結構產生游離的片段DNA。在其他哺乳動物體內,如果免疫系統觀測到游離的DNA/RNA會當做入侵信號直接清除。但為了保護自身組織,蝙蝠的免疫系統進化出了對游離DNA較弱的免疫反應,使得病毒可以與之共存。
(https://www.newscientist.com/article/2161942-bats-spread-ebola-because-theyve-evolved-not-to-fight-viruses/)蝙蝠的免疫系統使得數種病毒同時感染同一細胞的情況成為可能。
微生物之間轉基因,就像我們互相發個快遞一樣容易。病毒之間發生基因融合在自然界是普遍現象,只不過之前測序比較少,大部分人不知道。就如沒有顯微鏡之前,我們看不到細菌但不等於沒有細菌。少見必然多怪,只憑可見光認知世界是可悲的。
結論
結合以上分析我們可以得出結論:該文章在新冠病毒的S蛋白(刺突蛋白)發現的4個插入片段長度非常短,比對結果隨機匹配的可能性很高,且在真核,原核,病毒中都有分布,與其他六種病毒序列相比,和其最近源的是一個蝙蝠來源的病毒(Bat_SARS-like_CoV_TG13)。
對於文章中作者提到的和4個插入片段相似的 HIV 的序列,我們發現這些序列只是在少部分HIV存在,並不足以嚴謹科學地支持文章中的結論。
以上論文不嚴謹,推論無下限,發表不嚴格,如果有嚴格的同行評議一定會被拒稿。
題後記
為啥陰謀論總是盛行?
因為簡單,過癮。
特別是夾雜著各種高科技術語的陰謀論,既充實了好事之徒的談資,更滿足了「總有刁民想害朕」的妄想綜合症病理需求。
根據統計,突發公共事件總會伴隨著謠言的傳播。大的公共衛生事件,總會伴隨著生物陰謀論的興風作浪,常見的梗估計大家都看過:注射XX疫苗會引發痴呆和自閉症啊;吃某某食物會引發不孕不育啊;啥啥又是針對某一人種的生物武器啊……但是真相:比如吃野生動物會引發新發傳染病,大家反而當成段子,一笑而過。
2019-nCov新型冠狀病毒導致的肺炎疫情爆發,從2020年1月23日武漢封城至今已經過去11天,確診總病例數超過14000例,全民抗擊疫情的戰鬥在全國各地打響,然而在大家眾志成城抗擊疫情的行動中,「生物戰爭陰謀論」再掀熱議。
從SARS到新冠,「生物戰在延續」?
2003年春節,中國出現嚴重急性呼吸症候群(SARS)。當時的俄羅斯科學家、俄羅斯醫學科學院院士Sergei Kolesnikov首次公開了「該病毒不可能在自然界中形成」的說法,並認為該病毒是在實驗室由麻疹和腮腺炎合成的。而這一「權威」的言論,無疑為國人懷疑「SARS病毒可能是其他人或別國製造的生物武器」這一推演增添了不少可靠性,其中一個重要原因就是SARS再沒出現過。
而後來啪啪打臉的是,科學家在中國的蝙蝠中發現了類似於SARS的冠狀病毒,表明蝙蝠可能是該病毒的宿主,也算是為「別國」洗刷了冤屈。
17年後新一輪的疫情再次襲來,陰謀論再次在更「專業」的論文背書之下,引起軒然大波,觸動了疫情當前大家脆弱的神經。
當我們在無比揪心武漢新冠時,世界的其他地方面臨著不同的際遇以及同樣嚴峻的考驗!根據美國CDC網站,從2019年10月到2020年1月25日,估計有1900萬~2600萬人感染甲型 H1N1 流感,其中1萬~2.5萬人死亡;H5N8病毒正在為禍波蘭、德國、匈牙利;澳洲山火的肆虐還未停歇;非洲面臨3600億蝗蟲的大浩劫;日本在經受豬瘟的洗劫……疫情從來都是人類共同應對的災難,疫情當前,沒有國家乃至個人能獨善其身!
比人的病更可怕的是病的人。
相比於瘟疫本身,治療愚蠢更難,不過最難的是治療偏執。
量子力學奠基人之一馬克斯·普朗克,早在1930年就如實講:「科學事實的勝利往往並不是通過使反對者們信服,讓他們領悟真相,而是因為反對者們最終都會死去,新一代在成長起來的過程中潛移默化地接受了它。」
而科技日報原總編輯劉亞東在微信公眾號發表《給武漢肺炎「陰謀論者」進言」》的一段更是一針見血的寫出這個問題的真相:「無知不可怕,可怕的是無恥。無知頂多帶來固執,無恥才會導致偏執。對偏執的人,無論常識還是理性,都不管用。就像人們常說的,你無法喚醒一個裝睡的人!眼下國難當頭,中國人需要團結一心,儘快降服病魔。幫不上忙沒關係,別添亂就行,尤其不要蠱惑人心,煽動民粹。」
讓我們擦亮雙眼,理智對待,不信謠、不傳謠,眾志成城,共克時艱!
最後, 感謝小夥伴:曉東、嗣龍、黃輝、清瀅。
推薦
《科學大家》欄目精彩文章匯總
《科學大家》專欄投稿郵箱:sciencetougao@sina.com 來稿請註明姓名、單位、職務