21個國家的377個全基因組序列,探究COVID-19病毒之間的相似性和...

2020-12-04 騰訊網

論文地址:https://arxiv.org/pdf/2003.05580.pdf

研究人員通過對377個COVID-19新冠病毒及相關病毒的全基因序列進行了相似性及進化關係的計算分析,得到了一些潛在有趣的結果,可能會對相關領域專家找到病毒的源頭、有效的檢測試劑、疫苗及治療藥物的研發等有所幫助。下面為大家解讀這篇研究。

摘要:

我們收集了377個公開發布的COVID-19病毒、先前已知的4種引起流感的冠狀病毒HCov-229E、HCov-OC43、HCov-NL63和HCov-HKU1以及致命的致病性P3/P4病毒:SARS、MERS、Victoria、Lassa、Yamagata、伊波拉和登革熱的全基因組序列。

本文作者利用他們最新研發的大序列數據分析工具I-MLCS、現有的MEGA 6.0系統和聚類算法,對來自21個不同國家的COVID-19病毒序列以及COVID-19病毒與其相關病毒的相似性和進化關係進行了計算分析。

圖1.數據來源和採樣/測序時間。

表1.不同月份的COVID-19病毒序列之間的平均相似度

相似性分析表明,兩株以菊頭蝠為宿主的COVID-19病毒(TG13和 RaTG13)與以人為宿主的COVID-19病毒有很高的相似度,但以穿山甲為宿主的病毒與以人為宿主的病毒平均相似度更高一些。進化關係分析表明:來自5個國家所測序的約13株COVID-19病毒很可能與第一代COVID-19病毒及其起源有關,或可能引導研究人員找到該病毒源頭。

劉兵教授還透露,他們對表1中的相似性進行了統計測試,發現病毒在過去四個月中經歷了具有統計意義的顯著突變,這使得開發好的疫苗更加困難。

介紹:

自2019年12月以來,嚴重的新冠病毒COVID-19所引發的肺炎疫情從武漢迅速蔓延到全國,據中國CDC(中國疾病控制中心)報告:截止2020.3.8號,中國已累計確診病人80868人,累計死亡病例3101人,更為嚴重的是,目前該疫情已在世界100多個國家或地區爆發蔓延。因此,有效地控制與扼制新冠病毒COVID-19疫情、治癒感染病人、免受由疫情所帶來的巨大經濟損失是當前世界面臨的最緊迫與重要問題。

本文報告了作者對新冠病毒COVID-19全基因序列(以下簡稱序列)本身,以及COVID-19病毒序列與其它相關病毒序列之間的相似性與進化關係的計算及分析。

由於新冠病毒COVID-19是一種新型病毒,對它的研究才剛剛開始。不同於現有的研究,本文工作是一種大規模的新冠病毒COVID-19及相關病毒的全基因序列的比較計算研究,共涉及了來自21個國家的377個COVID-19及相關病毒的全基因序列。更重要的是,作者首次對這377個病毒的全基因序列進行了相似性及同源/進化分析。正如本文將要呈現的,這種大規模的對COVID-19及相關病毒的全基因序列的深度計算與挖掘,將揭示COVID-19及相關病毒間的一些重要關係與發現。

本文工作中,作者共收集了公開發布的215個COVID-19全基因序列(包括:宿主為人的194個序列、宿主為菊頭蝠的13個序列、宿主為穿山甲的6個序列,以及宿主為環境的2個序列),已有的四種流感冠狀病毒HCov-229E (3個) , HCov-OC43 (78個), HCov-NL63 (16個) 和 HCov-HKU1 (4個), 以及7種高致病致命的7種 P3/P4病毒, SARS (11個)、MERS (11個)、Victoria (5個)、 Lassa (6個)、Yamagata (5個)、Ebola (11個)和Dengue (12個),以上序列總計377個。本文的序列數據來源於以下資料庫:GenBank or NCBI[7] (National Center for Biotechnology Information), GISAID[8] (Global Initiative on Sharing All Influenza Data), CDC[9](Center for Disease Control and Prevention)等,序列的平均長度為3萬左右。

由於新冠病毒COVID-19肺炎的發病機理、病毒檢測、疫苗與治療藥物的研發等,在很大程度上決取於對COVID-19全基因序列的分析研究,因此,本文研究將會為生物、醫療與健康領域的相關專家們,在追溯COVID-19病毒的起源、傳播路徑、研發有效的檢測試劑、疫苗與治療藥物,以及有效地控制與扼制該疫情提供有價值的決策信息/數據支持。值得注意的是,這項工作是COVID-19全基因序列及相關病毒序列的一個大規模計算與挖掘研究,我們目的並非為了獲得廣泛的生物學解釋,除了一些最低限度的,而是擬從大序列數據的比對計算中,分析與挖掘出可能有價值的信息。

圖2.四種流感冠狀病毒與以人為宿主的COVID-19之間的平均相似度。

圖3. COVID-19與七種致命的致病性P3 / P4病毒序列之間的平均相似度。

圖4.不同宿主中COVID-19病毒序列之間的平均相似度。

這項工作的核心發現(所有的分析都只使用完整的基因組序列):

1. 通過對過去4個月來(2019.12~2020.3 )所收集的194個以人為宿主的新冠病毒COVID-19全基因序列的相似性分析結果表明:序列間具有平均高達99.8%的相似度;採用MEGA 6.0對它們的同源/進化關係分析表明:來自不同國家的新冠病毒COVID-19已發生了一定程度的變異;

2. COVID-19與已知的四種流感冠狀病毒(HCov-229E, HCov-OC43, HCov-NL63和HCov-HKU1)的相似度在55.6%~56.1%之間,它表明:新冠病毒COVID-19與已知的四種流感冠狀病毒不同;

3. 以人為宿主的新冠病毒COVID-19與高致病與致命的P3/P4病毒中的SARS和MERS最像,與SARS的平均相似度達到82.6%,並且MEGA 6.0計算結果報告:COVID-19與SARS同源;

4.以人為宿主的新冠病毒COVID-19序列與宿主為穿山甲的COVID-19序列相似度高於以宿主為菊頭蝠的COVID-19序列相似度,其平均相似度差值達13%~20%。但有兩株以宿主為菊頭蝠的COVID-19序列(TG13和RaTG13)除外,病毒株TG13和RaTG13與人為宿主的新冠病毒COVID-19序列的相似度高達95.9%;

5.宿主為人的新冠病毒COVID-19序列與宿主為環境的COVID-19序列的相似度高達99.7%,且兩者為同源關係;

6. 採用MEGA 6.0對來自21個國家的共計194個宿主為人的新冠病毒COVID-19序列同源進化關係的計算結果表明:來自5個國家的13株病毒序列,即:中國(China 7/85)、泰國(Thailand 2/2)、日本(Japan 2/9)、美國(USA 1/32)和韓國(South Korea 1/9)極有可能相關於,或導致我們找到第一代病毒或病毒源。值得注意的是,由於存在世界範圍內的旅行,本文決沒有上述來自5個國家的13株病毒序列一定/可能是病毒源國之意,僅表明,這13株病毒序列為我們可能追溯查找到第一代病毒或病毒源提供了必要有價值的線索。

圖5.第一代COVID-19毒株的國家、序列號和測序日期。

圖6.來自21個國家的21個COVID-19病毒株的兩棵進化樹(每個國家一個毒株)。

圖7.圖5中21個COVID-19毒株的進化樹。

圖8.15種病毒的相似度矩陣。

圖9. 15種病毒的全連接加權圖和聚類結果。

圖10.兩個病毒簇的兩棵進化樹。

相關焦點

  • 21個國家377個全基因組分析:探究新冠病毒起源
    【新智元導讀】日前,Nature製作了5張新冠病毒可視化圖表,直觀展示疫情變化趨勢、科研人員發文速度等。西電李雁妮教授和北大劉兵教授等學者聯合發表了一篇關於新冠病毒全基因序列相似性的研究,涉及21個國家的377個COVID-19及相關病毒的全基因序列,離病毒溯源更進一步。
  • 21個國家377個全基因組分析:探究新冠病毒起源,重大突變及進化關係
    日前,Nature製作了5張新冠病毒可視化圖表,直觀展示疫情變化趨勢、科研人員發文速度等。西電李雁妮教授和北大劉兵教授等學者聯合發表了一篇關於新冠病毒全基因序列相似性的研究,涉及21個國家的377個COVID-19及相關病毒的全基因序列,離病毒溯源更進一步。
  • 美研究COVID-19基因組序列 有助於控制疫情
    在美國疫情的嚴峻情況下,大家對COVID-19病毒也越發關注,那麼COVID-19基因組序列的研究能否幫助我們徹底解決新型冠狀病毒呢?一起看看霍普金斯大學教授的論文。為了篇幅和清晰度,這段對話已被編輯過。什麼是基因組測序?為什麼了解COVID-19基因組序列很重要?蒂倫:基因組測序是一種技術,使我們能夠閱讀和解釋在DNA或RNA中發現的遺傳信息。當我們從檢測出COVID-19陽性的患者樣本中觀察病毒基因組序列時,我們對了解他們的病毒版本起源很感興趣。
  • 國家基因組科學數據中心首次公開新型冠狀病毒全基因組序列
    國家基因組科學數據中心(NGDC)信息顯示,1月26日,該中心收錄了由中國醫學科學院/北京協和醫學院病原生物學研究所提供的5株2019新型冠狀病毒全基因組序列。這是自2019年12月該病爆發以來,國內公共數據平臺首次公開發布數據。
  • ...標本進行新冠病毒全基因組高通量測序和序列分析。21日測序分析...
    2020-11-22 09:37:37來源:FX168 【天津瞰海軒小區19號樓確診病例測序分析結果公布:與本土第3例無症狀感染者病毒序列一致】11月18日至21日,天津市疾病預防控制中心對本土第5例無症狀感染者康某某、第141例確診病例申某及第144例確診病例楊某呼吸道標本進行新冠病毒全基因組高通量測序和序列分析。
  • Science:利用基因組流行病學準確追蹤英國COVID-19傳播鏈
    2021年1月15日訊/生物谷BIOON/---根據研究人員對英國第一波COVID-19大流行的5萬多個病毒序列的分析,SARS-CoV-2病毒在2020年初被引入英國的次數遠遠超過1000次。英國在2020年3月全國封鎖前引入的病毒譜系往往規模更大,地理分布更分散。
  • 生物學的機器學習:使用K-Means和PCA進行基因組序列分析 COVID-19...
    只要看一看人類病毒來源的蝙蝠攜帶的病毒RNA序列片段即可。實際上,研究表明COVID-19通過反覆變異來提高它們的存活率。在抗擊冠狀病毒的鬥爭中,我們不僅需要找到消滅病毒的方法,還需要找到病毒如何突變以及如何遏制這些突變的方法。
  • 新冠病毒的基因組序列分析
    2月3日,《自然》在線發表論文介紹了上海公共衛生臨床中心和復旦大學公共衛生學院教授張永振等人對2019-nCov的基因組序列的分析。該病毒基因組從就職於出現首批患者的海鮮市場的一名病人身上獲得。基因組分析顯示,該病毒與此前在中國蝙蝠體內找到的一組SARS樣冠狀病毒密切相關。
  • 117疫情觀察:詳解病毒基因序列追蹤流調大法
    病毒兒子被釋放感染別人以後,複製產生的病毒孫子也會繼承這個突變,並且可能在此基礎上增加新的突變。通過對病毒家族的全基因組進行測序,就能追蹤病毒的突變過程。等拿到很多的病毒家族成員的全基因組序列後,科學家們就可以用複雜的電腦程式分析比較突變,去觀察隨著子子孫孫從共同的祖先那裡衍生出來,突變是如何一步一步地產生的。
  • 中國完成首例輸入性MERS病毒全基因組序列測定
    原標題: 中國完成首例輸入性MERS病毒全基因組序列測定  我國完成首例輸入性中東呼吸症候群病例病毒全基因組序列測定 未發現傳染性增強證據  東方網6月5日消息:記者5日從中國疾病預防控制中心獲悉,中國疾控中心病毒病所與廣東省及惠州市疾控中心合作,已完成我國首例輸入性中東呼吸症候群
  • 中國完成首例輸入性MERS病例病毒全基因組序列測定
    原標題:中國完成首例輸入性MERS病例病毒全基因組序列測定  新華網北京6月5日電(記者胡浩)記者5日從中國疾病預防控制中心獲悉,中國疾控中心病毒病所與廣東省及惠州市疾控中心合作,已完成我國首例輸入性中東呼吸症候群(MERS)病例的病毒全基因組序列測定。
  • 蒙古族人全基因組序列圖譜繪製完成
    2011年12月19日,由內蒙古農業大學、內蒙古民族大學和深圳華大基因研究院合作開展的第一個蒙古族人的全基因組序列圖譜繪製工作已經完成。科學家們將此圖譜譽為「天驕一號」,這標誌著我國的人類學、民族學、人類遺傳學及醫學健康研究進入基因組水平。    基因採樣的成年蒙古族男子系成吉思汗黃金家族的34代孫,具有完善的家族系譜記錄,且沒有和外族通婚史。科學家們利用新一代高通量測序技術,採取了從頭測序和重測序兩種方法分別獲得全基因組序列。
  • 首個鯉魚全基因組序列圖譜完成-光明日報-光明網
    本報北京9月22日電(記者李慧)由中國水產科學研究院首席科學家孫效文研究員牽頭,中國水產科學研究院聯合黑龍江水產研究所、中科院基因組研究所、哈佛大學、奧本大學等單位組建的國際合作研究團隊,完成了鯉魚全基因組序列圖譜繪製,成為國際上首個完成全面解析的異源四倍體硬骨魚類基因組圖譜。
  • 研究人員利用深度學習探究RNA 為COVID-19診斷儀開發傳感器
    基因組是決定一個生物體特徵的遺傳藍圖,對於病毒而言DNA和RNA是基因組序列的構建模塊,而直接操縱這些核酸可以使生物體發生切實的變化。因此,基因工程的發展重點在於我們操縱基因組序列的能力。但這是一項艱巨的任務。例如,精確地控制一類被稱為「趾甲開關」的特定工程化RNA分子,可以為了解細胞環境和潛在的疾病提供重要的洞察力。
  • 鯉魚全基因組序列精細圖譜繪製完成
    原標題:鯉魚全基因組序列精細圖譜繪製完成   本報記者 馬愛平   日前,鯉魚全基因組序列精細圖譜已繪製完成,該基因組覆蓋約為16.9億鹼基,包含52610個功能基因,功能基因數目是大多數硬骨魚類基因數目的兩倍。
  • 最新《柳葉刀》:基因序列分析探討可能的病毒源頭
    從這些樣本中,科學家們一共拼接出了8個完整的病毒基因組,以及2個部分完整的病毒基因組。 在獲得了這些基因組信息後,研究人員們首先比對了它們之間的基因序列。比對結果表明,這8個完整的病毒基因組高達99.98%,幾乎完全一致!
  • 甲型H1N1流感病毒被分離並完成全基因組序列測定
    新華社北京5月18日電(記者崔靜)記者18日從中國疾控中心獲悉,根據我國內地確診的首例輸入性甲型H1N1流感病例標本,國家流感中心日前成功分離出我國內地第一株甲型H1N1流感病毒並完成了全基因組序列測定。
  • 上海分離出H1N1流感病毒並完成全基因組序列測定
    上海分離出兩株甲型H1N1流感病毒並完成全基因組序列測定       新華社上海6月10日電(記者 仇逸)記者10日從上海市公共衛生臨床中心獲悉,中心應急檢測實驗室已經成功分離出兩株甲型H1N1流感病毒並完成全基因組序列測定。
  • 海洋所科研人員繪製完成牡蠣全基因組序列圖譜
    近日,牡蠣基因組計劃(Oyster Genome Project,OGP)項目組宣布,歷時兩年的牡蠣基因組序列圖譜終於繪製完成。這是世界上第一張養殖貝類的全基因組序列圖譜,標誌著基於短序列的高雜合度基因組拼接和組裝技術獲得了重大突破。據悉,目前的基因組圖譜已達到國際領先的基因組圖譜標準。近年來,我國的海水養殖業取得了長足發展。
  • 中國測定首例寨卡病毒基因序列 有助於研發疫苗
    據新華社-新華視點2月22日消息,22日,中國疾控中心與江西疾控中心合作成功測定我國大陸首例輸入性寨卡病毒的全基因序列。病毒全基因序列的成功解析,為了解病毒的變異和開發疫苗及診斷試劑奠定了重要基礎。 另據中新社報導,記者22日從解放軍軍事醫學科學院獲悉,春節期間,中國廣東省出現寨卡病毒輸入性感染病例後,該院微生物流行病研究所迅即啟動應急工作機制,與廣州市第八人民醫院、出入境檢驗檢疫系統相關單位密切合作,在獲得從委內瑞拉歸國患者臨床標本後,採用高通量測序技術,於2月21日直接從尿液中獲得病毒全基因組序列。