華為雲聯合國內高校最新研究:新冠病毒所有關鍵蛋白同源模建結果...

2020-11-29 澎湃新聞

機器之能

截至目前,因新型冠狀病毒感染造成的確診患者數量已經超過 3 萬名。作為疫情防控的關鍵環節,針對新冠肺炎的對症藥物研發牽動著許多人的心。近日,來自華中科技大學、西安交通大學、華為雲等多所機構的聯合團隊公布了 2019 新型冠狀病毒所有關鍵蛋白質同源模建結果和方法,研究成果通過華為雲面向生物醫藥研究機構開放,助力抗病毒藥物研發。

抗疫已進入決戰階段,一方面,防控和治療仍是當前最重要的工作,另一方面,科研機構和相關企業也正在積極尋求更多可用於對症治療的藥物。多項新型冠狀病毒相關研究相繼展開,但相比於其他類型的疾病,抗病毒藥物的研發和臨床試驗都更加困難,目前還未發現針對新型冠狀病毒明確有效的特效藥。

由華中科技大學同濟醫學院基礎醫學院、華中科技大學同濟醫學院附屬武漢兒童醫院、西安交通大學第一附屬醫院、中科院北京基因組研究所、華為雲組成的聯合科研團隊,針對 2019 新型冠狀病毒的多個靶標蛋白,對 8506 種上市或者正在進行臨床試驗的藥物中進行超大規模計算機輔助藥物篩選工作,目前已取得第一階段成果。

研究篩選出了五種可能對 2019 新型冠狀病毒(2019-nCoV)有效的抗病毒藥物,分別是 Beclabuvir,沙奎那韋(Saquinavir),比特拉韋(Bictegravir),洛匹那韋(Lopinavir),多替拉韋(Dolutegravir)。

本文將對該研究的 2019 新型冠狀病毒所有關鍵蛋白質同源模建結果和方法進行詳細介紹。

1

以SARS-CoV蛋白質結構作為模板

構建2019-nCoV蛋白質三維結構

蛋白質同源建模是指當未知結構的蛋白和已知結構的蛋白質在一級序列上比較相似的時候,可以把已知結構的蛋白作為模板,通過計算機的模擬和計算,基於未知結構蛋白的一級序列預測其三維空間結構。

同源建模基於兩個假設:1. 蛋白質的結構由其胺基酸序列唯一決定,如果已經知道一級序列,在理論上就可以獲取其二級結構以及三級結構。2. 蛋白質的三級結構在進化中相比於其一級序列更加保守。如果兩個蛋白質的胺基酸序列有 50% 相同,那麼約有 90% 的 a-碳原子的位置偏差不超過 3 Å。

鑑於 2019-nCoV 和 SARS-CoV 非常近似,胺基酸的序列一致性達到了 76.47%。同時 SARS-COV 的蛋白質的三維結構基本上已經被解析出來,所以研究者以這些已知的蛋白質三維結構作為模板,構建了 2019-nCoV 的蛋白質結構。

2

數據和方法

2019-nCoV蛋白質一級序列提取

2019-nCoV 的基因組序列參考 NCBI 上已公開的序列:NC_045512.2。由於基因組注釋數據的缺失,無法直接獲取其所有功能蛋白質的一級序列。研究者將 SARS-CoV 的各個蛋白對應的序列比對到 2019-nCoV 基因組上,選擇 best match 的比對區域,作為該蛋白對應的在 2019-nCoV 的一級序列。通過這種方法,獲得了 2019-nCoV 的共計 20 個蛋白質的序列,包括非結構蛋白 16 個(NSP1-16)與結構蛋白 4 個(S,M,N,E)。

同源建模:Swiss model

Swiss-model 是自動化蛋白質同源建模工具,使用的過程中需要用戶輸入目的蛋白的序列,也可以同時指定參考蛋白質模板,在沒有指定模板的情況下,系統會自動選擇匹配度最高的模板。

Step 1: 輸入蛋白質序列

在 swiss-model 主頁 (https://swissmodel.expasy.org/) 點擊「Start modeling」並上傳蛋白質的 fasta 序列。點擊「Search For Templates」,開始搜索最模板蛋白。

Step 2: 選擇合適的模板蛋白

Swiss-model 會給出通過一級序列匹配到的模板蛋白,以及每一個模板蛋白的匹配度和模板蛋白的參數,基於以下標準選擇最優的模板蛋白用於同源建模:

目的蛋白和模板蛋白一級序列一致性要求:identity>30%;優先選擇 identity 最高的模板蛋白;

優先選擇 SARS-COV 的模板蛋白用於同源建模;

當 identity 比較相似的時候,優先選擇通過高精度 X-ray 方法構建晶體結構的模板;如果沒有 X-ray,需要點進 PDB 看蛋白結構解析度,優先選解析度高的;

如果 Oligo State 存在有 Homo 和 heter,就兩個都要選擇。

Step 3:同源建模

選定好最優的模板蛋白之後,點擊頁面的「Build Models」,即可自動的做同源建模;對於序列比較短的蛋白(<100 殘基),該過程通常花費幾分鐘;對於序列比較長的蛋白(>1000 殘基),該過程通常花費約二十分鐘左右;建模完成後,可直接下載模板蛋白和目的蛋白的三維空間結構用於後續的分析。

Step 4:分子動力學模擬

同源建模得到的蛋白質結構可以用於分子動力學(Molecular Dynamics)模擬。分子動力學模擬可以通過 GROMACS 等工具完成,這一步驟通常比較耗時。華為雲醫療智能體平臺提供了加速版的 GROMACS,加速後的 GROMACS 消耗的時間為傳統版本的 1/6。

3

建模結果統計

針對 2019-nCOV 的 20 個蛋白質一級序列,有 15 個蛋白和 SARS-COV 的蛋白質有比較高的同源性,identity>70%;通過蛋白質三維工具可視化之後,也可以看到這些蛋白質的三維空間構象和模板蛋白比較相似;

其中有一個蛋白質,NSP4,在 SARS-COV 中沒有很好的同源蛋白,是以小鼠肝炎病毒的 A59 進行建模,其 identity>60%;

另外有四個蛋白質的同源建模效果不是很好,其中 NSP2,NSP6 和 M 均沒有很好的目的模板,匹配度最好的蛋白質序列的 identity < 30%;所以建模的結果不太理想;同時 NSP11 蛋白質的長度只有 11 個殘基,長度太短,不滿足建模要求;

目的蛋白的長度,模板蛋白的選擇和同源建模的參數整理在以下的表格中供參考:

4

數據和可視化

模板蛋白和同源建模得到的 2019-nCoV 蛋白質三維結構都以 PDB 格式進行保存,華為雲醫療智能體平臺的 Notebook 工具已經內置了可視化所需要的插件和工具,用戶可以交互式拖動和展示感興趣的蛋白質三維結構。

以上涉及到的數據、算法和工具,目前都已經集成在華為雲醫療智能體平臺。同時,聯合科研團隊也正在對篩選出來的五種抗病毒藥物進行細胞學驗證,並推動後續一系列藥物臨床試驗。

機器之心Pro

追動態 | 查數據 | 找資源 | 讀報告 | 產業分析new

機器之心Pro 是基於「機器之心團隊構建的百萬級規模人工智慧知識圖譜及結構化資料庫」搭建的人工智慧領域專業信息平臺。

目前已上線六個模塊:Dashboard、新聞資料庫、行業資料庫、人工智慧知識庫、深度精選和智周分析new,覆蓋 40 個技術領域及 56 個智能應用領域。

點擊圖片,查看官方使用手冊

pro.jiqizhixin.com

盯動態、找資源、做調研

原標題:《華為雲聯合國內高校最新研究:新冠病毒所有關鍵蛋白同源模建結果方法公布》

閱讀原文

相關焦點

  • 聯合科研團隊:2019新型冠狀病毒所有關鍵蛋白質同源模建結果和方法...
    面對當前新型冠狀病毒(2019-nCoV)感染肺炎不斷擴散的嚴峻形勢,華為雲EI醫療智能體團隊聯合華中科技大學同濟醫學院基礎醫學院李巖教授,西安交通大學第一附屬醫院劉冰教授,中科院北京基因組研究所韓大力研究員,華中科技大學同濟醫學院附屬武漢兒童醫院柯尊輝大夫組成聯合攻關團隊,針對新型冠狀病毒(2019-nCoV)的多個靶標蛋白進行了超大規模計算機輔助藥物篩選工作。
  • 全球最大免費公開新冠藥物虛擬篩選資料庫,華為雲「神農項目」登上...
    該期封面刊出的正是華為雲EI醫療智能體團隊主導的抗疫課題——「神農項目」前期成果:新冠病毒藥物虛擬篩選在線交互Web服務。「神農項目」也是迄今為止全球最大的完全免費公開的新冠藥物虛擬篩選資料庫。新型冠狀病毒的出現在全球範圍影響了人類健康,尋找有效治癒新冠肺炎的治療方式是臨床醫生和藥物研發人員最緊迫的工作。
  • 全球最大免費公開新冠藥物虛擬篩選資料庫, 華為雲「神農項目」登...
    該期封面刊出的正是華為雲EI醫療智能體團隊主導的抗疫課題——「神農項目」前期成果:新冠病毒藥物虛擬篩選在線交互Web服務。「神農項目」也是迄今為止全球最大的完全免費公開的新冠藥物虛擬篩選資料庫。計算機輔助藥物篩選根據病毒靶點和小分子藥物的3D結構,計算病毒蛋白與藥物之間的結合能量,實現從成千上萬的小分子庫中篩選出與病毒結合最緊密的候選藥物,從而快速為藥物研究和臨床試驗提供方向。
  • 華為雲主導抗疫藥物篩選科研成果「神農項目」登上國際化學頂刊封面
    該期封面刊出的正是華為雲EI醫療智能體團隊主導的抗疫課題——「神農項目」前期成果:新冠病毒藥物虛擬篩選在線交互Web服務。「神農項目」也是迄今為止全球最大的完全免費公開的新冠藥物虛擬篩選資料庫。
  • 最新研究表明:龜類也可能是新冠病毒的潛在中間宿主
    ↑(圖源:journal of medical virology)該項研究使用系統的比較和分析預測冠狀病毒刺突蛋白的受體結合域(RBD)與宿主受體血管緊張素轉換酶2(ACE2)之間的相互作用,研究重點是比較新冠病毒(SARS-CoV-2)與SARS病毒、蝙蝠SARS樣CoV和其他冠狀病毒的刺突序列,從而有助於分析病毒的進化及尋找可能的病毒庫。
  • 迷惑新冠病毒,西湖大學研究團隊設計出新冠病毒蛋白抑制劑
    疫情發生以來,科學家們一直致力於了解病毒入侵機理,研究破解之道。疫苗以及抗體作為預防和治療新冠肺炎的重要手段,目前已經取得很大進展。除了這些手段之外,是否還有其他方法能有效遏制新冠病毒?ACE2三聚體蛋白,其中T-ACE2與新冠病毒刺突蛋白親和力達到KDpan>也就是說,這個聯合研究團隊製造了一個ACE2假體蛋白「迷惑」病毒,並且它對病毒的「吸引力」比ACE2本身要高1000倍以上。
  • 雲南科研人員取得進展 從食藥同源植物分子中篩選具有防治新冠病毒...
    雲南網訊(記者 季徵)記者從雲南農業大學了解到,該校普洱茶學教育部重點實驗室針對新型冠狀病毒的生物學特點、傳播特徵和公共衛生風險防控的應急需求,聯合昆明生物製造研究院有限公司開展了病毒防治的緊急科技攻關和相關製劑的研發,重點從食藥同源植物分子中篩選能夠阻斷病毒感染、具有防治新冠病毒感染的有效分子
  • 【河北邢臺新冠病毒基因測序結果公布:與歐洲輸入病毒高度同源】
    文 / Becky2021-01-06 20:19:27來源:FX168 【河北邢臺新冠病毒基因測序結果公布:與歐洲輸入病毒高度同源】1月6日晚,河北邢臺市召開新冠肺炎疫情防控新聞發布會,發布疫情防控最新消息
  • 新冠病毒蛋白結構模型資源庫面世
    一個國際團隊創建了一個新冠病毒蛋白質結構模型資源庫,可作為有力的分析工具,幫助科學家更好地理解新冠病毒  圖片來源:物理學家組織網  科技日報北京6月4日電(記者劉霞)據物理學家組織網近日報導,一個國際結構生物學家團隊對新冠病毒所包含蛋白質結構進行研究,並在此基礎上創建了一個名為「Web」的資源庫。該資源庫還包括對現有新冠病毒蛋白結構模型的評估等資源,可以幫助科學家更好地了解新冠病毒,促進新冠肺炎藥物和疫苗的研發工作。
  • 華為雲人工智慧首席科學家田奇:AI產業發展人才是關鍵,五大計劃...
    峰會上,華為雲人工智慧領域首席科學家田奇分享了華為雲AI的最新創新成果,並聯合各高校成立華為雲AI人才培養專家指導委員會,發布了華為雲AI人才培養的五大計劃,推動創新型和應用型AI人才培養。   田奇認為,以人工智慧為代表的數字經濟將成為我國經濟發展的新引擎,人才是AI走向產業縱深的關鍵,需要加強產教融合、產學研聯動,共同培養產業所需的AI人才,加快人工智慧進入各行各業。
  • 解析Science新冠病毒論文:S蛋白電鏡圖首次公布
    來源:環球科學新冠病毒刺突蛋白的冷凍電鏡圖像今日發表在《科學》上的新研究中,來自美國德克薩斯大學和NIH的研究人員首次利用冷凍電鏡展示了新冠病毒刺突蛋白的分子結構。該研究已於2月16日發表在預印本網站bioRxiv,並快速通過同行審議發表於《科學》期刊。
  • 新冠研究中國登上Science封面首次揭示新冠病毒人體蛋白受體結構
    【新智元導讀】日前,西湖大學周強實驗室的一項關於新冠病毒的研究登上了最新一期Science封面,該研究利用冷凍電鏡技術成功解析了此次新冠病毒的受體——ACE2的全長結構,屬全球首次。該成果最終將對研發精準的新冠肺炎診斷、治療手段起到關鍵作用。「新智元急聘主筆、高級主任編輯,添加HR微信(Dr-wly)或掃描文末二維碼了解詳情。」
  • 新冠病毒受體親和性為SARS10-20倍:首次電鏡解析S蛋白結構
    機器之心報導作者:微胖、李澤南美國國家過敏和傳染病研究所疫苗研究中心最近提交的一篇論文對新冠病毒結構進行了研究,並驗證了一個結論:新冠病毒 S 蛋白與細胞 ACE2 的親和力是 SARS 的 10 到 20 倍。
  • 美研究人員繪製出新冠病毒關鍵蛋白分子的3D結構
    美國科研團隊首次繪製出新型冠狀病毒一個關鍵蛋白分子的3D結構,這種蛋白是開發疫苗、治療性抗體和藥物的關鍵靶點。 研究成果19日在線發表在美國《科學》雜誌上。
  • 又一個被新冠病毒「勾結」的蛋白
    由德國慕尼黑工業大學和芬蘭赫爾辛基大學領導的國際研究團隊發現了新冠病毒進入人體細胞的另一種方式:一種已知可以與弗林蛋白酶切割的底物結合的蛋白Neuropilin-1(NRP1)顯著增強了新冠病毒的感染力。
  • 美國研究團隊最新發現,新冠病毒能讓血腦屏障出現「漏洞」
    新冠病毒感染症狀多樣,呼吸道症狀是其主要表現,還有一些患者症狀指向血管炎症。一個美國研究團隊最新發現,新冠病毒還能讓血腦屏障出現「漏洞」,潛在破壞大腦神經網絡。新華社資料圖先前已知新冠病毒主要通過其表面刺突蛋白與人體細胞上的「
  • 最新研究:細胞代謝壓力或使新冠病毒毒力變弱
    據此,研究團隊提出了一個疑問:新冠病毒在持續進化中,基因組的胞嘧啶含量是否會下降,逐漸與長期流行的冠狀病毒相類似?研究人員隨後收集了公共資料庫發表的2574條全基因組序列(採樣時間為2019年12月24日至2020年4月17日),對鹼基組成的變化趨勢進行分析。結果表明:在持續傳播的過程中,新冠病毒編碼區的胞嘧啶含量的確在逐漸下降。
  • 最新研究:病毒變異後,mRNA新冠核酸疫苗有效!
    未來幾天或有更多實驗室結果公布。 繼英國、南非後,日本也發現「全新變種新冠病毒」。 日本厚生勞動省於1月10日宣布,從巴西返抵東京的4人確診感染新冠肺炎。
  • 中美歐最新研究溯源:新冠病毒最早可能1948年在蝙蝠中出現
    也就是說,新冠病毒可能在 40-70 年前從與之關係最緊密的蝙蝠病毒中分化出來。論文第三作者、西交利物浦大學生物科學系姜小煒博士告訴 DeepTech,「我們的分析表明新冠病毒種系是自然進化的結果,在自然界中已經自然進化了數十年。顯然,這進一步說明此病毒不是人為製造的。」