從病毒研究談起,聊聊冷凍電鏡及背後的HPC

2020-12-06 CSDN技術社區

 今日tips

嬰幼兒能不能戴口罩?

通常來講,1-2歲的嬰幼兒不能戴口罩。N95口罩透氣度較差,不適合孩子使用。對於兒童,推薦佩戴兒童專用的防護口罩,且家長需隨時注意孩子有無呼吸困難等不適情況。

 

——來自@人民日報

拋開疫情不談

我們來聊聊

這次疫情的始作俑者——

科學家們是如何研究病毒的

關於病毒,這是一類沒有細胞結構的簡單的特殊生物,它們的結構基本相似,一般由蛋白質的外殼和內部的遺傳物質(核酸)組成。

 

對於一種新的病毒,我們只有去發現它、了解它、研究它,最終才能製造出能治癒患者的藥物,以及增強人體免疫的疫苗。

那麼一般而言,對病毒的研究一般都有如下內容和方法

·      病毒培養:在病毒學研究中除用做病毒增殖、病原分離以外,還用於研究病毒的複製過程及細胞的病理變化,研究病毒與宿主的互作關係,探討抗體與抗病毒物質對病毒的作用方式與機制等。還可用於病毒的分離鑑定、抗原的製備、疫苗和幹擾素的生產、病毒性疾病診斷和流行病學調查等。

·      病毒的分離純化與測定:屬於病毒學研究的基本技術。通過病毒的分離純化,可獲得純化的、有感染性的病毒製備物。通過病毒測定可確定病毒數量及活性。病毒的分離是將疑有病毒而待分離的標本經處理後,接種於相應敏感的宿主、雞胚或感染細胞,培養一段時間後,通過檢查不同病毒的特異性表現確定病毒的存在,並對病毒進行提取和純化。

·      病毒的鑑定:利用形態學、物理學、化學、生物學、免疫學、分子生物學、生物信息學等鑑定病毒的性質,描述病毒的特徵,是病毒分類的前提。病毒鑑定也是診斷病毒性疾病的可靠方法。

病毒如何觀察?

針對病毒做結構研究,就少不了在微觀世界對病毒本身進行觀察和成像。目前,電子顯微三維重構(electroneicroscopy,也稱電鏡三維重構)X射線晶體學(X-ray crystallography)、核磁共振波譜學(nuclearmagnetic resonance,NMR)是結構生物學的三大研究手段。

 

不過後兩種技術都有各自的局限性,比如X線晶體學只能對生長極為有序的三維結晶進行觀察,而磁共振技術則要求測樣品顆粒小,純度非常高,不能夠有重疊峰出現。而冷凍電子顯微鏡,簡稱冷凍電鏡(cryo-electron microscopy,cryo-EM),已成為生物大分子的結構研究的重要手段,這項技術極大地推動了生物學的發展。

什麼是冷凍電鏡?

冷凍電鏡是將生物大分子快速冷凍後,在低溫環境下利用透射電子顯微鏡對樣品進行成像,再經圖像處理和重構計算獲得樣品的三維結構。

 目前,冷凍電鏡三維重構技術由冷低溫制樣、低劑量電鏡成像和計算機圖像處理三部分組成。

隨著冷凍電子顯微鏡的自動化、解析度、直接電子探測技術以及高性能圖像處理技術的大幅提高,越來越適合分析大的難以形成三維晶體複合體的三維結構,如膜蛋白以及病毒和蛋白質-核酸複合物等。

 簡而言之:首先利用冷凍電鏡對冷凍於液氮溫度的生物大分子顆粒進行成像,以獲得數萬到數百萬張生物大分子照片,然後通過一定的算法來整合這些圖像,計算出生物大分子的三維結構。這其中三維重構算法是核心內容,用於測定出每一張照片的諸多參數

它的基本原理基於中央截面定理:三維物體沿電子束方向投影的傅立葉變換是該物體所對應的傅立葉空間中通過中心且垂直於投影方向的一個截面。那麼一個物體完備投影的二維傅立葉變換一定能夠完全填充該物體的三維傅立葉空間,因此物體的完備投影與物體的三維結構是等價的

所以在實際應用中,我們收集到海量的全同顆粒在不同方向的投影(單顆粒),首先通過等價線、投影匹配等方法確定每張投影圖像的取向和中心,然後對每張投影圖進行傅立葉變換,按照投影方向填充到三維傅立葉空間對應的切面,並進行差值計算得到倒空間的網格點數值,最後再進行反傅立葉變換,就可得到實空間的三維結構。

冷凍電鏡的三維重構流程

可以看到在整個流程中,數據採集、圖像處理、三維重構是非常核心的三個步驟,對計算和存儲的需求非常高,以下是部分顆粒挑選、圖片處理和三維重構的軟體程序

用途

名稱

描述說明

支持GPU

官方網址

自動化顆粒挑選

Leginon

從透射電子顯微鏡自動收集圖像。支持的儀器:FEI(Tecnai、Titan Krios、Polara)、JEOL(3200、3100、2100、1230)、CCD(TVIPS、Gatan、FEI)、直接探測器(Gatan K2、FEI Falcon、直接電子DE12、DE20)

單GPU

單節點

http://nramm.nysbc.org/software/

圖像處理流水線

Appion

處理和分析電磁圖像的「管道」。Appion與Leginon數據採集集成,但也可以在使用一組提供的工具上傳圖像(數字或掃描顯微照片)後單獨使用。

底層包集成包含EMAN, Spider, Frealign, Imagic, XMIPP, IMOD, ProTomo, ACE, CTFFind等並行重構程序

單GPU

單節點

http://nramm.nysbc.org/software/

三維重構

RELION

(for REgularised LIkelihood OptimisatioN)是一個獨立的電腦程式,它採用經驗貝葉斯方法對冷凍電鏡(cryo-EM)中的(多個)三維重建或二維類平均值進行求解。在相應的貝葉斯框架中,統計模型的許多參數都是從數據中獲得的,所以可以在不需要用戶有豐富專業知識的情況下獲得客觀和高質量的結果。

多GPU

單節點

https://www3.mrc-lmb.cam.ac.uk/relion/

三維重構

cryoSPARC

CryoSPARC是全球範圍內用於從單顆粒冷凍電鏡數據獲得三維結構信息的先進平臺,結合最先進的算法和高性能計算機平臺,實現了蛋白質、病毒和分子複合物的自動化、高質量和高通量結構發現,用於研究和藥物發現。

多GPU

多節點

https://cryosparc.com/

 許多電鏡三維重構程序目前是實現的任務級別的並行,如BSOFT、FREALIGN、IMOD和PRIISM/IVE等。而AUTO3DEM、IMAGIC、UCSFTOMOgraphy等則完全採用了MPI並行方式。著名的單顆粒三維重構軟體EMAN目前所有的並行手段都已經實現,SPIDER和IMIRS程序則採用了OpenMP和MPI並行方式,但SPIDER保留了任務級的並行方式,而IMIRS程序沒有。XMIPP則採用了MPI和pthreads方式。

通過上面的分析,可以發現冷凍電鏡三維重構的高性能計算IT需求歸納為以下幾部分

·      主要為浮點計算,其中有大量的單精度或雙精度快速傅立葉(FFT)計算。

·      軟體內存需求和I/O需求大,一般都需要配置並行文件系統。

針對傅立葉(FFT)計算,目前主流大量採用nVidia GPU是行業慣例,nVidia CUDA為開發人員提供了多種庫,其中cuFFT庫則是CUDA中專門用於進行傅立葉變換的函數庫。「cuFFT」全稱是CUDAFast Fourier Transform,顧名思義,它提供了一系列的函數幫助開發者進行快速傅立葉變換的運算。

 

cuFFT庫由兩個子庫構成,它們分別是CUFFT和CUFFTW。CUFFTW庫是一個移植工具(portingtool),它為用戶提供了一些接口,以使得用戶使用FFTW庫(一個非常流行的CPU快速傅立葉變換庫)編寫的程序能夠運行在CUDAGPU上。而CUFFT則是純CUDA接口的快速傅立葉變換庫。

針對高性能計算文件系統,業界解決方案有很多:Lustre、BeeGFS、分布式橫向擴展NAS等等。

 

病毒研究也是對

計算和存儲能力的大考

戴爾科技集團是世界500強的IT解決方案企業,多年以來在高性能計算HPC領域有深厚的沉澱,在國內很多高校生命科學院也成功實施部署了規模不等的冷凍電鏡HPC平臺,例如包括清華大學生命科學與技術學院、北京大學生命科學聯合中心、西湖大學生命科學學院、哈爾濱工業大學生命科學與技術學院等,在該領域有豐富的規劃設計及部署實施經驗。

 前面提到過由於冷凍電鏡三維重構過程中,需要大量的快速傅立葉FFT計算,所以需要海量GPU算力資源來支持,戴爾科技生命科學類HPC解決方案推薦了多款GPU伺服器設備滿足該需求。

伺服器型號

支持CPU的數量及型號

支持GPU的數量及型號

伺服器外形高度

R740/R740xd

2顆Intel®至強®第二代可擴展系列處理器

3塊雙寬度GPU(如nVidia Tesla V100)

或6塊單寬度GPU(如nVidia Tesla T4)

2U高度機架式

R7515

1顆AMD 第二代EPYC處理器

4塊單寬度GPU(如nVidia Tesla T4)

2U高度機架式

R6515

1顆AMD 第二代EPYC處理器

2塊單寬度GPU(如nVidia Tesla T4)

1U高度機架式

R6525

2顆AMD 第二代EPYC處理器

2塊單寬度GPU(如nVidia Tesla T4)

1U高度機架式

R840

4顆Intel®至強®第二代可擴展系列處理器

2塊雙寬度GPU(如nVidia Tesla V100)

或4塊單寬度GPU(如nVidia Tesla T4)

2U高度機架式

R940xa

4顆Intel®至強®第二代可擴展系列處理器

4塊雙寬度GPU(如nVidia Tesla V100)

或8塊單寬度GPU(如nVidia Tesla T4)

4U高度機架式

T640

2顆Intel®至強®第二代可擴展系列處理器

4塊雙寬度GPU(如nVidia Tesla V100)

或8塊單寬度GPU(如nVidia Tesla T4)

塔式或5U高度機架式

C4140

2顆Intel®至強®第二代可擴展系列處理器

4塊雙寬度GPU(如nVidia Tesla V100)

1U高度機架式

DSS8440

2顆Intel®至強®第二代可擴展系列處理器

10塊雙寬度GPU(如nVidia Tesla V100)

4U高度機架式

 特別需要提到的是C4140這款伺服器,1U高度可以安裝4塊雙寬度GPU(如nVidia Tesla V100),且支持NVLink或PCI-E兩種架構方式可選,用於不同的應用業務場景,同時節省機櫃佔用空間。

▲戴爾易安信PowerEdgeC4140

不管是生命科學類超算應用,還是校級超算平臺綜合性應用,近年來在國內多所知名高校都有成功部署案例如北京大學、武漢大學等等

 說到HPC集群,除了需要強大的計算資源以外,還離不開存儲資源

總的來說冷凍電鏡HPC集群對存儲I/O性能和容量要求較高,原因如下:

 

·      電鏡投影圖片數量和尺寸不斷增加(4K × 4K, 8K × 8K);

·      生成三維重構文件巨大(GB-TB);

·      若要達到滿意結果需要迭代計算幾十次甚至更多。

比如說上海科技大學免疫化學研究所饒子和院士(新聞原文:https://new.qq.com/rain/a/20191018A08PWT)所率領的聯合團隊通過冷凍電鏡累計獲得了7萬餘張合計超過100TB的高質量照片,完整病毒顆粒接近6萬5千顆,最終解析了非洲豬瘟病毒全顆粒的三維結構。這些巨大的數據量對背後的超算系統都是不小的挑戰。

而在存儲領域,戴爾科技集團亦有深厚的技術積累,並且經過多年的市場考驗,長期在IDC全球外部存儲設備市場排名第一,積累了優秀的口碑。其針對HPC應用領域,提供了如下多種存儲方案供選擇。既保證性能/容量要求,又提供更多功能選擇供未來擴展業務應用,並且考慮到客戶的投資回報

 高性能計算HPC集群項目,涉及產品眾多,技術複雜,一般還會涉及大量的開源作業系統/開源應用軟體等,其實施部署複雜,而售後處理會涉及到多方面多供應商。戴爾科技集團為此推出了「適用於HPC的ProSupport附加服務」,提供了比ProSupport及ProSupportPlus基於設備本身售後服務更高級別的支持。

 對客戶IT管理層來說,「適用於HPC的ProSupport附加服務」帶來了如下的好處:

·      具有完整硬體和服務組合的單一提供商:全部由戴爾科技集團來作為售後服務唯一接口人

·      有更多時間關注業務目標

·        管理群集的成本降低

同時也給客戶HPC系統管理員帶來了好處:

·      增強部署/支持生命周期體驗

·      標準化服務確保預期結果

·      更快地解決問題

·      獲得高級疑難解答與協助:就功能、特性、群集配置問題、固件版本、互操作性和 HPC 一般「入門」問題提供建議;根據在部署期間運行的性能基準測試所建立的預先記錄級別,幫助解決群集性能退化問題;協助解決您 HPC 環境特有的關鍵支持問題。

 作者說明:本文涉及到一些生命科學等專業的知識內容,作者是查閱網際網路公開資料總結整理而成,由於時間倉促,在文字內容上恐有瑕疵或錯誤,懇請讀者專家們給出意見和建議,謝謝!

相關焦點

  • 大事記:冷凍電鏡的發展歷程-結構生物學研究利器
    冷凍電子顯微鏡究竟是一個怎樣的存在呢?居然可以做到跨天地人三界(大誤,劃掉),成為跨物理、化學和生物三界的明星?今天小編就和大家聊聊這個跨界明星的故事,它是如何打開人類的眼界,使人們進入生物體內的微觀世界中,向我們展示了高清的生命細節。
  • 科學家研究單純皰疹病毒基因組的冷凍電鏡結構
    科學家研究單純皰疹病毒基因組的冷凍電鏡結構 作者:小柯機器人 發布時間:2019/7/18 16:29:21 加州大學Z. Hong Zhou研究團隊取得一項新突破。
  • 深圳聯合研究團隊利用冷凍電鏡首次觀測到滅活新冠病毒真貌
    日前,深圳國家感染性疾病臨床醫學研究中心、深圳市第三人民醫院、南方科技大學強強聯手組成聯合研究團隊,於2020年1月27日成功分離出病毒株,完善了實驗室病毒擴增、純化及滅活技術,並綜合應用間接免疫螢光法 (IFA)、酶聯免疫吸附試驗(ELISA)、和基因組序列與譜系分析多種方案核實和確認滅活的新冠病毒。
  • 新冠病毒為何更易傳染?冷凍電鏡圖解病毒進入細胞的「鑰匙」
    新冠病毒的傳染性為何更強?科學家用「火眼金睛」的冷凍電鏡技術,終於找到了其背後的原因——新冠病毒的關鍵刺突蛋白(S蛋白)與人體細胞的受體蛋白的親和力,要遠高於SARS-CoV。病毒要進入人體細胞,必須找到人體細胞上相應的受體蛋白,而每個受體好比是一把「鎖」,得有相應的「鑰匙」才能打開,而後進入細胞內部。
  • 新冠病毒傳染性為何更強?冷凍電鏡圖破解答案
    新冠病毒的傳染性為何更強?科學家用「火眼金睛」的冷凍電鏡技術,終於找到了其背後的原因——新冠病毒的關鍵刺突蛋白(S蛋白)與人體細胞的受體蛋白的親和力,要遠高於SARS-CoV。病毒要進入人體細胞,必須找到人體細胞上相應的受體蛋白,而每個受體好比是一把「鎖」,得有相應的「鑰匙」才能打開,而後進入細胞內部。
  • 中國科學家解析朊病毒蛋白澱粉樣纖維冷凍電鏡結構
    研究人員首次在原子水平上解析了全長朊病毒蛋白纖維的高解析度冷凍電鏡結構,揭示了細胞型朊蛋白向病理型朊病毒蛋白結構轉變的分子機制,為發展新的基於朊病毒蛋白纖維結構的prion疾病治療藥物奠定了基礎。全長人朊病毒蛋白纖維的冷凍電鏡結構傳染性海綿狀腦病(TSE)或prion疾病是一類致死的神經退行性疾病,由朊病毒蛋白(PrP)在體內發生錯誤摺疊而引起,影響包括人在內的多種哺乳動物。
  • 冷凍電鏡技術如何革新生物學
    冷凍電子顯微鏡(以下簡稱「冷凍電鏡」)是結構生物學的重要研究工具、重要突破,其結構解析的解析度已從納米尺度進入埃尺度(即原子尺度),成為可以與X射線晶體學相媲美的結構解析方法。其中,單顆粒冷凍電鏡技術大大降低了結構解析的難度,提高了結構解析的速度。通過冷凍電鏡技術,研究人員可以揭示許多之前未能知曉的生物分子細節,幫助人們揭秘眾多的生物學現象。
  • 【重磅】冷凍電鏡Cryo-EM解析出新冠病毒首個S蛋白的近原子解析度...
    、擴增過程及傳播途徑,同時,使用冷凍電鏡解析病毒的刺突糖蛋白(Spike glycoprotein, S蛋白)結構是助力疫苗與抗病毒藥物研發的關鍵所在。McLellan教授團隊和美國國立衛生研究院NIH聯合在預印版網站bioRxiv上發表了首篇使用冷凍電鏡解析新冠病毒S蛋白的研究文章。Jason Mclellan團隊通過冷凍電鏡Cryo-EM技術,解析了新冠病毒S蛋白三聚體的3.5埃的近原子解析度結構,從生物物理及結構生物學的角度加深了我們對新冠病毒的認知。
  • 冷凍電鏡+清華大學=7篇Cell、Nature、Science
    近兩年,小編發現,除了「魔剪」CRISPR,冷凍電鏡也是這些期刊的「常客」。中國科學家在這一領域取得的成果是有目共睹的,而清華大學無疑是這一領域的「領軍者」之一。「冷凍電鏡+清華大學=CNS」這個公式雖有點誇張,但也不是毫無根據。
  • 未來篇 | 冷凍電鏡,能否「飛入尋常百姓家」?
    這時候,冷凍電鏡就提供了解決這些問題的手段。科學家們不需要獲得蛋白質晶體,只需要用液態乙烷把樣品快速冷凍。然後,冷凍電鏡會向樣品發射電子束,高速運動的電子撞擊到蛋白質的原子後分散開,再被接收裝置檢測到。經過多次的抓拍,從每一個角度捕捉圖案,產生數千甚至數十萬張照片。分析軟體會對生成的上TB大小的數據進行處理,重構出蛋白質的三維模型。冷凍電鏡相對於X射線晶體衍射還有其他的優點。研
  • 劃時代的冷凍電鏡技術--中國數字科技館
    1984年,迪波什首次發布不同病毒的結構圖像。隨著冷臺技術的開發,冷凍電鏡技術正式推廣開來。在此基礎上,通過數學方法,在同一種蛋白質的不同2D圖像之間建立聯繫,以此為基礎擬合出3D結構圖像,他的圖形擬合程序被認為是冷凍電鏡發展的基礎。此外,他對細菌和真核生物的核糖體結構和功能的研究也做出重要貢獻。核酸和蛋白質是生命活動的關鍵密碼,核酸攜帶遺傳物質,備受科學家關注,蛋白質是生命活動的主要執行者。人們對蛋白質結構的解析始於20世紀60年代。結構生物學領域有一條不成文的觀點:結構決定功能。
  • 漲知識丨冷凍電鏡是什麼?為什麼能夠斬獲今年諾貝爾化學獎?
    冷凍電鏡(Cryo-EM)能斬獲諾貝爾獎在業內並不算意外。只不過,2017年度諾貝爾化學獎公布之後,有評論稱再次聯想到這一獎項的俗名「諾貝爾理綜獎」,獎項背後的獲得者均有生物物理學背景,影響最大的領域目前則在生物學。
  • 冷凍電鏡圖解病毒進入細胞的「鑰匙」|科技抗疫
    為此,台州狠抓返工人員返前、返途、返後等各環節,全面推廣應用「健康碼」,開通企業復工信息系統,研究「千輛包車接員工」行動方案,啟動「暖企便企服務」專項行動等措施,實現全程化管理。據悉,「健康碼」是以真實數據為基礎,通過自行在線申報,經後臺審核生成屬於個人的二維碼,作為在本地區出入通行的電子憑證,推動非重點人群有序返工,便利通行,實現「一次申報、動態管理、跨域互認、全省通用」。
  • 超級計算機、冷凍電鏡、人工智慧……如何運用高科技攻克病毒?
    在病毒疫苗研發上,從 2019 年 12 月 31 日凌晨接到標本,1 月 7 日晚,中國疾控中心從臨床樣本中病毒分離成功;1 月 12 日,從環境樣本中成功分離病毒;1 月 24 日,全球首發了第一株新型冠狀病毒毒株信息。用了不到一個月的時間。
  • 冷凍電鏡單顆粒技術的發展、現狀與未來
    Glaeser 於1974 年提出了冷凍電鏡技術,並且用於實驗研究。經過三十多年的發展,冷凍電鏡技術已經成為研究生物大分子結構與功能的強有力手段。冷凍電鏡本質上是電子散射機制,基本原理就是把樣品凍起來然後保持低溫放進顯微鏡裡面,利用相干的電子作為光源對分子樣品進行測量,透過樣品和附近的冰層,透鏡系統把散射信號轉換為放大的圖像在探測器上記錄下來,最後進行信號處理,得到樣品的三維結構。
  • 冷凍電鏡技術揭示生物分子細節(科技大觀)
    如今,科學家在透射電子顯微鏡之上發明了冷凍電鏡,實現了生物分子「近原子級」的解析度,讓人類終於可以一窺究竟生物分子是如何執行其功能。在過去幾年裡,冷凍電子顯微鏡技術逐漸成為結構生物學的重要研究工具。冷凍電鏡技術的三位先驅者,也憑藉對冷凍電鏡技術的開拓和持續推進,獲得了2017年的諾貝爾化學獎。
  • 我國首次利用冷凍電鏡技術獲得生物大分子複合體全原子模型
    該發現對研究dsRNA病毒的mRNA加帽(Capping)機制有重要意義。這是我國首次利用冷凍電鏡技術解析的生物大分子原子結構模型,也是目前已報導的國內最高解析度的冷凍電鏡三維重構結果。同時,這是世界上首次利用冷凍電鏡的CCD圖像(電荷耦合器件圖像傳感器,可將圖像資料由光信號轉換成電信號)獲得的生物大分子複合體的全原子模型。
  • 冷凍電鏡下新冠病毒現「真貌」
    深圳市第三人民醫院院長劉磊會上介紹,冷凍電子顯微鏡是一種可以觀察被快速凍結到-196度「活」的蛋白、病毒等生物樣本的電子顯微鏡。 劉磊介紹,新冠肺炎疫情暴發以來,國家感染性疾病臨床醫學研究中心/深圳市第三人民醫院與南方科技大學冷凍電鏡中心第一時間成立研究團隊,聯合開展科研攻關工作。1月27日,該研究團隊依託深圳三院P3實驗室從一名新冠患者肺泡灌洗液中分離出病毒株,並迅速通過分子生物學、血清學和免疫學實驗完成了病毒的鑑定工作。
  • 冷凍電鏡三維分子成像國際研討會舉行—資訊—科學網
    會議旨在加強我國生物冷凍電鏡領域與國際間的交流與合作、培養生物冷凍電鏡高技術人才及年輕後備人才,加強我國在這一領域的科研實力,並藉助大會的舉辦將國家蛋白質中心這一平臺打造成為具有一定國際影響力的生物冷凍電鏡領域人才交流與合作、科研探索與創新的實踐基地。 隨著人類基因組的全序列測序完成,蛋白質、蛋白質複合體、細胞器和細胞的研究成為生命科學領域的前沿和焦點。
  • 冷凍電鏡技術揭開重要蛋白原子結構
    原標題:冷凍電鏡技術揭開重要蛋白原子結構   據物理學家組織網30日報導,英國科學家利用2017年諾貝爾化學獎重要成果——冷凍電鏡技術,攻克了與基因表達有關的一種重要蛋白的結構難題。