華為雲攜手峰科發布FPGA基因加速雲解決方案,基因測序性能提升5倍

2020-11-30 電子發燒友

華為雲攜手峰科發布FPGA基因加速雲解決方案,基因測序性能提升5倍

工程師曾玲 發表於 2018-07-09 14:14:00

近期,華為雲攜手峰科計算(以下簡稱「峰科」)發布基於FPGA的基因加速雲解決方案,該方案採用GATK(The Genome Analysis Toolkit)標準分析流程,將全基因組測序(WGS)性能提升5倍,比傳統模式提升3~5倍,同時測序精度可達99.95%以上,在大幅縮短測序時間的同時實現TCO大幅降低。

基因測序數據分析加速面臨的挑戰

首先,基因測序分析流程BWT+GATK當前被業界廣泛採納,但採用此流程的傳統測序方法需要消耗高額算力及存儲資源,且耗時較長。

其次,針對基因測序中高算力需求的smith-waterman,pair-hmm等算法處理,其具有計算並行性,不連續,非規則的存儲訪問,低bit操作等特性,計算依賴不規則區域的操作會對CPU消耗很大,性能難以提升。

華為雲FPGA基因加速解決方案的三大優勢

為了更好的解決基因測序行業面臨的基因組分析標準流程不經濟高效,以及跨不同雲和硬體(CPUs,FPGAs)加速實現的雙重挑戰。華為雲和峰科計算強強聯合,合作推出符合行業標準的GATK加速流程,通過對基因測序數據分析流程進行軟、硬體聯合優化實現端到端加速。華為雲FPGA基因加速方案具備如下優勢:首先,華為雲提供業界領先的FPGA加速雲服務平臺,採用業界領先的Xilinx 16nm Virtex UltraScale+ VU9P FPGA,並針對基因場景推出32核CPU224GB內存1 VU9P FPGA和64核CPU448GB內存2 VU9P FPGA規格的實例,實現了GATK軟體處理流程和FPGA加速流程的完美結合,從而將加速效率提升3~5倍。

其次,峰科採用GATK標準分析流程,精準性與GATK標準流程完全吻合,精度可達99.95%以上。

第三,不修改GATK標準流程,可訪問讀取從原始測序數據到生成vcf文件整個過程中的中間數據,便於科研用戶使用比對。

1. 華為雲FPGA基因加速解決方案解析

華為雲FPGA基因加速解決方案集成峰科的加速IP,為用戶提供一種易於使用,經濟實惠的基於FPGA的基因組分析流程加速服務,在該方案中,華為雲配備了32核CPU,單個VU9P FPGA的實例。華為雲FPGA基因加速解決方案使用GATK最佳方案對種系突變和體細胞突變進行變異檢測,將計算密集型算法如Smith-Waterman、PairHMM等確定為加速對象。每種算法都經過FPGA內核優化,並且實現CPU-FPGA協同執行和資源分配。如圖2所示,用戶通過分析應用程式,把每個流程的數據傳給華為雲峰科加速平臺,平臺裡的Kestrel運行時管理工具來管理CPU-FPGA協同執行和資源分配。利用多線程,I/O優化和擴展使用FPGA加速器,華為雲FPGA基因加速服務的基因組學分析流程在保證精準度情況下提供顯著的加速。

華為雲FPGA基因加速方案結構圖

與GATK最佳使用流程相對稱,典型的基因測序數據分析流程始於原始FASTQ序列兩端讀長(paired-end reads),進一步獲取一組經過濾的變體,對其進行標記以供進一步分析。圖3描述了華為雲基因加速服務種系變異調用流水線的具體流程,中間面板指示開始的通常工作流程,上下分別顯示華為雲FPGA基因加速方案中的峰科加速流程和GATK最佳使用流程命令實現方式的工作流程。

華為雲峰科基因加速流程和GATK最佳使用流程對比

基於華為雲FPGA加速服務,使用FPGA優化加速GATK流程,基因組分析流程可以實現3~5倍速度提升和99.95%以上的準確度。華為雲FPGA基因加速解決方案最快基因組序列分析標準流程可在一天內完成5個全基因組或24個整體外顯子組分析。

Performance comparison for GATK 3.8 WGS from Alignment to Variant Calling using Hoplotypecaller

Cloud based comparisonTotal(Hrs.)Speedup

WGS(30X)Falcon on Huawei7.464.84x

Original 36.11x

註:測試數據使用的是30X的WGS樣本,鹼基數量103G華為雲基因加速服務「0」元體驗

為了能讓更多的用戶體驗華為雲FPGA加速雲伺服器,針對基因加速場景,華為雲聯合峰科(Falcon)推出「基因加速服務0元體驗套餐」,套餐規格為32核CPU224GB內存500GB數據盤5M帶寬。

打開APP閱讀更多精彩內容

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容圖片侵權或者其他問題,請聯繫本站作侵刪。 侵權投訴

相關焦點

  • 金橡醫學攜手華為雲、加速腫瘤基因檢測創新
    肺癌仍為我國發病率、死亡率第一位,為「癌中之王」;40歲之後發病率快速提升,80歲達到高峰;到85歲,一個人患癌風險為36%;  數據來源:國家癌症中心發布2017年中國最新癌症數據  癌症的致病因素多且複雜,很多人都說癌症與飲食,環境,心態有關,除了這些之外,你有沒有想過癌症還和我們自身的基因有關呢?
  • 華大基因牽手華為雲,雲端解密基因奧秘
    此後,經過反覆的調研和綜合細緻的考察,華大選擇了華為雲。早在2018年,針對基因測序行業的困難與挑戰,華為雲推出了以Kubernetes為基礎的基因容器服務GCS(Gene Container Service)。據悉,GCS將基因測序和容器技術完美結合,是對基因企業來說「更省、更快、更輕鬆」的雲科學計算平臺。
  • 華點雲:網際網路+高通量基因測序,讓基因解讀更容易
    華點雲自主研發的CelLoud雲平臺是基於高通量基因測序技術NGS的生物信息分析雲平臺,致力於為合作夥伴提供實現基於高通量基因檢測技術最終應用的全面解決方案,是我國最早自主研發並在臨床醫院推進使用的生物信息分析雲平臺之一。
  • 生態攜手,鼎捷軟體&華為雲聯合發布智能製造融合解決方案!
    同時,在此次華為雲TechWave工業網際網路專題日活動上,華為雲與鼎捷軟體聯合發布面向製造業的智能製造融合解決方案。未來,雙方將基於雲計算、大數據等新技術,以IT與OT融合數據驅動,聯手打造更為豐富、更具價值的智能製造應用場景,為製造業的持續轉型升級提供助力。
  • 華為雲首發集成希望組NextDenovo軟體,助力基因企業快速上雲
    不久前,希望組在Github上線了三代測序數據高效糾錯、組裝軟體NextDenovo最新版本V2.0-beta.1,不僅實現了單Contig一條染色體和超大型基因組組裝的突破,同時也解決了現有三代測序數據組裝工具運行時間長、資源佔用大、組裝質量不穩定的瓶頸,推動了基因行業的發展。
  • 打開基因密碼的鑰匙,是什麼?
    如何解決?我們選擇了華為雲提供的資源混合調度方案,通過它動態拓展的特性解決了這個問題。」安全性能+性價比兼具,華為雲成三代測序「理想型」在基因測序中,測序的長讀長能有效提升基因組組裝的完整性。相對於二代測序,三代測序的長讀長優勢,能夠幫助它突破二代測序短讀長技術在人類遺傳疾病研究、動植物基因組完成圖組裝等方面的瓶頸、提升其在疾病診斷、分子育種中提供決策依據的能力。
  • ​研華攜手偉薩科技,發布一體化DNA基因排序加速解決方案
    近日,研華科技宣布發布與偉薩科技技術共同創建的DNA基因排序加速解決方案。
  • 打開基因密碼的鑰匙,原來是?
    在基因測序中,測序的長讀長能有效提升基因組組裝的完整性。相對於二代測序,三代測序的長讀長優勢,能夠幫助它突破二代測序短讀長技術在人類遺傳疾病研究、動植物基因組完成圖組裝等方面的瓶頸、提升其在疾病診斷、分子育種中提供決策依據的能力。
  • 華為雲MICCAI 2019發布最新成果 推動AI醫療落地
    華為雲人工智慧醫學影像專家現場發布研究成果 AI輔助宮頸癌篩查:國際最高水平研究之一,華為雲聯合金域醫學發布目前業界規模最大的宮頸上皮細胞標註數據集DCCL,數據來1167個患者,共計14432個圖像塊,超過27000個細胞/細胞團級標註,6種不同級別病變,可以有效推動人工智慧在宮頸癌篩查領域的前沿進展。
  • 英特爾、聯想攜手華大基因加速新型冠狀病毒基因組分析
    3月3日,英特爾、聯想以及華大基因宣布,三家公司正攜手加快COVID-19新型冠狀病毒的基因組特性分析。來自英特爾及聯想的專業技術與生命科學專家將通力合作,為華大基因的研究人員提供全新的大數據分析技術和計算資源,進一步提升其基因測序工具的分析能力,更高效地研究新型冠狀病毒的基因組特性。
  • DTCC 2020:華為雲GaussDB加速企業數字變革
    近日,在第十一屆中國資料庫技術大會上,筆者有幸採訪到了華為雲資料庫產品總監張昆,張昆向我們詳細解讀了GaussDB如何做到架構革新,做到支持全場景全業務,並從解決方案與案例的維度分享了華為雲資料庫的優秀實踐。
  • 華為雲GaussDB亮相DTCC2020,全面釋放數據新動力
    華為雲資料庫攜手優秀客戶和合作夥伴發表了重要主題演講,分享了華為雲GaussDB在核心技術創新、行業實踐、生態建設等方面內容,積極打造開源開放生態和優秀解決方案,加速金融政企數位化轉型,並在會上榮獲兩項榮譽獎項。
  • 華為雲3篇論文入選MICCAI 2019,加速AI醫療研究和應用落地
    華為雲人工智慧醫學影像專家現場發布研究成果AI輔助宮頸癌篩查:國際最高水平研究之一,華為雲聯合金域醫學發布目前業界規模最大的宮頸上皮細胞標註數據集DCCL,數據來 1167 個患者,共計 14432 個圖像塊,超過 27000 個細胞/細胞團級標註, 6 種不同級別病變,可以有效推動人工智慧在宮頸癌篩查領域的前沿進展
  • 智能升級新階段,華為雲助力新雲原生企業駛出加速度
    為加速雲原生行業落地,華為雲聯合CNCF、信通院及行業雲原生技術領袖為加速企業數位化轉型和智能升級,重磅發布全球雲原生技術精英交流平臺「創原會」。「創原會」旨在通過探索前沿雲原生技術、共享產業落地實踐,共創雲原生與業務融合的更多可能。
  • 英國基因組學公司選擇WekaIO來加速基因組學研究
    加速500萬個基因組計劃的基因組研究。英國基因組學公司選擇WekaFS來滿足未來五年所需的預期容量擴展,同時為其DNA管道提供最高性能。在公眾的支持下,英國基因組學正在為患者創造持久的遺產。對NHS中的基因組醫學抱有雄心勃勃的願景,包括計劃在未來五年內對500萬個基因組進行測序,Genomics England為新的科學發現和重要的醫學見識奠定了基礎。經過廣泛的評估過程後,Genomics England選擇了Weka,因為它是唯一能夠在預計預算限制內滿足預期性能和容量擴展要求的供應商。
  • 微液體流量計在基因測序的流體控制中的應用解決方案
    基因測序是一種新型基因檢測技術,能夠從血液或唾液中分析測定基因全序列,預測罹患多種疾病的可能性,個體的行為特徵及行為合理。 基因測序廣為人知的還有針對唐氏症候群篩查的無創產前基因檢測。影星安吉麗娜·朱莉通過基因檢測,選擇手術切除乳腺以降低患乳腺癌風險。2011年去世的蘋果公司創始人史蒂夫·賈伯斯患癌時,也曾接受過全基因測序。接下來工採網小編和大家簡單了解一下微液體流量計在基因測序的流體控制中的應用解決方案吧。
  • Gartner發布最新雲資料庫報告,華為雲入選魔力象限
    日前,國際研究機構Gartner發布2020年全球雲資料庫魔力象限報告《Magic Quadrant for Cloud Database Management Systems》,華為雲憑藉GaussDB系列資料庫產品入選魔力象限。
  • 騰訊雲戰略攜手Airwallex空中雲匯 合力打造跨境支付解決方案
    9月10日,在2020騰訊全球數字生態大會企業出海專場上,騰訊雲宣布與Airwallex空中雲匯達成戰略合作。騰訊雲將利用遍布全球的基礎設施,幫助Airwallex空中雲匯在海外快速構建起業務後臺、降低業務部署成本並全面提升終端客戶的使用體驗。
  • 浪潮助中國基因測序產業化_浪潮伺服器_伺服器解決方案...
    日前,國家食藥總局批准了兩款基因測序儀及檢測試劑盒,這是自政府出臺「二月禁令」後,首次批准基因測序技術可以進行臨床應用,政府政策的鬆綁引發了大批資本對該市場的覬覦。據統計,2013年中國對於測序儀及試劑的投入總額超過20億元,中國龐大的市場蛋糕早已引發基因測序廠商的高度重視。
  • 基因的雲端故事:尋找你和我差異的百分之一
    早在2018年,針對基因測序行業的困難與挑戰,華為雲推出了以Kubernetes為基礎的基因容器服務GCS(Gene Container Service)。據悉,GCS將基因測序和容器技術完美結合,是對基因企業來說「更省、更快、更輕鬆」的雲科學計算平臺。