華大基因牽手華為雲,雲端解密基因奧秘

2020-12-06 砍柴網

「我就是那個統計學上渺小到無關緊要、但沒人可以抹去的1%。」這句出自《Gattaca》的經典臺詞讓無數影迷淚目。

《Gattaca》電影海報

這部22年前上映的科幻電影,講述了這樣一個故事:不久的未來,科技的力量勝於一切,基因決定著命運,有基因缺陷的主人公追逐夢想的故事。雖然人和人基因組序列的差異不到1%,但人類的外貌、性格和疾病等正是由這1%的基因差異導致的。雖然電影中探討的基因決定論目前仍是生物學界辯論的主題,但對於基因的「測定」與「解讀」是近些年生命科學領域最熱門的一項研究。

實際上,人類對於生命科學的熱情從20世紀中葉就已經開始。1990年,「人類基因組計劃」的提出標誌著生命科學進入了一個新紀元,而電影所設定的那個「未來」,如今卻已然近在咫尺。

人類基因組計劃的決心不亞於「把人送上月球」,但它是一項跨國跨學科的複雜工程。上個世紀90年代,幾位科學家代表中國承擔了人類基因組計劃的1%工作,而中國也成為了「人類基因組計劃」的第六個參與國。1999年,他們成立了中國第一家基因組學研發機構——華大基因。

2019年,是中國參與「人類基因組計劃」20周年,也是華大基因成立的20周年。

解讀「生命奧妙」徵程中的困惑

華大基因秉承「基因科技造福人類」的願景,以推動生命科學研究進展、生命大數據應用和提高全球醫療健康水平為出發點,基於基因領域研究成果及精準檢測技術在民生健康方面的應用,致力於加速科技創新,減少出生缺陷,加強腫瘤防控,抑制重大疾病對人類的危害,實現精準治癒感染,全面助力精準醫學。

如今的基因測序已經走入了尋常百姓家,技術的力量讓測序的時長不斷壓縮、價格也越來越親民。然而,在基因測序的流程中,需要龐大的算力支持。從某種意義上說,生命科學的研究競賽,很多時候已經演變成一場算力的比拼,甚至如今已經普及應用的產前檢測,腫瘤檢測等醫療檢測的背後也是大量的算力支持。基因測序對算力的需求更大,且往往是波動的,一段時間的消耗量大而一段時間又變小。同時,對於不同生物的基因組,需要的算力也不同,傳統的數據中心計算集群無法滿足快速的擴縮容。

具體到華大基因,過去計算資源比較緊張,在使用峰值時,任務經常需要排隊等候;同時科技服務有很多複雜基因組,客戶需要藉助不同規格的計算資源,所以,「上雲」成了華大基因的必經之路。

基因的「雲端」之旅

華大基因清晰地意識到,只有雲計算才能夠應對以上的種種挑戰。此後,經過反覆的調研和綜合細緻的考察,華大選擇了華為雲。

早在2018年,針對基因測序行業的困難與挑戰,華為雲推出了以Kubernetes為基礎的基因容器服務GCS(Gene Container Service)。據悉,GCS將基因測序和容器技術完美結合,是對基因企業來說「更省、更快、更輕鬆」的雲科學計算平臺。

藉助於華為雲GCS服務,以及華為雲專門為華大基因的常用軟體進行了一系列優化,通過46人/天的駐場時間,60人/月的工程師遠程支持,15+新特性的研發…..雙方打通上雲流程,目前,雙方已完成超過300萬核時計算,平穩運行超過100天。此外,環境部署從原來的3-5天縮短為20分鐘; 應對業務的波動實現了資源的按需調度使用;高並發釋放2萬核資源池;靈活的彈性大大節約了成本。

GCS還提供了全自動化測序分析能力,其亮點體現在:

GCS提供了生物信息流設計器,再複雜的業務也可以編排到一個流程中,一鍵搞定測序任務;

針對國內生信人設計的流程控制語法,結構簡練、易懂,既滿足了流程編寫的易用性,同時也保證了流程遷移的方便性;

再次,用非常直觀的流程熱力圖的方式隨時了解測序進展,精確掌握資源消耗走勢,指導優化方向;

可根據判斷條件選擇執行分支,從而滿足企業複雜流程的管理的需要。

賦能基因行業,華為雲在路上

除了創新的華為雲GCS服務,針對基因行業的普遍痛點,華為雲打造了完整的基因測序解決方案,該方案基於「標準架構+持續創新」的思路,擁有諸多亮點。

華為雲基因行業解決方案全景圖/來源:華為雲官網

具體來說:

在數據收集階段,提供了多通道完成本地-雲和雲-雲間的數據交互,實現OBS最低0.033元/GB/月的低成本、可達4個9可用性、11個9持久性的3AZ特性,提供OBS-Browser、obsutil和SDK等多種配套工具,適配Windows/Linux作業系統,可與本地業務流無縫對接,基於公有雲內網交付一站式傳輸,多級防護,訪問隔離。

在測序分析階段,公有雲HPC可無縫移植本地IDC架構,提供高性能的計算實例和簡化存儲流程,GCS(基因容器服務)提供一鍵式生信分析平臺,支持普通任務+GPU任務混合調度、支持Spark等加速軟體、支持OBS、SFS、EVS存儲的容器化掛載,流程設計器輕鬆可視化設計複雜流程、提供資源消耗熱力圖和標準流程或自定義流程, 提供秒級彈性伸縮能力、按需按秒計費、支持任務親和性調度,自動釋放閒置資源。

在數據交付階段,OBS提供了快速交付通道。POSIX功能可將OBS直接掛載至測序分析平臺,平臺可直接寫入分析數據,華為雲內網傳輸,大帶寬讓客戶獲取數據後可直接開展分析,提供多種配套工具,適配Windows/Linux作業系統、工具一鍵式完成子帳戶數據訪問權限配置;上傳下載提供MD5校驗、保證數據的安全可靠。

專注在底層技術上的持續創新、聯合頂尖企業共同建設整個基因技術生態決心。華為雲持續為基因行業賦能,為推動人類基因的藍圖實現打造了一個又一個鮮活的實踐案例。

寫在最後:未來已來

人類對1%的探索徵途才剛剛開始。筆者相信,不遠的未來,解讀基因密碼,人類或許能夠找出生命的出路,讓科技造福人類。華為雲將為基因測序鋪好「上雲」的跑道,助力基因測序行業騰飛。

相關焦點

  • 基因的雲端故事:尋找你和我差異的百分之一
    具體到華大基因,過去計算資源比較緊張,在使用峰值時,任務經常需要排隊等候;同時科技服務有很多複雜基因組,客戶需要藉助不同規格的計算資源,所以,「上雲」成了華大基因的必經之路。  基因的「雲端」之旅  華大基因清晰地意識到,只有雲計算才能夠應對以上的種種挑戰。此後,經過反覆的調研和綜合細緻的考察,華大選擇了華為雲。
  • 華大基因CEO尹燁:基因即因,未來已來
    12月20日,華大基因CEO尹燁在由《華夏時報》、「水皮雜談」以及財經大V頻道主辦,中方信富、鬥牛財經聯合主辦的以「金融業2020:開放與融合」為主題的華夏機構投資者年會暨第十三屆金蟬獎頒獎盛典上,發表了「基因即因,未來已來」的主題演講。
  • ...Max;華為發布首款商用臺式機;華大基因回應「基因編輯58個嬰兒...
    華為發布首款商用臺式機:採用AMD銳龍芯 多屏協同加持12月8日下午,華為正式推出了首款臺式機——HUAWEI MateStation B515,採用小機箱設計,搭載了新一代8核7nm AMD銳龍處理器,配備華為智慧鍵鼠套裝,可以配合華為手機、平板、筆記本等智能產品的分享功能。
  • 華大基因庫可以參觀嗎?
    華大基因標杆考察——走進華大基因企業參觀華大成立於1999年,是全球領先的生命科學前沿機構。華大基因標杆考察——解讀生命奧妙之行華大建立了世界一流的基因科技基賜應用研究體系;旗下深圳華大生命科學研究院負責運營我國唯一一個獲批籌建的國家基因庫;實現了對美國公司Complete Genomics(CG)的收購及基因測序儀器智造體系國產化。
  • 華大基因參與發起地球生物基因組計劃
    4月24日,《美國科學院院刊》正式發布「地球生物基因組計劃」(EBP)科研展望文章。華大基因是該項目的發起單位之一,他們稱,這是繼人類基因組計劃之後,生命科學領域又一件大事,堪稱生物「登月計劃」。華大基因發起生物登月計劃據科技日報4月25日消息,華大聯合創始人、華大基因理事長楊煥明,華大執行長、華大生命科學研究院院長徐訊,深圳國家基因庫副主任張國捷均參與其中。徐訊表示,這一具有裡程碑式意義的項目將幫助我們全面了解地球生命演化的奧秘。
  • 帶孩子解讀基因奧秘,打開看未來的眼睛:華大基因探秘生命密碼,讓...
    在小說裡,作者大膽設想了未來的基因編輯技術,可以通過改變基因的方式,幫助貧困地區的兒童告別飢餓。 人類對於基因奧秘的探索永無止境。
  • 華大基因中標河北孕婦耳聾基因檢測服務項目
    新京報訊(記者 王卡拉)10月27日,華大基因發布公告,公司控股子公司深圳華大臨床檢驗中心(以下簡稱「深圳臨檢」)中標河北省2020年-2022年孕婦耳聾基因檢測服務項目,中標項目預算為1.8億元。遺傳性耳聾基因檢測能夠在分子水平上明確病因,預防遲發性、藥物性耳聾發生,幫助臨床及時進行幹預、治療和預後評估;通過對耳聾高頻基因位點進行檢測,能夠提升聽力障礙的早期發現率,預防部分聽力障礙的發生,從而降低家庭經濟負擔和整體醫療支出,減輕社會負擔。
  • 牽手美加醫學 華大基因進軍牙髓幹細胞應用
    8月20日,剛剛發布上市輔導登記公告的華大基因與美加醫學(00876,HK)正式宣布就牙髓幹細胞儲存及應用項目達成戰略合作。  《每日經濟新聞》記者了解到,二者在合作上分工明晰,美加醫學依靠在全國的廣泛的渠道和門診負責前期的樣品採集以及質量把關,華大基因則負責後期幹細胞的製備和儲存。
  • 深交所扒皮華大基因背後,華大關聯交易到底做了什麼?
    不僅僅對全通教育發起教科書式問詢,更兩次「空襲」華大,深扒華大關聯交易,掀開了長期掩蓋在華大基因關聯交易上的蓋子。證監局二次「空襲」華大基因繼4月4日收到深圳證監局罰單後,4月8日晚,華大基因再迎深交所「空襲」,背後依舊是關聯交易問題。
  • 蘭科中心與華大基因正式籤約蘭科植物基因編輯項目
    央廣網深圳7月24日消息(記者李強)近日,國家蘭科中心(簡稱「蘭科中心」)與深圳華大基因研究院(簡稱「華大基因」)正式就「蘭科植物基因編輯——模式蘭科植物開發項目」進行籤約。但是目前為止,對蘭科植物相關基因的功能研究仍然十分匱乏,這很大程度上是受到遺傳轉化效率及基因敲除手段的制約,當下的基因編輯技術可實現對目的基因的精確敲除、插入或修飾,其在蘭科植物中的成功應用將極大地推動蘭科植物在基因功能研究及新品種培育研究等方面的發展。
  • 華為雲攜手峰科發布FPGA基因加速雲解決方案,基因測序性能提升5倍
    華為雲FPGA基因加速解決方案解析 華為雲FPGA基因加速解決方案集成峰科的加速IP,為用戶提供一種易於使用,經濟實惠的基於FPGA的基因組分析流程加速服務,在該方案中,華為雲配備了32核CPU,單個VU9P FPGA的實例。
  • 華大基因定增募資20億元 用於基因檢測服務項目
    7月1日晚,華大基因公告稱,擬向不超過35名特定投資者非公開發行不超過4001萬股份,募資總額不超過20.1億元。華大基因此次發行通過競價方式確定發行價格,定價基準日為本次非公開發行股票發行期首日。發行價格不低於定價基準日前20個交易日公司股票交易均價的80%。
  • ...大咖論道|生態圈|尹燁|華大基因|測序儀|基因組|罕見病|-健康界
    精準醫學納入「十三五」;基因診斷擴大適用範圍,二代測序診斷試劑盒和腫瘤免疫治療單抗陸續獲FDA批准;個人基因組、健康管理、體檢和保險跨界聯姻;國家微生物組計劃登堂香山會議;BAT,華為,亞馬遜等逐鹿基因大數據云平臺;國產測序儀量產,國家基因庫運營;同時,科普依然短缺,應用未形成閉環;產業概念期已過;2017年可以預見大浪淘沙,併購重組可能興起。
  • Natera牽手華大基因,將開拓中國無創檢測新市場
    為了將Natera的循環腫瘤DNA Signatera微小殘留病變(MRD)測試技術在中國商業化,並利用中國測序巨頭華大基因的測序技術在特定市場中開展生殖健康測試,兩公司近日籤署了一項為期十年,價值5000萬美元的技術協議。根據這項協議,華大基因將向Natera支付5000萬美元作為預付許可費,預付特許權使用費和未來的階段性費用。
  • 華大基因擬募資20億元 擴大基因診斷試劑及DNA合成產能
    每經記者:趙李南 每經編輯:魏官紅7月1日晚間,華大基因(300676,SZ)發布了《2020年度創業板非公開發行A股股票預案》。《每日經濟新聞》記者注意到,此次華大基因擬募資不超過20.12億元,募集資金計劃投向五個項目。
  • 人類基因組計劃後,華大基因又發起了一項更宏偉的項目
    文|周夢亞剛宣布將測序儀交由「代工巨頭」富士康生產,華大啟動「地球生物基因組計劃」的消息又吸引了全世界的關注。繼人類基因組計劃之後,生命科學領域又將迎來一件大事——華大基因與美國斯密森尼生物多樣性基因組學項目組聯合發起了「地球生物基因組計劃」,比人類基因組計劃更宏大的地球生物基因組計劃(Earth BioGenome Project, EBP)即將啟動,目標是破譯地球上所有生命的基因組。
  • 華大基因,不僅僅只是簡單的基因測序
    華大基因成立於1999年,致力於在人類健康服務事業和科技應用領域的發展。華大基因堅持「以任務帶學科、帶產業、帶人才」,先後完成了國際人類基因組計劃「中國部分」(1%,承擔其中絕大部分工作)、國際人類單體型圖計劃(10%)、第一個亞洲人基因組圖譜(「炎黃一號」)、水稻基因組計劃等多項具有國際先進水平的基因組研究工作,彰顯了世界領先的測序能力和生物信息分析能力,也奠定了中國在基因組學研究領域中的國際領先地位。
  • 華大基因
    機構介紹 深圳華大基因股份有限公司成立於
  • 華大基因:一群「科學土匪」的逆襲
    從這次華大基因的招股書來看,華大基因的主營業務為通過基因檢測等手段,為醫療機構、科研機構、企事業單位等提供基因組學類的診斷和研究服務。主要服務於國內外的科研院校、研究所、獨立實驗室、製藥公司等機構,以及國內外的各級醫院、體檢機構等醫療衛生機構、公司客戶和大眾客戶。
  • 華大基因上市三周年:基因測序第一股「王者歸來」
    可以預見的是,2020年又將是華大基因的豐收之年,在這背後是華大基因持續的科研轉化所帶來的良好成績。上市三年來,華大基因的研發投入分別為1.74億元、2.65億元、3.34億元,佔營收比分別為8.32%、10.44%、11.94%。