持續降低海量基因組數據所需的存儲空間以及傳輸成本
2019年,因美納在全球投入使用的15,000多個測序系統所生成的基因組數據量同比增長50%以上,總計高達150PB,相當於連續錄製500年高清視頻所產生的數據量。如此海量的數據反映了基因測序技術的日益完善,尤其體現在測序成本降低產生的影響和基於測序技術的研究及臨床應用的激增,這些都有助於改善生命健康。
因美納一直以來致力於提供最具創新性和靈活性的測序技術。而許多人並不了解,因美納同樣致力於幫助客戶管理不斷增長的輸出數據,以降低研究基因組信息的成本和時間。
繼2018年5月收購Edico公司、2020年6月收購雲軟體公司BlueBee之後,因美納又迎來了位於法國瑟松塞維涅(Cesson-Sévigné)的基因組數據壓縮軟體公司Enancio。Enancio的無損壓縮技術能將因美納測序儀的輸出數據從50GB壓縮到10GB,使數據存儲成本降低5倍。收購完成後,Enancio的技術將直接集成到雲數據交換平臺DRAGEN上,以及因美納的雲存儲平臺服務中。
因美納全球產品開發高級副總裁Susan Tousi表示:「熱烈歡迎Enancio加入因美納大家庭,我們將繼續系統性地為用戶解決基因測序平臺海量數據所帶來的存儲瓶頸問題。因美納可擴展的雲數據交換平臺DRAGEN目前擁有業內最先進、最獨特的二級分析工具,該平臺採用因美納分析平臺(IAP)和BlueBee的技術,為客戶提供高效、快速、簡單的工作流程。Enancio和BlueBee加入後,因美納現在擁有了卓越的數據云服務。」
Enancio基於雲的準商用壓縮技術,可以在降低數據存儲成本的同時保持數據的完整性。Enancio壓縮是一個無損、可參照的基因組數據壓縮器。它採取「參照式」(reference-based)的壓縮算法壓縮DNA序列,用一種專為壓縮設計的超快映射方法,將讀取內容映射到參考基因組上。應用緊湊的二進位格式來將讀取信息編碼為位置和差異列表,再採用熵編碼器。最終,用適合不同類型質量方案的距離編碼器和背景模型,以無損方式對質量分數進行編碼。
Enancio的技術為基因組數據的壓縮和解壓縮提供了最快速、最高效的解決方案,並且對因美納的其它信息解決方案也進行了很好的補充。
Enancio執行長Jennifer Del Giudice表示:「很榮幸能夠加入因美納的大家庭,我們將共同應對這場把研究人員和臨床醫生推向數字時代的『數據海嘯』。這場信息海嘯影響深遠,並且非常複雜,但其中同樣蘊藏著科學發展的無限可能。在與因美納的雲數據交換平臺DRAGEN集成後,我們將使數據的存儲和傳輸更加高效,對用戶更加友好。」
因美納最近進行的一系列與基因組數據分析相關的收購打破了海量數據所帶來的挑戰。因美納致力於改善客戶端到端的基因組測序工作流體驗。因美納強大、富有創新性的信息學技術發揮了關鍵作用。未來,因美納將繼續提高基因組數據的利用率,並加快基因組數據在臨床中的應用。
關於因美納 (Illumina)
因美納公司致力於推動和激發基因組學的發展而不斷改善人類健康。專注創新使我們成為全球基因測序和晶片技術的領導者,並為全球範圍的科研、臨床和應用市場客戶提供專業服務。我們的產品廣泛應用於生命科學、腫瘤學、生殖保健、農業及其他新興領域。