還在手動的將數據在不同的存儲中存來存去?
海量數據中查找某數據耗時耗力?
分析數據過程中內存超配,機器宕機?
......
如果上述問題還在佔用您的時間和精力,說明您的生物信息分析系統亟待更新完善。一個好的生物信息分析系統,可以解放您的雙手,您只需專注科學研究,其他問題交由生物信息分析系統來做。
生物信息分析系統並不是簡單的硬體存儲加上分析軟體的堆疊,而是為滿足生物信息分析對於速度、規模和智能化等苛刻需求建立的一體化解決方案。榮之聯為生物信息專門設計了自底向上的完整的數據系統——榮之聯BioStack私有雲,可一次性解決生物信息數據的存儲、數據管理、分析計算和特徵數據挖掘。是高度垂直的、全棧的、更專業的生物信息分析系統。
- 存管算察 四位一體 -
數據存儲—理解生物信息應用,極致性能優化;
隨著分析算法和工具的不斷豐富,不同分析階段訪問數據的模式也越來越多樣化,對於存儲的帶寬、IOPS 和延遲等性能指標都有不同的需求,所以無法通過單的存儲系統來解決生物信息分析面對的所有問題。針對不同的需求我們推出多套不同存儲系統組合在一起來解決生物信息不同分析模式要求的帶寬和IOPS的性能。
不同存儲系統組合出擊
Alamo-D:針對高帶寬應用場景;Annapurna:針對高IO、低延遲應用場景;Alamo:針對冷數據存儲需求。
感知應用
存儲系統感知應用特徵,調度合適的存儲資源。
感知數據
存儲系統具備數據感知能力。
數據管理—數據感知,秒級反饋;
管理系統能夠感知數據特徵,解決數據複雜性問題。
數據發現
海量數據中實現秒級數據查找。
數據溯源
幫助用戶構建整個數據的族源關係,例如可追溯VCF文件的基因文件來源以及分析流程中工具版本等。
數據多維有序
幫助客戶多維度理解、分析數據。可幫助管理員查找空間使用最大的用戶、重複冗餘的數據等。
數據重組
無需手動將有關聯的數據複製到同一目錄,通過數據重組可以得到一個具有相同特徵的數據集,作為大規模生物信息分析計算的輸入。
數據計算—分布式調度、應用感知融合多計算框架;
按需動態構建計算框架,簡化流程編排,靈活高效的組織生物信息分析流程、調度生物信息作業 。
流程編寫簡單
流程編寫難度較比傳統SGE、LSF的方式難度大大降低。
應用感知,智能調度
可以感知應用的IO類型,不僅可以調度計算資源,也可以將數據調度到合適的存儲位置上。
靈活省心
將程序(工具)封裝進Docker,規避軟體版本依賴關係和衝突的問題。
融合多計算框架
動態構建批量計算、Spark等多種計算集群。
突破集群規模瓶頸
分布式計算環境,多集群統一調度,多調度器之間相互協作,規模無限。
數據洞察—數據可視化,基因分析更直觀。
根據多維度數據特徵,利用網絡可視化算法和工具,通過對可視化數據特徵之間的關係進行關聯,定性指導生物信息,基因分析的研究方向。
基因分析解讀
基因組注釋解讀軟體,用於解讀人類基因變異;支持30+常用生物醫藥資料庫,整合生物醫藥資料庫>200GB;變異解讀引擎可以隨時動態開關不同的解讀功能,深度挖掘變異結果所包含的意義。
基因組瀏覽器
高性能基因組瀏覽器軟體用於對多個基因組的基因數據進行可視化處理;多重定製的視窗角度去挖掘變異數據;網頁式運行模式,多平臺支持,無需額外安裝。
榮之聯BioStack私有雲可貼合醫學檢驗所、測序公司、科研機構等用戶需求進行定製化部署。既可滿足日常計算、存儲需求,也可實現平臺級全流程搭建(含IDC)。
- 按需部署 各節點打通 -