作者:CSDN 宋慧
雲、大數據炒作熱度褪去,對數據的存儲計算技術正在回歸理性。在存儲這條傳統 toB 市場的賽道上,創業遠比 toC 市場複雜艱難許多。近日,一家以分布式文件存儲創業,集合了存儲計算與數據分析的初創公司——極道,表示從2015年創業至今,已獲得國內基因測序龍頭企業以及眾多基因測序、臨檢機構、生物製藥等生物醫療領域,以及地理空間和人工智慧等計算密集型、數據密集型和IO密集型應用的眾多客戶。CSDN專訪了極道創始人吳江,聽聽他對高性能計算、存儲底層技術創業的理解。
機緣巧合的創業歷程
極道創始人兼CEO吳江曾任Sun公司Staff Engineer,負責Sun作業系統Solaris的核心研發,是Solaris iSCSI Target的作者之一、SCSA v3第一版原作者以及STK 7000存儲系統核心貢獻者。2009年起,吳江擔任EMC中國研發中心統一存儲首席架構師,主持開發了EMC新一代虛擬化集群存儲Mako以及Neo Trin產品線;作為核心架構師,吳江主持設計了EMC VNX的核心存儲子系統MCX(MCR、MCF)。在大廠積累的研發經驗,讓吳江和同事們萌生創業想法,從2012年開始存儲方向的創業。不過現實是,EMC這樣的傳統大廠通用存儲已經足夠好,創業公司的品牌認知度低,抱著機器到處POC(測試)的辛苦,卻並沒有得到理想的認可。
沒想到一次數據事故,讓吳江和團隊證明了自己的技術實力。2015年7月國內基因測序龍頭企業發生了一起數據事故,文件系統損壞導致120T的核心樣本數據丟失,當時的存儲使用了Lustre(並行分布式文件系統),所詢問的大廠幾乎修復不了,在大範圍求助修複數據無果後,幾經周折找到了吳江。Lustre是DDN公司(全稱DataDirect Networks)從Intel旗下的WhamCloud公司收購獲得,吳江曾是Lustre的文件系統所用底層文件系統ZFS的核心貢獻者,他帶領團隊在72小時內找回了所有120T損壞的數據。同時,基因測序企業的數據量也震撼了研發存儲多年的吳江,通過了解基因測序行業對於數據計算和存取的模式和痛點,讓吳江決定從包括基因測序在內的泛生命科學行業切入,二次創業,研發具有特點和技術優勢的存儲與數據產品。
初創公司一樣可以做出好產品
生命科學行業數據量大,系統要求高,IT壓力大,但是即便使用目前行業中最好最貴的產品與系統,核心業務運轉效果也並不理想,吳江看到了機會。
但是極道沒有把自己定位成一個存儲公司。吳江認為,當前僅從存儲角度解決不了用戶問題,計算和存儲的縱向融合是趨勢,而協同才是真正的融合,即計算將數據存取模式預先告知存儲,存儲按照需求做到優化和假設。
在2017年之前,生命科學領域以第二代基因測序(簡稱二代測序)為主流技術,2017年開始第三代測序技術(簡稱三代測序)興起。三代測序與二代測序的技術原理完全不同,IO模式產生較大變化,從吞吐變為IOPS。據吳江介紹,當時包括頭部存儲廠商在基因測序公司的三代測序組裝測試中都"掛"掉了,極道也不例外,但是極道團隊在短時間內改造文件系統,與行業大佬的同臺競爭中,極道的存儲系統在最短時間內完成了三代測序組裝。吳江在EMC時期,EMC希望做世界級的文件系統以抗衡Isilon,最終的結局以EMC收購Isilon結束。這讓吳江看到,與大廠相比,創業公司具有更大靈活性,也可以做出來好產品。
打造"存管算"結合的數據系統
吳江將極道定義為以分布式系統為核心提升IT資源效率,提供高效智能數據處理基礎平臺的數據系統公司。據極道官方介紹,極道的核心產品涵蓋了分布式並行文件存儲、強關聯大規模實時數據管理系統,以及集群的調度系統和執行引擎,核心軟體系統均為自主研發,已擁有多項專利和軟體著作權。
在吳江看來,存儲系統所有原理講出來都非常簡單,但是複雜程度並不在原理而在於工程實現。一個存儲產品的穩定靠長時間打磨和嚴苛應用場景的磨練。極道第一套系統在2015年9月進入到大規模客戶的準生產環境,已經連續驗證超過3萬個小時,並且已經進入用戶一級生產系統。
雖然從生命科學領域切入,但極道的產品也同樣適用於三大場景:
· 生命科學、地理空間、科學研究、科學計算的高性能計算場景;
· 依賴大量數據的人工智慧場景;
· 視效處理等傳統的強需求場景。
極道現在的客戶群除了生命科學,還有地理信息、人工智慧、能源、科研等等。據吳江介紹,目前,極道在全球的客戶總部署節點700+個,在線時長60個月以上,數據0丟失。
極道團隊目前50多人,除了銷售,全員coding模式。作為創始人,在繁雜的管理事務之餘,吳江每周的寫代碼時間已經僅剩2天。吳江表示,Pre-A輪融資後,正在繼續投入和擴大研發力量,畢竟一個初創技術品牌,還要很長的路要走。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。