2020年9月25日凌晨,希捷開源了一個叫做CORTX的對象存儲軟體項目,CORTX項目100%開源,兼容標準的S3接口,目前已經可以在github(地址見文末)上獲取到源碼,同時,還提供了預配置的虛擬機鏡像直接安裝快速體驗,如果有什麼問題,也可以在新建立的CORTX開源開發者社區裡進行交流。
CORTX是希捷完全從頭開始設計和實現的對象存儲方案,它直接將數據存到塊設備中,而不經過本地文件系統層,它還有許多高級特性,比如使用流式b-trees來訪問系統和用戶元數據等小塊數據,以此提升性能。
CORTX作為面向非結構化數據存儲的大容量分布式對象存儲方案,其擴展性是重點,單一namespace下可以從幾PB起步擴展到EB級別。
與此同時,為了方便在生產環境用起來,CORTX還發布了參考架構Lyve Drive Rack(LDR)方案,LDR是一個融合系統,它採用AA高可用架構設計,數據保護方面還支持ADAPT技術,單節點支持放置84或者106塊磁碟,支持16、18TB CMR磁碟,容量大約1.3PB起步。
LDR目前在磁碟櫃級別提供了數據持久性,如上圖所示,這種等級制(Hierarchical)的擦除編碼技術能加快磁碟的故障恢復速度,特別是在用大容量磁碟時候更有效。
想要自行搭建CORTX系統的用戶最好使用有高可靠設計的存儲硬體,因為,CORTX軟體中的擦除編碼技術目前還是預覽狀態,想要使用該技術的話還得等等。
對希捷來說,CORTX可以更好地利用大容量磁碟,CORTX開源方案中加入了希捷對於大容量硬碟做的許多獨有優化,官方的優化能發揮硬碟本身的特性和優勢。
從戰略上來講,對於希捷的主營業務有直接利好,希捷也宣布將於12月發布20TB HAMR磁碟,預計在2026年,能把HAMR盤做到50TB。從目前資料來看,希捷表示目前主要支持CMR,以及新的HAMR盤,沒有提及SMR,不過,後續可能會基於CORTX對SMR做一些優化。
基於大容量磁碟的CORTX可以提供超高的存儲密度,減少地板資源佔用,節省寶貴的機房空間,所以,對最終用戶來說,CORTX可以實實在在幫助用戶降低成本,至少軟體是免費的。還有希捷硬碟原廠技術服務撐腰,可能會比別的開源方案用的更放心一些。
市場會接受這樣一個新的對象存儲方案嗎?
由於CORTX是100%開源的,所以,天生就比較容易被接受。CORTX由希捷來開源的好處是,可以快速構建生態,在CORTX社區裡,匯集了大量最終用戶、OEM以及許多開發者。基於種種設定,相信Cortx很快就能在生態上打開局面。
英特爾表示可以基於傲騰持久內存、QAT技術、以及DAOS文件系統與之合作。著名HPC並行文件系統廠商WekaIO肯定了CORTX對於在存儲的高性能和存儲的經濟方面的價值。
而且,CORTX是一款不依賴特定硬體架構的開源對象存儲軟體,如上圖所說,支持任意類型處理器,只要是支持標準塊存儲接口的設備都可以用,無論是SSD還是磁碟又或者是NVM,無論是希捷的盤還是別人家的磁碟應該也都能用。
對用戶來說,沒有廠商鎖定的風險,對於合作夥伴來說,參考解決方案的打造可以豐富其產品類型。
CORTX是一個非結構化數據存儲方案,其應用場景包括人工智慧、機器學習、混合雲、邊緣計算、高性能計算等。目前,已有多家科研機構測試或者實際使用了CORTX,包括法國替代能源和原子能機構、英國原子能管理局、洛斯阿拉莫斯國家實驗室。
還有硬體合作夥伴正在測試軟硬一體的打包解決方案。首批參考架構將於2020年Q4正式對外可用,商用版本的一體機方案可以從合作夥伴處獲取,從而為LDR提供企業級支持。
希捷為什麼要開源這樣一個項目呢?
大容量硬碟帶來的成本優勢
如今網際網路技術發展越來越多地影響著企業IT,希捷的CORTX主要面向的是企業級用戶,CORTX開源的、沒有廠商綁定的思路與超大規模數據中心的做法如出一轍,讓企業也享受到網際網路公司技術的福利,比如網際網路公司能比企業更快用上大容量磁碟。
希捷分析後給出了一個有趣的數字,現在的企業級存儲比較貴,用戶在企業級存儲上投入的資金中只有25%是花在磁碟本身的,換言之,就是用戶付出的額外成本太高了,降低成本的方式有很多,比如開源一個CORTX。
其實,在幾年前,西數也有過類似的解決方案,它的意義在於提升產品方案的附加值,不只是售賣磁碟而已。相比之下,希捷的此次做法就高明很多,開源方案更容易讓人接受,開源的CORTX避免了與合作夥伴的直接競爭。
希捷與對象存儲其實頗有淵源。
1999年,希捷提交了「基於對象的存儲設備命令集建議」的初步版本,包括卡內基梅隆大學、IBM、Quantum和StorageTek對該建議都有貢獻,這份建議中將對象定義為一種抽象數據,它具有唯一的標識符和元數據,定義了對象如何與文件系統的關係,以及許多其他創新概念。
希捷也從來不滿足於只做硬碟。值得一提的是,LYVE Drive是希捷一大類存儲產品的品牌,LYVE Drive Mobile從SD卡、到讀卡器、到硬碟盒、存儲陣列都有,側重於移動性,能讓數據從邊緣傳到數據中心,LYVEDrive Shuttle則算一個獨立的系統,有計算存儲和網絡能力,而LYVE Drive Rack作為新的存儲系統參考架構,進一步豐富了該產品線。
複製地址獲取源碼
https://github.com/Seagate/cortx