非結構化數據:一座未開發的金礦
伴隨著雲計算、大數據、物聯網、人工智慧等新興技術的快速發展,各種智能終端設備飛速增加,全球數據也呈現出了幾何級數的增長。來自國際數據公司IDC的統計顯示,全球有將近90%的數據都是在近幾年內產生。預測到2025年,全球數據總量將達到175ZB。其中企業存儲的數據量,將超過全球總數據量的80%。
而在企業的存儲系統中,體積最為龐大的就是非結構化數據——其在數據總量中的比例竟然高達80%-90%。從電信行業的話單,到金融行業的「雙錄」,從教育行業的教學文檔,到醫療行業的影像資料,再到傳媒行業的音視頻素材……幾乎所有類型的企業都需要長期存放大量的非結構化數據,這也導致其在數據總量中的比例一直居高不下。
可以想見的是,存儲和管理數量如此龐大的非結構化數據,對於許多企業來說都是一項不輕的負擔。如果對數據的存儲和管理不當,不僅未必能夠為企業帶來理想的價值,企業還有可能因此蒙受巨大損失。不過從另一個方面來看的話,體量如此驚人的非結構化數據,如果管理和應用得當的話,對企業來說則是一座誘人的富饒金礦。
舉例來說,2020年肆虐全球的新冠疫情,就給醫療行業帶來了極其嚴峻的挑戰。作為疫情檢測的一種手段,醫院需要為病人拍攝很多胸片,這時候醫療影像資料的存儲和分析就顯得尤為關鍵。如果醫院有一個連續的機制將相關的影像數據存儲下來,而且有連貫性地進行診斷,就可以通過病情的變化對其進行分析研究,並有的放矢地制定相應的治療方案。
正因為如此,如何降低海量非結構化數據的存儲成本,更好地管理和應用非結構化數據,挖掘數據中潛藏的巨大價值,進而幫助推動自身業務的增長與轉型升級,也就成為了當前眾多企業亟待解決的課題。
備受好評的HCP對象存儲產品組合
俗話說「工欲善其事,必先利其器」,看到廣大企業面對非結構化數據這座「金山」時如此困擾,Hitachi Vantara也為其提供了相應的「挖礦」工具,那就是Hitachi Content Platform(HCP)對象存儲產品組合。
「以最常見的企業辦公場景為例,文件服務ROBO(Remote Office Branch Office)經常需要做跨平臺、跨地域的數據訪問,其中像銀行、MES、醫院HIS等熱數據都是跟核心系統緊密相關的東西;但是也有大量的數據,譬如社交媒體、庫存、財務數據等,都是偏後線的,還有許多數據和文件來自多種渠道,甚至包括微信、微博、抖音等平臺,所有複雜的應用場景和繁多的數據就變成了一種非常複雜的結構,我們稱之為非結構化數據。為了滿足客戶的需求,對非結構化數據後續的分析和處理也就變得更加重要。」Hitachi Vantara中國區首席技術官吳衛平向趣味科技表示,「另一方面就是安全,這一點甚至可能比剛才的複雜性更加重要。目前網際網路的安全問題非常突出,你想要在算法上、在數學機理上保證自己是不可被篡改的,就必須用到對象存儲,這樣才能夠從根本上解決這類問題。所以這些年來,企業對對象存儲的需求一直在不斷增加。」
近日,全球知名分析機構GigaOm發布了《GigaOm非結構化數據管理雷達報告》,指出Hitachi Vantara憑藉HCP對象存儲產品組合位列領導者區域,並且正在向中心區域移動,這表明Hitachi Vantara在非結構化數據管理方面的能力將更進一步趨於完善、成熟。事實上,HCP產品組合已經連續四次獲評IDC對象存儲領導者象限,並且贏得了Gartner和GigaOm的一致認可,更被全球2,500多家企業機構青睞和選用。
然而Hitachi Vantara並沒有就此滿足,而是再接再厲攜手WekaIO(Weka)推出了全新的分布式文件系統和管理解決方案,旨在幫助企業更加快速地訪問包括郵件、文檔、健康記錄、音頻、視頻和圖像等在內的非結構化數據,並從中獲得洞察。
不久前,Hitachi Vantara還宣布了對HCP解決方案的全新擴展。此次功能擴展採用性能優化的全快閃記憶體HCP節點,可更好地支持新一代非結構化數據工作負載,以及更好的數據獲取、可視化、保護、成本優化、檢索和分析,連接邊緣和用戶設備,並支持私有雲、公有雲、混合雲之間的智能數據移動性。
更安全、更易用、更高效、更具性價比
對於企業用戶來說,Hitachi Vantara推出的HCP對象存儲產品組合及其創新擴展,為他們帶來了更安全、更易用、更高效、更具性價比的解決方案。
在安全方面,HCP是全球第一家通過十幾家公司認證,符合歐洲和美國安全標準的平臺。HCP的EC糾刪碼、DPL多副本保護、WORM(一次寫多次讀)、多版本管理、數據自校驗和自修復等機制,能夠充分應對各種物理故障、系統邏輯故障和人為錯誤,保證數據100%符合行業監管要求。
在易用性方面,HCP具備多項強大的原生功能,能支持客戶通過平穩地改變現有主要存儲的用途,顯著提高存儲的有效容量。不僅如此,HCP還提供了易用的下載和上傳功能,並能有效監測和控制不斷增長的數據量。此外,HCP產品組合中還包括了HCP Anywhere、HCP Anywhere Edge以及HCP Gateway,可通過建立基於對象存儲的私有雲,滿足企業的遠程辦公需求。
在效能方面,由於採用了性能優化的全快閃記憶體HCP節點,HCP功能擴展後可幫助客戶在Amazon S3協議上實現與以往相比3.4倍的吞吐率,並降低多達34%的成本。更新後的存儲節點將讀寫性能也提升了三倍,並同時在與上一代產品相同的機架空間中實現了三倍的容量提升。為了滿足高性能需求,越來越多的企業組織正將其傳統NAS存儲、主要工作負載和雲原生工作負載不斷遷移到對象存儲。
在性價比方面,HCP在幫助企業提升業務效率的同時,還可以幫助降低存儲成本。以醫療行業為例,醫療機構如果將影像資料保存在傳統的NAS存儲中,不僅成本高昂,而且響應速度也會隨著數據量的增加而變慢;如果換用HCP建立分層存儲,則可以根據需求從不同層級的存儲中調閱數據,不但提升了工作效率,而且還降低了存儲成本。
「今年全新擴展的HCP對象存儲產品組合,其中的高密度存儲櫃可以在4U空間裡支持差不多100塊硬碟。如果以單塊硬碟10TB計算的話,存儲容量就是1PB,而且還可以通過增加單塊硬碟的容量來繼續加大存儲空間。在業界能夠做到這麼高存儲密度的,我們可能是僅此一家。」Hitachi Vantara資深解決方案顧問蔡慧陽補充道,「在每個TB單位存儲成本下降的同時,還可以帶來其他方面的好處,那就是節省機房和機櫃空間,以及進一步降低能耗和製冷成本。這樣如果遇上機房空間不夠,或者是租用IDC機房的情況,我們的解決方案還能幫助企業進一步降低成本。」
值得一提的是,截至今年,Hitachi Vantara已為全球50,000家數據量超過16EB的客戶提供100%數據可用性保證長達20年!「在存儲領域,Hitachi Vantara有著自己獨特的技術領先優勢。」吳衛平向趣味科技表示,「以VSP 5000系列為例,它可以保證99.999999%也就是「8個9」全天候運行的正常運行時間和可靠性。而業內其他產品通常是6個9或者7個9,與VSP 5000系列有著10倍甚至是100倍的巨大差距。」對於銀行、電信、醫院等對安全要求較高的企業來說,VSP 5000系列是理想的最安全、可靠的存儲解決方案。而同時VSP 5000同樣可以作為HCP後端存儲池的擴展,為那些尋求高性能、高可靠、多協議支持的用戶提供非結構化解決方案。