為非結構化數據存儲樹新標準,PowerScale的傳承與創新

2020-12-04 申耀的科技觀察

一直在引領

悠久的創新歷史

全球22個行業首選

從未被超越

連續4年Gartner

魔力象限領導者遙遙領先

非結構化數據存儲標準再次刷新

Dell EMC PowerScale

耀世登場

眾所周知,今天數據正快速融入到人們的日常生活中,這讓各行各業的數據都出現了「井噴式」的爆發增長。但隨著企業對數據的理解和應用越來越深刻,會發現基於數據的創新依然面臨著很多的困難,那就是這些不斷湧現的數據大多是以非結構化數據的形式存在。

根據IDC的預測,到2025年,80%的數據將是非結構化數據。Gartner的數據也顯示,從2019年到2024年,非結構化數據容量預計將增加兩倍

因此,這就對非結構化數據的存儲、使用和管理提出了更高要求,同時也對存儲基礎設施的性能和可擴展性提出了前所未有的挑戰。

在此背景下,617日,戴爾科技集團正式發布Dell EMC PowerScale,它專為非結構化數據而生,並率先把戴爾科技的創新實力注入到全球排名第一的橫向擴展NAS平臺之上。

採用PowerScale OneFS作業系統的PowerScale節點和Isilon節點可以組成強大、統一的內嵌透明數據生命周期管理的存儲平臺,支持更加高效地存儲、管理、保護和分析非結構化數據,可以說為下一代非結構化數據管理奠定了堅實的基礎,更為非結構化數據存儲樹立了新的標杆

毫無疑問,PowerScale的「應運而生」,是戴爾科技集團在存儲技術創新領域不斷求新求變的真實印證,也是其「一直在引領、從未被超越」的最佳體現。而這也會最大化地釋放「新基建」時代數據的作用與價值,並大大推動企業數位化轉型的步伐,讓客戶在面對非結構化數據創新挑戰時真正做到「不畏挑戰,不懼艱難」。

非結構化數據的四重挑戰

隨著雲計算、大數據、人工智慧、物聯網、邊緣計算等新技術在各行各業更加廣泛的普及與應用,不僅催生出了越來越多的非結構化數據,同時也讓數據的管理、使用和價值挖掘變得愈加複雜和困難,我們可以從四個維度來做觀察:

1

非結構化數據的種類繁多

是指很多企業新增的數據之中,結構化數據僅僅只佔據了數據的一小部分,而更多的則是非結構化數據,如視頻、音頻、圖片、圖像、文檔、文本等各種多樣化的形式。

以視頻監控應用為例,客戶不僅需要存儲大量的視頻數據,而且還需要存儲因使用人臉識別技術而產生的人臉截圖等非結構化數據文件,這一類文件通常只有幾個KB到幾十個KB大小,但是數目特別巨大,動輒就是十億甚至百億的規模。

2

非結構化數據的來源廣

是指數據生成和使用的位置正在發生變化,即今天的數據正在從邊緣到核心再到雲的過程中不斷存儲和流動。事實上,Gartner預測也印證了這一變化,到2022年,超過50%的企業生成的數據將在數據中心或雲的外部創建和處理,而2019年這個數據不到10%。

3

非結構化數據的擴容難

非結構化數據的不斷湧現,在造成種類與數量眾多的同時,更讓傳統的存儲基礎設施在性能與容量方面變得無法兼顧

一方面,越來越多的場景會產生億級至數十億級的非結構化數據,但當數據量達到一定程度時,存儲設備的性能也將嚴重衰減;另一方面,隨著大量的非結構化數據佔用存儲空間,企業存儲的擴容的需求還會造成投資成本的不斷攀升,由此讓企業陷入「進退兩難」的境地。

4

非結構化數據的變現難

我們知道,數據是重要的資產,企業都希望把數據所帶來的效應發揮出來,實現更加精細化的管理和決策,從而有效的提升質量、降低成本、優化服務等等,但由於非結構數據本身「無處不在」的特點,往往讓企業查找和分析非結構化數據變得更加困難,數據變現也就無從談起

由此可見,非結構化數據正演變成為企業數據生命周期管理中的新「痛點」,這就需要更加創新的存儲方式,在為用戶提供強大性能和輕鬆擴展存儲能力的同時,也要能夠把非結構化數據源源不斷的轉換為智能和洞察,由此,為用戶創造更加敏捷的行動力與速度儼然已是大勢所趨。

為非結構化數據應運而生

正是洞察到市場的這一變化,戴爾科技集團推出了專為非結構化數據而生的PowerScale,它通過軟硬體協同創新,首次把戴爾科技強大的橫向擴展文件系統OneFS和卓越的伺服器平臺PowerEdge有機結合起來,在高效地存儲、管理、保護和分析非結構化數據的同時,也為各種應用程式和工作負載提供了強大的支持能力。

具體而言,PowerScale的優勢主要體現在:

PowerScale具備高度彈性,能夠根據企業的需求伸縮自如,簡捷如一;PowerScale對於任意類型的用戶,可以以任意的非結構化數據訪問方式,在任意的位置,存儲訪問任意類型的非結構化數據;PowerScale的整體方案還實現了對所有數據源的智能的洞察力。

首先,「伸縮自如、簡捷如一」:PowerScale藉助OneFS強大的橫向擴展體系結構能力,可以讓客戶根據需要,動態配置所需的恰當的容量和性能,而無需過度配置存儲或進行推倒重來式的升級。

更為重要的是,OneFS作業系統通過單一命名空間、單一文件系統環境和企業級數據服務優勢,客戶可以通過提高效率和新的自動化功能獲得易用性、靈活性和高性能。這種易用性,不僅體現在最終用戶使用的客戶體驗上,同時也體現在管理上的體驗上。

比如,容量和性能的擴容可以在60秒之內通過簡單增加節點而實現,更新換代也可以通過簡單地切換下過時的老舊節點完成,而不需要考慮任何的數據遷移。

可以看到,PowerScale提供從最小11TB到多PB規模的存儲能力,支持對數百萬個文件進行操作;同時,智能的橫向擴展群集可確保在添加節點時不會出現「熱點」,帶來存儲效率的提高,整個集群的存儲利用率可超過80%

此外,PowerScale還是一款可編程的基礎架構,支持KubernetesOpenShift的集成。因此,通過大規模簡化能力,PowerScale的成本更低,一位管理員就可以管理PB級的存儲。

其次,「任意數據、任意位置」:PowerScale同步時支持多種協議的企業級非結構化數據服務。在此基礎上,戴爾科技通過將S3訪問引入到PowerScale數據平臺之上,並藉助原生的Google Cloud Platform支持,PowerScale能夠部署在從邊緣到核心再到雲的任意環境之中。由此帶來的好處是,大大增強了靈活性和敏捷性,並優化了企業數據存儲和訪問的能力。

任意數據,是指PowerScale支持高達8種協議,包括NFSSMBHDFSS3RESTHTTPNDMPFTP,同時可向任意客戶端提供訪問權限,並支持任意用戶的需求。可以說,PowerScale的多協議訪問能力,為企業運行的工作負載提供了無限的靈活性,這些工作負載既可以使用一種協議存儲數據,也能夠使用另一種協議訪問數據。

這種支持多協議訪問同一數據的特性,既解決了不同用戶的不同訪問方式的需求,更為重要的是解決了數據在存儲和使用中的一致性和完整性問題,比如源數據的存儲訪問,和大數據分析之間數據差異問題。

任意位置,是指PowerScale通過提供新的基於PowerEdge的全快閃記憶體和NVMe節點的能力,能夠將OneFS帶到更多的位置,真正讓OneFS在存儲環境中變得「無處不在」,無論是在數據中心、邊緣、核心還是雲中,都能藉助統一的OneFS作業系統,以相同的方式進行存儲管理。

最後,「海量數據、智能洞察」:在提供智能的洞察力方面,PowerScale還可通過新增的CloudIQ和DataIQ獲得關於存儲基礎架構和非結構化數據的洞察力。其中,CloudIQ可以讓整個數據中心系統的運行狀況監控變得更加容易,而DataIQ則可以使客戶可以輕鬆找到和利用文件和對象存儲中的數據。

特別值得一提的是DataIQ,它可以對企業各種非結構化存儲(不局限於Dell EMC中所有的非結構化存儲,如Isilon、ECS和PowerStore等存儲設備)中所存儲的非結構化數據,都能夠實現統一的「管理」,由此讓客戶無論是做數據遷移、歸檔都變得更加方便和容易,同時未來基於這些數據做分析和利用也變得更加高效,真正讓客戶從非結構化數據中獲取最大價值,將數據轉化為洞察力。

從這個角度來看,PowerScale不僅以前所未有的前瞻力、創新力和產品力,重新定義了非結構化數據存儲的新標準,同時也引領了整個非結構化存儲未來發展的新方向和新趨勢。

一直在引領、從未被超越

回頭來看,戴爾科技集團在非結構化數據存儲領域也用自身實力和行動真正踐行了那句老話:我們一直在引領,從未被超越,而這也是PowerScale之所以在非結構化存儲領域保持強大競爭力,並不斷重新定義和引領市場趨勢的關鍵所在,背後重要的原因包括三個方面:

1

PowerScale基於久經驗證的傳承與創新。

PowerScale強大的能力由OneFS作業系統「賦能」,可以說PowerScale是OneFS的進階版,而OneFS是業界公認的最好的橫向擴展NAS平臺作業系統。

過去十多年來,OneFS作業系統演進了八代,客戶運用該系統在六代硬體上驅動各種工作負載,這讓OneFS具備「三劍合一」的能力,即可以將傳統存儲體系結構的文件系統、卷管理器和數據保護合二為一,從而構建跨集群中所有節點的單一智能文件系統。

數據顯示,全球10家最大的電信公司中有7使用OneFS進行分析/Hadoop工作負載;全球十大製藥公司中有8家使用OneFS;全球十大媒體和廣播公司中有8家使用OneFS;超過70%的領先高級駕駛員輔助系統/自動駕駛一級供應商使用OneFS進行ADAS開發等等。

可以說,全新的PowerScale存儲平臺最為獨特之處在於,它增加了新的功能和部署選項,但也保留了OneFS的無縫擴展功能和各種先進的特性,因此無論非結構化數據環境規模有多大,PowerScale均可輕鬆進行擴展和管理,是企業構建其數據湖的最佳選擇。

2

PowerScale的勇於技術創新、勇於突破自我。

PowerScale是戴爾科技集團在軟硬體融合創新領域的「集大成者」。以全新PowerScaleF600節點為例,它具有完整的NVMe支持能力,並以緊湊的外形規格提供出色性能,其可在單個群集上提供高達1580萬的IOPS和高達945GB/s的聚合吞吐量的解決方案,支持要求苛刻的文件工作負載,真正實現了「把結構化存儲帶給非結構化數據」。

在此基礎上,PowerScale的另一大創新,是藉助內置的多協議功能(包括NFS、SMB、HDFS、S3、HTTP和FTP協議),支持多種數據類型和不同的工作負載,讓非結構化數據無論在邊緣、數據中心還是雲端。

此外,通過基於策略的自動存儲分層來優化資源,以將數據自動移動到成本較低的層,包括公有雲和私有雲存儲,同時可選擇雲服務商,可以說徹底化解了非結構化數據「無處不在」的挑戰。

3

對用戶需求的深刻理解和洞察。

PowerScale的優勢不僅建立在對技術的不斷傳承與突破上,也在於對用戶需求的深刻理解和洞察,又為PowerScale在市場中保持強大的競爭力提供了新動能。

例如,用戶面對非結構化數據不斷暴增的最大的痛點,就是在性能和容量之間難以「兼顧」。而藉助由PowerScale和Isilon節點組成且由OneFS提供支持的群集平臺,客戶可以在數據優先的環境中消除存儲孤島、合併所有非結構化數據、存儲PB級文件數據並對其進行分析,憑藉群集中提供的多達252個節點,客戶可以在幾分鐘內同時擴展容量和性能,以滿足的特定業務的需求,且所有這些都不會增加任何管理上的成本負擔。

來自Forrester最新的研究報告顯示,通過採用PowerScale,企業在三年內獲得的收益高達1530萬美元,但成本投入僅為370萬美元,其累計淨現值(NPV)為1160萬美元,潛在投資回報(ROI)率高達317%,並且回收期只用了不到六個月。

非結構化數據存儲新標準

PowerScale通過「把結構化存儲帶給非結構化數據」,並徹底化解了從邊緣到核心再到雲中非結構化數據「無處不在」的挑戰,由此最大化地釋放「新基建」時代數據的作用與價值。所以,PowerScale在堅持技術創新,不斷顛覆自我的同時,也真正讓它「樹立非結構化數據存儲中的新標準」變得「實至名歸」。

相關焦點

  • 非結構化數據:企業存儲「隱秘的角落」
    HCP擁有可以協同工作的一整套解決方案,為雲、管理和新工作負載打下堅實基礎,可以幫助企業組織全面地應對非結構化數據的挑戰。高安全性。金融、電信等行業的業務與合規需求使得非結構化數據必須長期留存並保證完整性,這就對存儲系統的數據保護能力提出了很高的要求。
  • 開採非結構化數據這座金礦,企業需要什麼樣的工具?
    可以想見的是,存儲和管理數量如此龐大的非結構化數據,對於許多企業來說都是一項不輕的負擔。如果對數據的存儲和管理不當,不僅未必能夠為企業帶來理想的價值,企業還有可能因此蒙受巨大損失。不過從另一個方面來看的話,體量如此驚人的非結構化數據,如果管理和應用得當的話,對企業來說則是一座誘人的富饒金礦。
  • IBM光譜存儲產品系列之Spectrum Scale
    2015年3月17日,IBM推出全新存儲軟體產品系列IBM光譜存儲(Spectrum Storage),旨在通過智能軟體層來改變存儲經濟,即通過軟體定義存儲(SDS),進而解決數據存儲的低效問題。
  • 從邊緣到數據中心到雲,HCP對象存儲八大利器
    掘金數字新基建,對象存儲迎來全新發展期  數據不僅成為企業的新石油,更是價值的新來源,當數據成為企業數位化進程中的「主角」時,如何尋求更好的配角來展現出數據更多的魅力。  來自多個分析機構的數據綜合說明,非結構化數據隨著雲計算、大數據、物聯網等新興技術的蓬勃發展呈現出井噴式的增長。
  • SGI 3PB陣列引領新一代存儲潮流
    SGI稱,在這套系統中,一個19英寸的10陣列機架可以提供將近3PB的scale-out存儲容量,還有最先進的數據保密功能和不存在單一故障點。SGI的超大規模高性能數據中心產品一直是科學研究和政府部門IT領域的佼佼者,它正在朝著新一代存儲技術邁進,並將把它的存儲功能推廣到更大範圍的市場中去。
  • 杉巖數據:對象存儲智能化的探路者
    對象存儲的應用,能使雲上創新順利嫁接到企業私有雲環境中,從技術生態來看,對象存儲對於企業IT架構轉型至關重要。對企業來說,對象存儲能解決用戶使用公有雲資源的需求,想搭建混合雲架構的需求,想構建數據湖來容納各種數據類型的需求,想做大數據分析挖掘數據價值,想用人工智慧賦能業務創新,想使用容器以及雲原生技術架構加速業務創新的需求…….在諸多場景中,對象存儲的都能發揮什麼的價值呢?
  • 非關鍵業務數據管理的技術關鍵點:存儲、共享、分析、安全
    會議以「新數智·新未來」為主題,特邀中國工程院鄭緯民院士以及中國電子學會、中國計算機學會存儲專委會、SNIA等單位的嘉賓,與領先供應商、典型企業用戶代表,探討新數據時代存儲技術發展趨勢,分享數位化轉型成果,共話智慧未來。
  • 金山雲推出KingStack藍光雲一體機 實現低成本高可靠數據存儲
    近日,金山雲全新上線私有雲KingStack 5.0版本,通過創新性地將私有雲平臺與藍光光磁存儲融合,打造藍光雲一體機解決方案,解決了大規模數據存儲成本高、能耗高、存儲時間短、數據不安全等問題,能夠有效應對政府、金融、醫療、科研、廣電等領域數據的備份歸檔
  • 多活元數據技術,讓浪潮軟體定義存儲管理EB級數據
    北京2018年3月2日電 /美通社/ --移動網際網路與人工智慧時代,非結構化數據呈海量增長態勢,數據存儲平臺在彈性與性能上面臨巨大挑戰。浪潮軟體定義存儲通過提供元數據存儲與管理方案,給海量數據提供彈性空間,讓用戶自由馳騁於數據智能世界。
  • 中國SDS市場最新數據出爐:浪潮分布式存儲為何成增速第一?
    浪潮存儲產品線總經理李輝曾表示,「新基建」對數據處理提出了海量、多元、實時、多雲的挑戰。以5G為例,如果把5G比做水流動的管道,管道十倍百倍的加粗,勢必要求存儲有足夠的容量,能接得住。根據IDC與浪潮存儲聯合發布的數據及存儲發展研究報告,未來,四大新數據特徵將會呈現。
  • 2020中國數據與存儲峰會舉行,中國電子學會副秘書長洪京一致辭
    習近平總書記在多個重要會議上多次強調,要大力發展數字經濟,促進數字產業化,產業數位化,充分發揮數據要素價值,提升數字治理能力。加快形成數據驅動型創新體系和發展模式,為激活高質量發展內生動力,形成國內國際雙循環相互促進的新發展格局提供重要支撐。黨的十九屆五中全會公報中指出,要統籌推進基礎設施建設,加快數位化發展,不斷增強經濟創新力、競爭力、抗風險能力。
  • Hitachi Vantara對象存儲助力中意人壽 構建高效可靠的影像數據...
    全新非結構化數據資源池賦能數據管理及業務創新與此同時,ECM影像系統、團險、掌易通APP、呼叫中心等業務系統作為中意人壽的核心和重要業務系統,對存儲的性能、穩定性和可靠性要求極高。綜合考量以上因素以及當下中意人壽所面臨的挑戰,Hitachi Vantara幫助中意人壽基於HCP對象存儲構建了全新的影像平臺及影像數據資源池,將多個非結構化數據孤島進行整合。通過對海量非結構化數據的自定義元數據功能來實現集中檢索和調用,這一影像數據資源池可強力支撐業務快速上線,並滿足未來的數據分析需求。
  • 浪潮存儲聯合華中大,探索科研新基建背後的大數據奧秘
    正如發改委今年首次明確了新基建的範圍,將支撐科學研究等具有公益性質的重大科技、科教基礎設施劃分為創新基礎設施,屬於新基建未來重點投入方向。「當前科研領域在存儲等基礎設施方面主要有容量、性能和穩定性三個典型挑戰。」
  • 新數據時代,科研需要什麼樣的創新基礎設施
    正如發改委今年首次明確了新基建的範圍,將支撐科學研究等具有公益性質的重大科技、科教基礎設施劃分為創新基礎設施,屬於新基建未來重點投入方向。「當前科研領域在存儲等基礎設施方面主要有容量、性能和穩定性三個典型挑戰。」
  • 威騰電子「分區存儲「技術席捲2019中國數據與存儲峰會
    12月3日,由百易傳媒(DOIT)主辦的2019中國數據與存儲峰會(DATA & STORAGE SUMMIT,DSS)在京召開幕,與眾專家對新一代關鍵存儲技術趨勢及數據創新應用進行了熱議,數據智能成為關注的焦點。
  • 【存儲知識小講堂系列】為什麼橫向擴展很重要
    不過長遠來看,IDC預計到2025年,80%的數據將是非結構化數據。Gartner的數據也顯示,從2019年到2024年,非結構化數據容量預計將增加兩倍。可見,在未來數十年裡,大量的非結構化數據將對企業的使用和管理和存儲提出了更高要求,同時也對存儲基礎設施的性能和可擴展性提出了前所未有的挑戰。
  • 華為發布全新一代OceanStor存儲Pacific系列 釋放海量數據價值
    當前,數據成為新生產資料,企業需要採集和存儲更豐富的數據,包括核心業務的結構化數據和5G、IoT、超高清等帶來的海量非結構化數據,並結合人工智慧對數據進行分析和處理,將數據轉換為知識和服務,提升生產效率。
  • 重新定義UltraPower+12V輸出標準 靜狼550W
    正所謂"無規矩不成方圓",各行各業都有自己所遵循的規範和行為準則,堅持標準並不是墨守陳規,創新發展也同樣重要,每一次的技術革新與升級換代都將帶領行業取得飛越,與更多的用戶共享精彩。靜狼電源設計額定功率為550W,並通過了80PLUS白牌標準認證,通過高效主動式PFC設計,在50%典型負載狀態下的轉換效率超過80%,運行穩定同時幫用戶節省電費。本款電源線材均經過蛇皮網包覆和熱縮管保護處理,柔韌而不易折斷,提供了包括6PIN和6+2PIN在內的多供電接口。
  • 100%數位化,中南醫院聯合浪潮存儲應對影像大數據挑戰
    時間來到2020年初,「強烈推薦CT影像作為診斷新冠肺炎主要依據」的觀點,一度讓武漢大學中南醫院醫學影像科副主任張笑春站在風口浪尖。 但一天之後的2月4日,《新型冠狀病毒感染的肺炎的診療方案(試行第五版)》進行調整,將「疑似病例具有肺炎影像學特徵者」作為湖北省臨床診斷病例標準。
  • 「存儲知識小講堂系列」為什麼橫向擴展很重要
    不過長遠來看,IDC預計到2025年,80%的數據將是非結構化數據。Gartner的數據也顯示,從2019年到2024年,非結構化數據容量預計將增加兩倍。可見,在未來數十年裡,大量的非結構化數據將對企業的使用和管理和存儲提出了更高要求,同時也對存儲基礎設施的性能和可擴展性提出了前所未有的挑戰。