大數據解決方案能負擔的起嗎?

2020-12-24 TechWeb

目前最大的誤區之一仍然是,只有大公司才能負擔得起大數據驅動的解決方案,它只適用於海量數據,而且價格昂貴。這已不再是事實,有幾次技術變革改變了這種心態。

大數據技術的成熟度

第一次技術變革與成熟度和質量有關。毫無疑問,十年前,大數據技術需要做出一定的努力才能使其工作或使所有部分協同工作。

過去有無數來自開發人員的故事,他們浪費了80%的時間試圖用Spark,Hadoop,Kafka或其他方法克服愚蠢的故障。如今,這些技術已變得足夠可靠,它們消除了早期的各種故障並學會了如何相互配合。

與捕捉內部錯誤相比,出現基礎設施故障的機會要大得多。在大多數情況下,即使是基礎設施問題也可以容忍,因為大多數大數據處理框架的設計都是容錯的。此外,這些技術為計算提供了穩定、強大和簡單的抽象,並允許開發人員專注於開發的業務方面。

各種大數據技術

第二次技術變革正在發生——近年來,無數的開源和專有技術被發明出來——Apache Pino、Delta Lake、Hudi、Presto、Clickhouse、Snowflake、Upsolver、Serverless等等。數千名開發者的創造力和創意已經轉化為大膽而卓越的解決方案,並具有巨大的激勵作用。

讓我們討論一個典型的分析數據平臺(ADP)。它包括四個主要層次:

· 儀錶板和可視化– ADP的外觀,向最終用戶提供分析摘要。

· 數據處理–數據流水線,用於驗證,豐富和轉換數據從一種形式到另一種形式。數據倉庫–存放組織良好的數據的地方–匯總,數據集市等

· Data Lake,用於存放純原始數據的地方,是Data Warehouse的基礎。

· 每個等級都有足夠的替代品,可滿足任何口味和要求。這些技術中有一半是在過去5年內出現的。

關於它們的重要一點是,技術的開發旨在相互兼容。例如,典型的低成本小型ADP可能包含Apache Spark作為處理組件的基礎,AWS S3或類似的Data Lake,Clickhouse作為倉庫,OLAP用於低延遲查詢,而Grafana用於漂亮的儀錶板。

具有更強保證的更複雜的ADP可以以不同的方式組成。例如,將Apache Hudi和S3引入作為數據倉庫可以確保更大的規模,而Clickhouse仍然可以低延遲地訪問聚合數據。

成本效益

第三次技術變革是由雲端造成的。雲服務成為真正的遊戲規則改變者。他們將大數據作為即用型平臺(大數據即服務)進行處理,使開發人員可以專注於功能開發,從而使雲計算能夠關注基礎架構。

開發人員可以選擇特定技術和一定程度的無伺服器。無伺服器越多,它的可組合性就越好,但是更多的供應商鎖定將使它成為不利的一面。鎖定在特定的雲提供商和無伺服器堆棧上的解決方案可以縮短上市時間。在無伺服器技術之間明智地選擇可使解決方案具有成本效益。

儘管此選項對初創公司而言不是很有用,因為它們傾向於利用典型的10萬美元雲信用額度,並且在AWS,GCP和Azure之間進行跳轉是一種很普通的生活方式。必須事先弄清這個事實,而必須提出更多與雲無關的技術。

通常,工程師會區分以下成本:開發費用、維修費用、變更成本。

開發費用

雲技術無疑簡化了工程工作。有好幾個區域對它有積極的影響。

第一個是架構和設計決策。無伺服器堆棧提供了豐富的模式和可重用組件集,為解決方案的體系結構提供了堅實而一致的基礎。

只有一個問題可能會減慢設計階段:大數據技術是自然分布的,因此在設計相關解決方案時必須考慮可能的故障和中斷,以確保數據的可用性和一致性。另外,解決方案所需的精力更少,可以擴展。

第二個是集成和端到端測試。無伺服器堆棧允許創建隔離的沙箱,播放,測試,修復問題,從而減少開發回送和時間。

另一個優勢是,雲強加了解決方案部署過程的自動化。不用說,此功能是任何成功團隊的必備屬性。

維修費用

雲提供商聲稱要解決的主要目標之一是減少監視和保持生產環境活動的精力。他們試圖建立幾乎沒有零投入的理想抽象。

但是,實際情況有所不同。關於這個想法,通常維護仍然需要一些努力。下表突出顯示了最突出的種類。

但除此之外,該方案在很大程度上取決於基礎架構和許可成本。設計階段非常重要,因為它可以挑戰特定技術並提前估算其運行時間成本。

變更成本

大數據技術關注客戶的另一個重要方面-變更成本。我們的經驗表明,大數據與任何其他技術之間沒有區別。如果解決方案不是過度設計的,那麼變更的成本就可以與非大數據堆棧完全媲美。大數據帶來了一個好處。大數據解決方案被設計為分離是很自然的。設計正確的解決方案看起來不像是整體解決方案,可以在需要的地方短期內應用局部更改,而影響生產的風險較小。

總而言之,我們確實認為大數據可以負擔得起。它為開發人員提出了新的設計模式和方法,開發人員可以利用它來組裝符合最嚴格的業務要求並同時具有成本效益的任何分析數據平臺。

大數據驅動的解決方案可能是快速成長的初創公司的良好基礎,這些初創公司希望變得靈活,應用快速更改且TTM跑道短。一旦企業需要更大的數據量,大數據驅動的解決方案就可以與企業一起擴展。

大數據技術允許以小規模或大規模實施近實時分析,而經典解決方案卻難以與性能相提並論。

雲提供商已將大數據提升到了新的水平,從而提供了可靠,可擴展和即用的功能。快速交付來開發具有成本效益的ADP從未如此簡單。利用大數據提升您的業務。

相關焦點

  • 企業能否負擔得起大數據解決方案的成本?
    來源:TechWeb人們仍然存在的一個誤解是,只有大企業才能負擔得起採用大數據驅動的解決方案的成本,它只適用於海量數據,而且成本高昂。近年來的幾次革命性發展將會改變這種想法。無伺服器堆棧提供了豐富的模式和可重用組件集,為解決方案的體系結構提供了堅實而一致的基礎。只有一個問題可能會減慢設計階段:大數據技術本質上是分布式的,因此在設計相關的解決方案時必須考慮可能的故障和中斷,以確保數據的可用性和一致性。另外,解決方案需要更少的努力來擴展。第二個是集成和端到端測試。
  • 政務大數據|原力大數據全量人口信息聚合應用解決方案
    全量人口信息聚合應用方案思路概述原力大數據針對上述人口信息現狀,提出全量人口信息聚合應用三步走方案:第1步:建設統一人口資料庫通過分布在不同部門業務系統內的人口基礎信息的網絡數據發布,形成動態構建大數據統一服務平臺1、首頁大屏模塊平臺首頁使用數據大屏的形式,展示省份、區域或地市人口的分布情況,維度包含年齡、性別、常住人口變化趨勢、人口來源、各地市、區域人口流動等信息。
  • 大數據龍頭企業數夢工場在京發布四大解決方案
    會上,國內大數據龍頭企業數夢工場重磅發布了數據中臺2.0、自然人大數據2.0、DTForce安全大腦、多雲多資源管控DTCenter One等多款業界領先的產品和解決方案。數夢工場創立於2015年3月,總部位於杭州雲棲小鎮,在全國三十一個省市設有分支機構,在北京、杭州、南京、成都、廣州、長沙成立技術創新中心,公司80%以上為技術人員。
  • 智慧食堂解決方案,大數據平臺助力優化運營
    科技賦能,生態創新是當今社會大發展的新模式,各行業的格局也隨著社會進步不斷發展壯大。食堂行業也成為其中一員,智慧食堂一時風靡而來,對於食堂管理者來說,食堂運營問題各有所差,智慧食堂的個性化定製方案吸引了每個食堂人的眼球,科技賦能的大數據下的個性化解決方案,哪裡可以實實在在的幫助到食堂人呢?
  • 智慧體育課解決方案
    02:方案概述  藉助雲計算+物聯網+大數據技術,專為體育課定製的一款產品,無需部署,學生在體育課中佩戴校園健康手環,體育教師可實時查看數據,覆蓋課前學情調研、課中過程監測、課後學習指導的全場景教學需求  智慧體育課解決方案  產品定位  專為中小學體育課定製的智慧體育課解決方案,藉助智能穿戴技術、雲計算和大數據分析技術,賦能體育精準教學,解決傳統體育教學「難量化、難記錄、難監督、難分析」的問題,滿足體育教學管理「智能化」、教學過程「數位化、可視化」和教學數據「精準化」分析的教學需求
  • 大數據BI解決方案:如何做醫療行業的數據治理?
    據中研普華專家所撰寫的《2016-2021年中國行業大數據市場發展前景預測與投資戰略規劃分析報告》顯示,總的來說,醫療大數據應用主要體現在臨床操作、研發、新的商業模式、付款/定價、公眾健康五大領域,在這些場景中,大數據的分析和應用都將發揮巨大的作用。
  • 域旅遊實施方案巨有科技大數據可視化智慧旅遊解決方案
    全域旅遊實施方案巨有科技大數據可視化智慧旅遊解決方案智慧旅遊系統:目的地信息化建設,讓旅遊無限可能!通過VR全景旅遊,能夠重現景區內的人文歷史,讓神秘的歷史摘下面紗,給遊客們帶來完全沉浸式體驗,不管是春天還是冬天,遊客們都能突破時空的限制,一次性瀏覽不同季節的景區體驗。
  • 深信服EasyConnect數據防洩密解決方案
    3、異地分支、移動辦公難管控:無論是異地分支,還是在家移動辦公員工,都難以被有效監管,也缺乏有效的防洩密方案。  4、員工滿意度差:傳統防洩密手段,多是通過降低易用性來增加數據安全性,這種方式不僅極大的降低了工作效率,還讓員工感覺缺乏隱私,滿意度差。
  • 藍π螞蟻氣象數據可視化解決方案正式上線
    日前,由華風氣象傳媒集團創新網絡技術有限公司傾力打造的「藍π螞蟻」氣象數據可視化解決方案正式上線。  「『藍π螞蟻』氣象數據可視化解決方案可提供專業、美觀、現代的氣象大數據可視化展示系統,應用科技與創意融合的理念將單調、乏味的專業氣象數據圖形化、可視化並具備交互能力,使數據能夠自我表達,從而幫助用戶看清大數據的本質,快速獲取有價值的信息。」
  • 深信服數據中心安全可視化解決方案
    三、解決方案  銘冠科技提供了深信服下一代防火牆NGAF全面可視的數據中心安全防護解決方案,如下圖所示,在數據中心出口部署深信服下一代防火牆硬體網關,提供對數據中心整體網絡的安全防護;而在數據中心內部的虛擬化業務集群中部署深信服下一代虛擬軟體防火牆
  • 九次方兩大應用平臺入選天津市「大數據應用場景優秀解決方案」
    11月14日,由天津市網際網路信息辦公室、河西區人民政府、天津市大數據管理中心主辦,河西區網際網路信息辦公室、天津市大數據協會承辦的天津市大數據產業峰會暨數字經濟高峰論壇在津舉行。會上發布了100個大數據應用場景優秀解決方案,其中由九次方大數據打造的「農業生產經營主體信用大數據平臺解決方案」和「大數據融合共享平臺解決方案」均名列其中。
  • Xilinx發布新一代Smarter Networks和數據中心解決方案
    (NASDAQ:XLNX) )今天宣布推出新一代更智能(Smarter) 網絡和數據中心解決方案, 致力於填補重要的且日益擴大的傳統ASIC和ASSP市場空白 。為了填補上述技術空白,賽靈思收購併發展了SmartCORE™ IP系列,同時引入大量關鍵應用專家和服務,充分發揮賽靈思All Programmable FPGA、SoC和3D IC的優勢。
  • 順豐推贛蟹行業解決方案+ 「物流+大數據」賦能江西大閘蟹產業
    9月12日,順豐速運贛蟹行業解決方案+推介會在江西南昌召開,政府領導、順豐代表及客戶代表等近300人出席了會議,並在會上就「如何將贛蟹更好的賣出去」話題做了討論。(順豐速運贛蟹行業解決方案+推介會啟動儀式)物流升級 「三四五」策略助贛蟹過時效關和運輸關江西軍山湖、鄱陽湖等湖區水質極佳,產出的大閘蟹具有「大、肥、腥、鮮、甜
  • 海量數據及內容管理解決方案
    【IT168 資訊】友友的內容管理解決方案依託於融合雲計算方法的分布式數據管理技術,通過以友友數流平臺(Bitflow)以及友友網絡虛擬機(NetVM)為基礎的友友雲計算中間件有效粘合網絡上眾多獨立存儲節點來解決海量信息存儲和管理問題,並利用友友企業地圖(Enterprise Map)中資源整合、信息搜索以及數據挖掘的優越性能
  • Celemics與BlueBee合作開發全球基因組數據解決方案
    為了充當集成基因組數據分析的端到端工作流,Celemics與工業級且高度可配置的數據平臺提供商BlueBee合作,開發針對其檢測和最終用戶體驗量身定製的生物信息學解決方案。兩家行業領導者的共同努力產生了Celemics網絡解決方案,為靶標富集NGS分析用戶提供了更高的可及性。Celemics解決方案將作為推動精準醫療研究的跳板,為Celemics提供可擴展、高效、可升級的數據策略,為增長做好準備。
  • 科達發布新一代大數據指揮中心解決方案
    指揮中心是核心信息匯集、轉換、傳輸的重要場所,隨著大數據、AI、物聯網技術的發展,指揮中心模式、職能都發生了巨大變化。面對多樣化的指揮中心應用需求,科達發布新一代大數據指揮中心解決方案,用「三個專業」打造出可為各行各業服務的大數據指揮中心。
  • 阿里雲交通數據中臺解決方案 打造「數位化生產力」
    總結而言,主要體現在4個方面:(1)交通業務系統相互獨立,數據孤島現象嚴重,業務處理容量大但是無統一標準,採集的欄位混亂,難以理解和應用?(2)先前已經搭建了交通大數據平臺,但是缺乏行業知識庫,計算分析能力弱,數據只是簡單地BI展現,不能賦能業務創新?
  • 百度地圖慧眼發布智能選址解決方案 大數據幫你「拉人氣」
    以往,憑藉經驗走訪調研的選址方式不僅耗費大、時間長,其所能獲得的參考信息更是有限。這個時候,依靠多維大數據做指導就成了極具價值的一件事。而面對這一需求,浦發銀行把目光投向了百度地圖。當下,基於大數據的「智能選址」方式被越來越多的企業使用,浦發銀行總行迅速與百度地圖慧眼達成合作,在使用百度地圖慧眼「智能選址大數據平臺」輔助其選址後給予了高度評價。
  • TransferJet技術的內容共享以及大數據分享的解決方案
    TransferJet技術的內容共享以及大數據分享的解決方案 EEChina 發表於 2020-02-04 10:06:00 前言 當今消費者一直在做兩件事
  • Marvell推出ARMADA-385高速數據通路解決方案
    軟體的全球領導廠商美滿電子科技(Marvell,Nasdaq:MRVL)今日宣布,推出業界領先的高性能、高能效高速數據通路(Accelerated Data Path,簡稱ADP)解決方案,該解決方案基於ARMADA?-385單晶片系統(SoC)。