什麼是大數據?
分析是一種使用哪些數據模式可以被理解和性能量化來做出決策的方法。為了實現這種編程,使用了統計和研究。最終目標是幫助做出更多基於數據而不是直覺的決策。這是因為基於證據或數據的決策被認為更可靠。
大數據與傳統上稱為分析的內容分開的主要區別是什麼?差異在於現在可以輕鬆獲取的數據量,數據與各種數據點一起整理的速率。
1.數據量 - 每40個月創建的數據量翻倍。目前的數據創建速率在每天2.5艾字節的範圍內。換句話說,二十年前網際網路上可用的數據量在今天的任何特定時間都在網際網路上傳播。這些數據發布於2013年哈佛商業評論出版物。
2.數據速度 - 收集的數據量不如今天收集數據的速度重要。只要公司能夠實時處理大量數據,公司就具有競爭力。其中一個最大的例子是麻省理工學院媒體實驗室使用基於位置的數據收集來查找黑色星期五在梅西停車場的購物者數量。唯一的目的是甚至在銷售結束之前估算銷售額。這種數據讓分析師佔上風。
3.數據多樣性 - 據我們所知,大數據來自各種來源,但其中最突出的數據包括來自手機的GPS信號,以及社交網絡平臺上發布的消息,圖像和更新。大多數這些大數據來源都是新的。 Facebook和Twitter等社交網絡分別於2004年和2006年開始,而iPhone僅在2007年發布。因此,今天新開發的資料庫非常不適合存儲大數據。然而,諸如帶寬,存儲器,處理和存儲的計算元件逐漸變得更便宜。
什麼是雲計算?
雲計算是一種利用大規模低成本運算單元通過IP網絡相連而組成的運算系統,以提供各種運算服務。
雲計算將為處理大型複雜並行數據集的即將到來的複雜性提供答案。這是因為雲計算具有處理需要大量計算能力的大數據所需的靈活性和靈活性。雲計算也是處理結構化和非結構化數據的最佳平臺。
雲計算發源於搜尋引擎平臺,網際網路企業在創業階段出於追求低成本高效能的考慮開發出一種計算技術,目前已成為提供各種網際網路服務的重要平臺。
大數據Hadoop與雲計算openStack一起不僅僅是當今時代的要求,而是一種必需品。