多維數據分析的概念非常容易引起疑惑,它常常讓人聯想到超越三維的更高維空間中的一些幾何概念。其實這是完全沒有必要的,多維數據分析概念本質上是極為簡單和容易理解的,今天小編就用深入淺出的方式介紹這幾個概念。

概念一:Cube(又稱多維數據集或數據立方體)
舉個例子,您在超市結帳後會得到一個小票,上面有時間、店鋪、商品類別、商品單價、購買數量、消費金額等信息,如果把某個地區全部消費者的小票收集到一起,那麼這些購物小票中的數據就形成了一個關於消費者超市購物行為的數據集,這就是一個Cube。
Cube就是面向同一業務主題的數據集合,同理,一個港口的進出口數據集合、一個貿易公司的渠道銷售數據集合、近幾年各省份戶籍變動數據都可以視為一個個Cube。
概念二:Dimension(又稱維度)
超市小票的Cube裡隱含著很多信息,如:
哪些商品呈現出季節性消費規律?不同區域店鋪的顧客購買力如何?哪幾個店鋪的顧客平均購買力最強?不同年齡段消費者最愛購買的商品有沒有差別?哪些商品由於不受年輕消費者歡迎可能會被漸漸淘汰?由上可見,這個超市小票Cube可以由商品、時間、區域、店鋪、顧客等業務角度來描述,這些業務角度就是維度。
同理,貿易公司的渠道銷售Cube可以由時間、渠道、產品、分公司、客戶等業務角度所描述,那麼它所關聯的維度就是時間、渠道、產品、分公司、客戶。
我們還可以看到,小票Cube和渠道銷售Cube都關聯了時間這個維度,那麼這兩個Cube是可以聯合起來進行跨行業、跨領域數據分析的。
概念三:Measure(又稱度量)
在Cube中,除了維度所代表的業務角度信息外,還有度量這個能夠被精確量化的數值信息。
小票Cube中的商品購買數量、商品單價、消費總額就是度量。
今天講解了Cube、Dimension、Measure這三個多維數據分析中的核心概念,其他概念將會在後續文章中講解。
關注小編可以獲得更多數據分析知識分享。