2017-07-26 192 views
0

我有一個快速問題管理OLAP多維數據集或數據多維數據集。 當我看到image時,我並不真正瞭解「多維數據集」中表示的數據的「位置」。我想這個是表面上的,對吧?否則,旋轉立方體將不會顯示完全不同的值。OLAP多維數據集 - 數據多維數據集

所以,我的問題是,什麼數據存儲「在立方體?」

豈不是某事像:

f(x,y,z) -> value (1) 

和值是細胞內?但在這裏我只看到

f(x,y) -> surfacevalue (2a) 

f(x,z) -> surface value (2b) 

f(y,z) -> surface value (2c) 

那麼,實際存儲在多維數據集中的是什麼?所有映射(1 - 2c)。

回答

0

不幸的是,有很多連接到OLAP數據庫的混淆術語。立方體是最糟糕的犯罪者之一,因爲它適用於所有數據庫,無論維數如何。儘管您可以合理地假設立方體是指三維物體,但這是事實。

在這種情況下,立方體被用作比喻,不應該從字面上考慮。它被使用是因爲它很難說明/想象超過3個維度的對象。

1維的數據集可以這樣表示:

 10.00 15.00 16.00 
-------------------------------- 
Year 2014 2015 2017 

在這裏我們可以看到一個措施暗算一年。

2的尺寸可以說明,像這樣:

Region 1 | 5.00 2.00 4.00 
     2 | 5.00 5.50 5.00 
     3 | 0.00 7.50 5.00 
----------|-------------------------- 
Year  | 2014 2015 2017 

現在我們可以看到同樣的措施暗算年和地區。

3維可以被認爲是一個立方體。 Wikipedia picture you linked to就是一個很好的例子。

現在我們得到更高維度的例子很難/不可能在2D屏幕上生成。在實踐中,4/5/6/etc維度報告通常以二維報告的形式呈現,應用一系列過濾器,限制返回的記錄和總計。

實施例:

Department: Marketing 
Customer Age: 18 - 24 

Region 1 | 1.15 1.50 0.00 
     2 | 2.75 4.01 1.25 
     3 | 0.00 0.00 1.14 
----------|-------------------------- 
Year  | 2014 2015 2017 

這表明我們的與2個額外的過濾器的措施。現在是第4個報告。

多維數據集概念試圖表達有數據層,您可以瀏覽。莫納什大學的Rob Meredith博士在他的podcasts之一中就這個問題進行了討論。我想這大概是通過Semester 1, 2009 - Episode 3Semester 1, 2009 - Episode 4的一半。

+0

當您只能在數據庫中創建相同的OLAP結構而不是使用OLAP軟件來完成時,會非常困惑。從本質上講,創建一個在同一個星型模式中處理的OLAP數據集市,而不是使用像SQL Server Analysis Services這樣的軟件來構建,處理,存儲和提供對所述多維數據集進行報告的訪問。但是,這樣做有利有弊。例如,SSAS旨在對數據進行預處理,並使所述報告閃電般快速。 – Fastidious