1

我目前正在研究一個大致利用維度建模方法的倉庫模式。它是否有意義的維度也是一個度量標準

一般的想法是在最小粒度級別有一個事實表,充滿了感興趣的事件度量。隨着這一點,當然將是一個維度表(一)記錄事件的維度將保持。這些表格由dimension_id並列。

我的問題是:是否有可能,或者說是否有意義,某事既是維度又是度量。

一個例子可能是產品在某些搜索結果中的位置。給定產品的位置可以被視爲度量標準;用戶可能希望針對某個產品運行以下查詢:

上週顯示尺寸爲x = y的產品的平均排名是多少?

與此同時,位置本身可能會被認爲是一個尺寸:

告訴我的與位置= 2的所有產品上個月

的點擊率有什麼在數據倉庫中處理類似問題的正確方法(如果這有所幫助,我們正在研究列式解決方案)。

+0

你的意思是「措施」? –

回答

0

在我看來,在這兩種情況下,你只是運行在衡量一個查詢的事實

產品位置= 2上個月

有關方法的思考產生這種情況,可以通過即時生成事實表中正確的產品列表,然後將這些外部事實查詢限制在這些產品中來派生。

這很好,如果你有一個有能力的分析人員運行自定義SQL,但對於非技術分析人員來說,在我曾經使用過的任何報告工具中構建這個問題要困難得多。

OR

你可以「硬化」你作爲一個屬性位置爲漸變維度。但對於快速變化的數據,這通常不是一種選擇......隨着維度變化如此之快,這是不切實際的。

如果您可以將您所需的分析週期縮減到一個月,那麼將月度評級(以及許多其他屬性,包括滾動週期類型屬性)實施爲緩慢變化的維度可能是切實可行的,這意味着您可能會每年至少有12個產品維度成員,但是您將每個可協調的實際KPI分解爲維度中的列,這通常非常有幫助。

但我猜這對你來說並不新鮮。

+0

我想我的問題更多 - 你是否複製了一些信息(位置),將它們都存儲在事實表中作爲度量標準,將維度表存儲爲屬性,或者是否調整報告系統以允許聚合查詢數字尺寸。希望更有意義。 – Edwardr

+0

我看到它的方式,批量加載的三維倉庫爲您提供了方便和快速的各種信息複製的奢侈品。 –

相關問題