2013-05-21 48 views
-1

在數據倉庫上工作,我正在尋找關於具有多個維度與具有屬性的大維度的建議。數據倉庫設計,多維或具有屬性的一維?

我們目前有DimEntity,DimStation,DimZone,DimGroup,DimCompany和具有包含從每個維度的鍵多個事實數據表。這是最好的方式,還是隻有一個維度,DimEntity,並且包括工作站,區域,組和公司作爲實體的屬性會更好?

我們已經走了不同的尺寸的途徑與我們的ETL所以它不喜歡的工作來填充和打造出來的星型模式是一個問題。性能和可維護性非常重要。這些尺寸不會經常變化,因此尋找處理這些尺寸的最佳方法的指導。

事實表有超過1億條記錄。實體維度大約有1000條記錄,其他列出的每條記錄都不到200條。

+0

不幸的是回答這個問題,不知道很多細節對你的實體是什麼沒有真正的方法,什麼他們的屬性是什麼,事實表表示,用戶希望如何查看數據,有什麼能力你的報告工具有等。也許如果你能讓你的問題更具體,你可能會得到更好的迴應。 – Pondlife

+0

感謝您的投票! – maguy

+0

我想要投票的人給出一個理由。對於那些說增加更多信息的人來說,如何在下一次投票前給這個人時間進行更新。有些人確實有生命,並且不會全天候地粘在電腦上。獲得生命。 – maguy

回答

0

不知道你的星型模式表定義,數據基數等,很難給出是或否。這將是一個平衡的行爲。

對於讀取性能,事實表應該是儘可能地瘦和尺寸應儘量短(低行數)成爲可能。合併維度通常意味着在維度記錄數量增加時事實數據表變得更瘦。

如果你可以整合無需添加行合併維度的顯著數量的尺寸,它可能是值得研究的。這可能是因爲您可以將低基數維度合併爲垃圾維度並實現良好平衡。具有高基數屬性的維度不應合併。

Here's在三維造型的好金博爾大學的文章。具體看他在哪裏處理蜈蚣事實表以及他如何推薦使用垃圾尺寸。