有沒有人提供設計ROLAP多維數據集時需要考慮的事項的列表,而不是MOLAP(我在Pentaho中做了這個,但我想這些原則並不適用 - 與其他實現類似)。例如,我在想的東西,如:多維數據集設計 - ROLAP注意事項與MOLAP
應該額外轉型工作在ETL階段進行查詢多維數據集時,以減少計算工作?
我的所有維度表應該與我的多維數據集位於同一個數據庫中嗎?
有沒有人提供設計ROLAP多維數據集時需要考慮的事項的列表,而不是MOLAP(我在Pentaho中做了這個,但我想這些原則並不適用 - 與其他實現類似)。例如,我在想的東西,如:多維數據集設計 - ROLAP注意事項與MOLAP
應該額外轉型工作在ETL階段進行查詢多維數據集時,以減少計算工作?
我的所有維度表應該與我的多維數據集位於同一個數據庫中嗎?
我是印度尼西亞的Pentaho實施者。首先,當然你應該嘗試通過所涉及的代理鍵來彙總所有的度量組。
而在Mondrian中,您可以使用其他聚合表「緩存」一些計算。你可以在Pentaho Aggregate Designer中完成。但在此之後,您將需要在數據倉庫/ ETL階段進行額外的工作。
問候,
FERIS
感謝FERIS的鏈接和投入,但最終我去了這本書:
我一個很好看的Mondrian網站+文檔,但這本書似乎更全面。
首先 - 設計是相似的,但它們是由不同的性能驅動的&可伸縮性策略。
其次 - etl過程幾乎相同。除了 - 由於關係數據庫中的可伸縮性特點,您通常會在rolap多維數據集中看到比molap多維數據集更多的數據。你經常會看到一個非rolap數據庫(倉庫,甚至是事務數據庫)的內的rolap立方體,它不僅僅支持rolap。
最後,如果您有大量數據量,通常會生成聚合表。這種聚合可以通過很多不同的方式完成,但我認爲它通常不由ETL過程驅動,除非您缺乏管理單獨的異步過程的能力或者使數據卷不能運行期間摘要作業。
+1感謝您的信息。我的ETL中的預聚合證明是必須的... – davek 2009-12-03 10:07:25
在這種情況下 - 更多信息: 爲此目的創建通用聚合器類非常容易。如果每小時運行ETL,則可以使用ETL在小時級別生成聚合。如果您將etl生成的每小時聚合進入暫存表並將結果合併到主表中,它將提供達到當前小時的聚合。然後,如果有必要,您還可以擁有一個單獨的流程,以便將數據進一步滾動到日常級別。 – KenFar 2009-12-03 14:12:40