2009-11-19 82 views
1

你會如何在一個數據倉庫模型此:設計事實表(或多個)


  1. 有市這是地理區域,存在於地理層次,這樣的省(即州,如明尼蘇達州),地區(如MidWest)。

  2. 通過計算「完成住房積壓百分比」,「預算花費百分比」,「分配給基礎設施的預算百分比」,「債務人覆蓋面積」等績效指標,對這些城市進行績效評估

  3. 這些性能指標大約有100個。

  4. 這些指標被分組爲「性能基團」,其本身分成

  5. 計算施加到性能指標「關鍵性能區域」(計算變化基於某些因素,如市類型,大小,地區等)來產生「績效分數」。

  6. 然後將權重應用於分數以創建「最終加權分數」。 (即當彙總到「關鍵績效領域」時,某些指標的權重比其他指標更高)

  7. 會有一個時間維度(每年完成一次評估),但現在只是一個數據集。


注:用戶需要能夠跨指標任意組合,以方便地查詢數據。即有人可能希望看到:(i)(iv)「債務人承保範圍」對(iii)「(%)預算支出」在(v)省級的「債務人日」上的表現水平。我試圖通過使「IndicatorType」作爲一個維度,然後在該表中的[指標/性能組/性能區域]層次結構 - 但我不能解決如何輕鬆地獲得多個指標相同的行,因爲它需要事實表別名(?)。所以我想把所有100個項目都放在一個(非常寬的)事實表中 - 但是然後我會失去指標上的[組/區域]指數...?

任何想法?

感謝

回答

1

這是一個非常棘手的問題,但我花時間去通過您的一些點,並用這個模型想出了(應該是一個良好的開端你)。

尺寸:

DIM_MUNICIPALITIES:

字段= {MUNICIPAL_KEY,國家,地區,STATE_PROV,CITY ?, SIZE_SCORE}

層次= {COUNTRY < - REGION < - STATE_PROV < - - 城市?}

DIM_INDICATORS:

字段= {INDICATOR_KEY,PERFORMANCE_AREA,PERFORMANCE_GROUP,PERFORMANCE_INDICATOR}

層次= {PERFORMANCE_AREA < - PERFORMANCE_GROUP < - PERFORMANCE_INDICATOR}

DIM_DATE:

字段= {DATE_KEY,CALENDAR_DATE(SQL datetime),YEAR,MONTH,WEEK,DAY ...}

層次= {YEAR < - 月< - WEEK < - DAY < - DATE_KEY}

然後在你的事實表(說MYFACT),你會做類似如下:

FACT_MYFACT:

字段= {MYFACT_KEY,DATE_KEY,MUNICIPAL_KEY,INDICATOR_KEY,PERFORMANCE_SCORE,預算,等等...}

事實表可以有所有這些措施列(預算等),或者你可以在計算做他們成員,我這一切都取決於你想如何使訪問。

希望這能幫助你獲得一個好的開始!

+0

感謝您的留言。然而,我很困惑:如果指標級別的維度存在,那麼事實表中就不需要多個度量列,因爲它們是相同的。 真正關於具有100個寬的列事實表的設計優勢,與單個數值度量列和「度量類型」維度(在這種情況下,指標維度)相比。 與寬表,我可以很容易地拉出多個列並列,但我失去了PI/PG/KPA層次。 與指標維度,我失去了報告的靈活性。 還是有另一種方式? – Sean 2009-11-20 04:49:28

+0

更多: 我會覺得3事實表: - 性能指示器 - 業績得分 - 最終加權評分 (計算是在負載進行,即施加的計分規則&加權然後,NOT在d/w) 所以:如果我在「績效指標」事實表中有100列,我有100個指標。現在很容易報告15種不同的措施。 如果度量值在DIM中,那麼我只有1個度量對象,並且需要過濾器來獲取正確的一個,並使用別名來獲取多個?當從excel報告時,這是不可能的? 所以去寬和失去PI/PG/KPA heirarchy? – Sean 2009-11-20 04:56:11

+0

我並不是說要把這些措施放在DIM中,我不確定你的大小分數是什麼意思(如果那是你所指的)。我一定誤解了你指示的含義。在指標維度中,我將存儲描述和表示某個指標的字段,然後存儲FACT中該值的實際度量。 – ajdams 2009-11-20 14:07:08

3

希望這是不言自明的。

regionperf_model_01

+0

這看起來是正確的:通過將IndicatorKey放在事實表中,並且只有一個通用的IndicatorValue,您已經獲得了一些鍵值對方法。這對於報告並不是很有用,但它是處理指標隨時間變化的必然性的實用方法。 根據這些數據,您可以將這些數據發佈到一個扁平化的表格中,並使用不同的度量作爲專用列。這個輔助表格更容易改變 - 也許你不需要每個單獨的度量 - 也許只是更靜態的表演區域和組號碼。 – KenFar 2009-12-07 16:54:03