2010-03-18 72 views
1

我正在尋找想法來填充數據集市中的事實表。可以說我有以下尺寸關於在數據集市中填充事實表的想法

  1. 醫師
  2. 患者
  3. 日期
  4. geo_location
  5. patient_demography
  6. 測試

我用了兩個ETL工具來填充維度表 - Pentaho和Oracle Warehouse Builder。日期,患者人口統計和地理位置不會從運營商店獲取數據。所有維度表都有自己的新代理鍵。

我現在想用患者訪問的細節填充事實表。當患者在特定的日期訪問醫生時,他命令測試。這是事實表中的信息。還有其他一些措施,我簡單地省略了。

我可以使用源系統的事實表中的所有必需列創建單個聯接。但是,我需要存儲患者,醫師,測試等維度表中的密鑰。實現此目的的最佳方法是什麼?

ETL工具可以幫助嗎?

謝謝 克里希納

回答

5

每個維度表應該有一個唯一標識對象(人,日期,地點),一個錶行描述的businessKey。在加載事實表的過程中,您必須根據BusinessKey從維度表中查找PrimaryKey。您可以選擇直接查找維度表,或者在載入事實表之前爲每個維度創建一個鍵查找表。

Pentaho Kettle具有用於此目的的「數據庫值查找」(轉換步驟)。您也可以查看Kimball的數據倉庫ETL工具包的「交付事實表」部分。