2014-09-02 45 views
2

如果您有一個關係數據庫並且您想開始製作報告,您可以執行以下操作(如果這不正確,請告知我)。星形圖中的維和事實表是如何相關的?

  1. 瀏覽關係數據庫並列出要包含在報告中的所有列。
  2. 將相關的列組合在一起,然後將這些列(正常化)拆分爲附加表。這些是尺寸。
  3. 維然後有一個主鍵(可能是兩行的組合),事實表有一個外鍵來引用每個維,加上你首先沒有分離出來的字段,比如銷售值。

的問題: 我最初看到這反過來又在維引用的數據尺寸爲引用的數據從外部源數據集市,和事實表..這是不正確的,不是嗎?這是另一種方式...

或者一般來說,如果你要規範化數據庫,你總是會替換你用外鍵取出表的列,然後將主鍵添加到新表中?

回答

3

事實表代表您要分析的進程或事件。

第1步:什麼是你想分析的過程或事件?

事實表中的列代表所有與分析相關的變量。

步驟2:哪些變量與分析有關?

是否將「分隔」列轉換爲維度表與您的理解無關。這是一個優化,以儘量減少事實表佔用的空間。

如果你想措施和尺寸來區分,問

步驟3:什麼是我的事實表的(真)的數值?這些是你的措施。

真實數值的示例是美元數量,如「銷售訂單行項目擴展價格」。你可以總結一下或取其平均值。

一個不是真正的數字值的例子是客戶ID 12345.它是一個數字,但代表不是一個數字(客戶)的東西。客戶id的總和沒有意義,平均值也沒有意義。挖?

關於你的問題:

  1. 事實表不需要外鍵維度表。 (提示:請參閱可熱插拔尺寸)

  2. 「尺寸作爲引用外部數據源的數據集市」。嗯......也許,但現在不用擔心數據集市。維度只是您的事實表中的一列(這不是衡量標準)。維度表只是相關維度的集合。

  3. 剛開始使用Excel。找出分析中需要的列。把它們放在Excel中。這是你的事實表。如果你期望你的事實表變得很大(百萬分之一MB),那麼做一個標準化水平:

找出你的措施。將它們留在事實表中。

找出你的尺寸。將它們組合在一起(將顧客信息合併到一個組中,將信息存儲到另一組中

把它們放在自己的表格中。給他們無意義的代理鍵。把這些鍵放在事實表中。

+0

非常有用。謝謝! – ABMagil 2014-09-06 20:39:45