2015-11-10 29 views
0

這是商業智能,ETL數據集成和數據倉庫環境中的術語問題。什麼是主數據?

我總是瞭解到,數據倉庫具有交易「事實表」,它引用「維表」。但是,其他一些人正在使用術語「主數據」。這在ETL和數據倉庫的上下文中有不同的含義,它是否等同於「維度表」?

+0

我將使用術語問的人:「你說的‘主數據’意味着」 –

+0

我認爲他們濫用術語「主數據」來描述所有的維表。我只是想堅持下去。通用語言的關鍵在於,當其他ETL專家或開發人員加入團隊時,如果傳統術語被濫用,將會產生混淆。 – user45867

回答

0

主數據是跨企業共享並由多個應用程序和系統存儲和使用的關鍵業務數據。主數據的典型候選者是客戶,位置和產品。

使用主數據的主要驅動因素是整合和重用的能力。以前面的例子來說,客戶數據很可能在多個應用程序之間共享。在適當的主數據管理下,這些數據將在這些應用程序中保持一致,並減少多個表的冗餘。

數據倉庫中主數據與維度表之間的主要區別在於各自的目的。維度表提供有關事實的信息,而主數據則爲整個業務提供信息。

請記住,許多維度表也可能是主數據的候選者。瞭解更多關於主數據管理(MDM)位置:https://msdn.microsoft.com/en-us/library/bb190163.aspx

+0

我想我現在開始明白了一點。只是想指出,儘管我最初的問題已經被大量編輯,甚至可以改變其含義。另外,在發佈之前,我已經閱讀了維基百科的主數據條目,但是呃。無論如何,也許一個具體的例子是爲了。以一個典型的規範化數據庫。你有「電話線」ID的電話。這些ID鏈接到一個表格 - 顯示電話號碼,以及編號,名稱,創建日期等。對我來說,這是一個DIMENSIONAL表。它絕不是「主數據」。 – user45867

+0

如果我要正確理解,術語MASTER DATA不是關於表格的結構,因爲它涉及到規範化的數據庫。更多的是關於可重用性,通用性,「單一事實點」和「一致的維度」,而且大多數時候恰好是一個維度表。客戶信息就是一個很好的例子。您可能有多個應用程序鏈接到客戶端ID,但拼寫名稱不同,地址等等,因此使用MASTER表來符合這些維度。我認爲我面臨的問題是同事們將每個維度表都描述爲主,這是一個概念性錯誤。 – user45867

+0

@ user45867完全不是所有的維度表都是主數據。然而,我在答案中提供的定義不是來自維基百科,而是我寫的,我認爲會有所幫助的。我很抱歉在編輯中丟失了任何信息。 –