2010-10-12 86 views
3

我正在爲郵件/電子郵件/短信聯繫信息和歷史記錄構建SQL Server DataMart的計劃階段。每條數據都位於不同的外部系統中。因此,電子郵件地址沒有帳號,短信電話號碼沒有電子郵件地址等。換句話說,沒有共享主鍵。有些數據有重疊,但除了重複出現時保留最完整的版本,我可以做的不多。從多個外部系統構建DataMart的最佳方式?

用這些數據構建DataMart是否有最佳做法?爲每個外部密鑰創建一個具有列的密鑰表是否可以接受?然後,可以分配唯一的主ID以將其綁定到其他DataMart表。

尋找關於我可能還沒有想到的方法的想法/建議。

謝謝。

回答

2

電子郵件地址或電話號碼本身聽起來像是一個合適的業務密鑰。通常使用「分段」數據庫從多個來源加載數據,然後分配代理鍵並執行其他轉換。

您是否熟悉數據倉庫方法和設計模式?如果您沒有以前的知識或經驗,請考慮聘請一些幫助。商業智能/數據倉庫項目的失敗率非常高,錯誤可能很昂貴。

+0

啊,代孕鑰匙可能是我所追求的。謝謝。我回顧了星型模式,ETL過程,多維數據集等。我當然非常感謝這些建議。由於項目在初期的測試環境規模較小,我認爲現在聘請外部幫助是不值得的。我們已經有現場工作人員,我們可能會通過這一概念完成一次。我們現在正處於計劃階段。 – MattB 2010-10-14 15:36:43

0

好吧,沒有其他信息將不同的零件捆綁在一起,您的數據集市將非常簡陋。您可以獲取各種類型的數據(短信,電子郵件,郵件),各種類型的指標(「本週/月/季度/年,我們平均每天發送42.5短信,每月發送8000封郵件!w00t !「)。只有電話號碼和電子郵件地址,您的「其他數據集」可能必須是電話公司名稱或互聯網域名。我想你可以將它鏈接到某種地理信息(互聯網提供商位置?),或者可能是公司的財務信息。如果你還不知道你想要走哪個方向,那就模糊一些。老實說,這聽起來像是一個高層人士對於「數據智能」流行詞的一個下跪反應,再加上聽到有關通信指標的重要性的事情,所以他們發送了下來的訂單鏈「得到我們可以使用一些數據集來運行我們所有電子郵件的統計信息!「

您需要弄清楚您或您的僱主期望從這個項目中獲得什麼,然後然後會計算出您當前收集的數據是否可以讓您跟蹤該信息。現在聽起來好像你在倒退(「我有這些數據,有什麼好處?」)。完全有可能你目前沒有你需要的數據,這意味着你需要購買它(誰知道你是否可以)或者開始收集數據,在這種情況下,你不會有漂亮的圖表和趨勢 - 爲上層管理線看一段時間...落下右符合警告dportas給你在他的第二個段落;)

+0

我們的目標是讓聯繫信息,聯繫歷史記錄和行爲更容易在中央位置訪問,而不是使用混雜在一起的Excel電子表格與多個系統的數據一起使用。我們目前無法輕鬆跟蹤聯繫歷史記錄。因此,我們希望將這些數據集中在一個更容易被所有人訪問的中心環境中。問題在於數據分散且不易訪問。這就是我們希望改變的。它規模較小,最初只能由3人使用。 – MattB 2010-10-14 15:27:03

+0

儘可能簡化您的數據收集。傳入的電子郵件應該位於某個電子郵件服務器上,因此您應該能夠從中取出信息。電話可能記錄在PBX系統中,如果是數字系統,則應該能夠從中獲取信息。短信...不知道你如何記錄這些信息,除非你有一個系統坐在兩個人之間發短信。如果你這樣做,它應該有信息,你可以撤出。所有這三種情況都需要有人知道如何進入每個系統的數據,並找出如何將它送到數據集市。 – 2010-10-14 20:52:11

+0

每個系統都可能存儲大量的信息歷史記錄,或者只有一個月的價值,除非您知道系統,否則無法知道。所以假設它沒有存儲一個永不停息的日誌,你必須找出一個時間表來定期從每個系統中獲取數據。然後,您必須爲提取的數據進行適當的數據集市設計,以便生成您要查找的指標。順便說一句如果你現在不記錄聯繫歷史記錄,那麼你正在討論在你的用戶面前推出一個新的應用程序,訣竅是讓他們正確地使用它。 「惡魔在細節中」 – 2010-10-14 21:02:01

相關問題