我有一個具有性別屬性的人員衛星。在源系統中,此屬性的值可以是:F,M,FEMALE或MALE。以下兩種方法中的哪一種適用於Data Vault建模?在性別如何在使用Data Vault原則建模的數據庫中使用交叉引用表?
存儲數據,因爲它來自來源和業務庫或數據集市規範值,以女性和男性只有
創建交叉引用表到F繪製出雌, M加載到MALE,同時加載Person Satellite,使用交叉引用表將F轉換爲FEMALE,將M轉換爲MALE。
我正在使用支持列壓縮的Amazon Redshift。
我有一個具有性別屬性的人員衛星。在源系統中,此屬性的值可以是:F,M,FEMALE或MALE。以下兩種方法中的哪一種適用於Data Vault建模?在性別如何在使用Data Vault原則建模的數據庫中使用交叉引用表?
存儲數據,因爲它來自來源和業務庫或數據集市規範值,以女性和男性只有
創建交叉引用表到F繪製出雌, M加載到MALE,同時加載Person Satellite,使用交叉引用表將F轉換爲FEMALE,將M轉換爲MALE。
我正在使用支持列壓縮的Amazon Redshift。
我通過電子郵件發送了數據保險庫建模方法創建者Daniel Linstedt,問他同樣的問題。他的回答如下:
「我通常將它存儲,然後在通往商業DV的路上進行翻譯。這樣,如果業務發生了變化,我們可以重寫翻譯規則而不影響歷史。但更重要的是,我看到源系統提供的值超出了可接受的範圍,不要試圖翻譯原始DV,這樣做會破壞可審計性。「
當您有非常複雜的業務邏輯隨時間變化而變化時,數據倉庫概念非常有用,但F /女性和男性/男性映射是非常簡單和穩定的邏輯。交叉引用在這裏只是過分複雜。我只是將這些值標準化爲F/M,並在此處使用char(1)列而不進行壓縮。
謝謝@AlexYes。我也是將這些價值標準化的想法。不過,我更感興趣的是瞭解這樣做的缺點,因爲Data Vault原則明確指出,在原始保險庫中不應該進行任何轉換 –
我不能真正回答你的問題,但我說紅移和DV聽起來像一個痛苦的組合。根據我的經驗,隨着連接數量的增加,Redshift性能嚴重下降。 –
謝謝,@Joe哈里斯。我瞭解多個連接。我將在商業倉庫中安排一些PIT和橋樑來幫助解決這個問題,併爲最終用戶創建一些特定的信息集市,以提供更爲統一的數據視圖 –