star-schema

    1熱度

    2回答

    我們嘗試使用Azure上的數據庫,全文搜索,得到了使用CONTAINS搜索性能問題。 我們的數據有星型模式,事實表已經啓用聚集列存儲索引和大約40萬行。下面是我們如何使用包含維和活動等不同的查詢事實表的聚合:使用 查詢1 EXISTS: SELECT f.[FK_DimCompanyCodeId], SUM(f.NetValueInUSD) FROM [SPENDBY].[FactInvoice

    0熱度

    1回答

    我正在構建一個SSIS項目以創建一個ETL來加載使用星型模式模型的數據倉庫。 我有3個維度: - Customer (Customer_ID, Customer_Name, Email) - Employees (Employee_ID, Employee_Name, Salary) - Product (Product_ID, Product_Category) 我的事實表非常simpl

    0熱度

    2回答

    我是數據倉庫的新成員。我正在設計模型改變星型模式。 我有一個2表:合同表&抱怨表。一份合同在投訴表中可以有一個或多個價值。您可以在下面看到2張照片。 在facttable中,1合約只有一行。抱怨表可以爲每個contract_id有一個或多個值。我已經嘗試過橋牌桌了,但還不夠好。 感謝所有 http://prntscr.com/fgdnpb(Conplain表) http://prntscr.com

    3熱度

    3回答

    我試圖設計一個數據倉庫,用於從財務系統,項目調度系統和各種科學系統中獲取常用數據。即許多不同的數據集市。 我已經在數據倉庫和流行的方法,如星型模式和金博爾方法等,但一個問題,我無法找到答案,閱讀起來很: 爲什麼它更好地設計自己的數據倉庫數據集市作爲星型模式而不是單一的平臺? 當然,在事實和屬性/維度之間沒有聯接比有大量小聯接到所有維度表更快,更簡單?磁盤空間不是問題,如果有必要,我們會在數據庫中放

    0熱度

    2回答

    我正在設計一個星型方案db,其中事實是用戶登錄。 我的尺寸是時間(一天中的小時)和位置(基於IP)。 我的系統中有大約30萬用戶。這個規模增長5k /年。 用戶的詳細信息應該是事實表的一部分還是維度表的一部分?

    0熱度

    1回答

    我使用Pentaho勺開發一個ETL,我需要做一系列的查找採取提取的非規格化數據和檢索維的PKs。 其中一個維度的記錄的維京的開始和結束日期。所以,我需要使用Extract的引用日期來查找Dimension的起始日期和結束日期。 問題是,勺子似乎只提供了從維度到源的比較。這意味着Field 1和Field 2僅適用於源數據,不適用於查找表。 有沒有辦法反轉它?

    1熱度

    2回答

    我有一個系統,它具有4個數據庫工作: 帳戶(存儲銀行賬戶,交易等) 客戶端(客戶端的相關信息) 信用(從第三方系統變得率) 質量(而且內部計算) 我想創建4個事實表,一個事實表對於每個數據庫......例如,我將擁有一個以ClientAccount,Transaction,Provider作爲其維度表的Account Fact表。其他數據庫我將有3個類似的事實表。 我的問題是:在數據庫中包含每個相

    1熱度

    2回答

    什麼提供更高的性能? 編寫使用T-SQL,連接表,然後將結果插入到另一個表 使用Pentaho的勺子的表插入,然後利用數據庫查找在同一時間以「加盟」每個表的查詢,然後將結果到另一個表 的目標是採取非規範化表,通過他們的文字與5個維表加入吧,和檢索尺寸的PK,然後將結果插入到一個事實表。

    0熱度

    1回答

    我是星型模式的新手,對於要包含哪些變量感到困惑。假設我有一些電影的數據框,列包括導演,演員,評級,評論,流派等信息。如果我想製作一個星型模式,我是否應該嘗試包括所有列?有人可以向我解釋這個嗎?謝謝。

    1熱度

    2回答

    我非常瞭解文件/ Theorie數據倉庫架構,應該如何設計。 Bill-Imon E-R 3NF或Kimball Star-Schema/Snow-flake Schema。 問題出現在我目前工作在DWH中時,它沒有任何這些Schema,它是由3個大事實表組成的,每個表都圍繞着很多維表。連接) 那麼它是什麼樣的模式呢? 在預先感謝恩裏克