2017-08-27 30 views
0

我在Amazon Redshift上構建了幾個非常大的數據表,它應該包含幾個經常查詢的屬性和相關指標的數據。Redshift Composite Sortkey - 我們應該使用多少列?

我們使用均勻分佈樣式(「diststyle even」)使所有節點都參與查詢計算,但我不確定sortkey的長度。

它絕對應該是複合 - 每個查詢將使用日期和網絡上的第一個過濾器 - 但在該級別之後,我有大約7個額外的相關因素可以查詢。 我見過的所有例子都使用2-3個字段的複合排序鍵,最多4個。

我的問題是 - 爲什麼不使用包含表中所有關鍵字段的sortkey?有一個長的sortkey有什麼缺點?

+0

那麼,如果你建立一個涉及你的表中所有列的索引,它將佔用更多的空間,如果你建立的索引只涉及一些列。所以如果空間是一個問題,那麼這可能是你的問題的答案。 –

回答

0

如果您有幾個排序鍵,VACUUM也將花費更長的時間。

相關問題