2015-12-21 89 views
0

我不清楚在Redshift中使用COPY命令時自動壓縮如何工作。紅移COPY自動壓縮

文檔說:

默認情況下,只要您運行COPY命令用空目標表和所有表列要麼有RAW編碼或不編碼的COPY命令將應用於自動壓縮。

這是否意味着對於其中的原始數據是在現有基礎上覆制我的主表,數據將被壓縮後只有第一次複製會出現此表也再沒有後續的時間?似乎我誤解了一些原因,這是沒有道理的,它會這樣工作。

THX

回答

3

基本上是一個編碼(壓縮)類型需要創建表時要對每列設置。但是,從AWS文檔中引用的例外情況來看,當數據複製到空表中時,Redshift會自動分析並設置 對所有列以及複製數據的最佳編碼。然後,後續數據將使用設置的編碼進行壓縮。

因此,您的問題的答案是「否」。一旦編碼(壓縮)通過任一方式設置,後續項目將被壓縮。

0

我確認了Masashi的回答。請注意:

自動壓縮分析需要在加載數據中有足夠的行(每個切片至少100,000行)才能進行採樣。

如果您在小批量上運行COPY,您的表將被設置爲無編碼。所有隨後的COPY電話都不會改變這一點。您稍後可以通過運行表格的深層副本來解決此問題。