2017-06-17 60 views
0

我在配置單元控制檯中執行下面的命令。Parquet輸出文件不壓縮

create table departments_parquet stored as parquet tblproperties("parquet.compression"="GZIP") as select * from departments; 

我看到了如下所示以parquet格式創建的輸出文件。

mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec; 
hive.exec.compress.output=true; 

我所期望的輸出文件名000000_0.gz 請有助於獲得最終的輸出爲壓縮gzip文件:如

-rwxrwxrwx 1 cloudera supergroup  463 2017-06-17 14:55 /user/hive/warehouse/departments_parquet/000000_0 

蜂巢相關屬性進行設置。 謝謝。

回答

0

列式存儲同時使用各種壓縮技術,頁面壓縮只是其中之一,因此,雖然包含gzip壓縮的數據部分,但文件不是gzip文件。

+0

是的,明白了。謝謝。 – dossani