2
有沒有一種方法可以找出未壓縮的文件大小對於快速壓縮的地板文件而言是什麼?我在HDFS目錄中有很多parquet文件,我試圖找出是否有一種方法來計算文件大小,如果這些數據是未壓縮的。找出原始鑲木地板文件大小?
有沒有一種方法可以找出未壓縮的文件大小對於快速壓縮的地板文件而言是什麼?我在HDFS目錄中有很多parquet文件,我試圖找出是否有一種方法來計算文件大小,如果這些數據是未壓縮的。找出原始鑲木地板文件大小?
您可以嘗試解壓縮數據並查看它消耗了多少空間。請參閱How to decompress the hadoop reduce output file end with snappy?
也許有一種更加優雅的方式我不知道