0
A
回答
0
我使用java來處理gzip文件並以gzip壓縮方式生成輸出。我用下面的代碼
FileOutputFormat.setCompressOutput(job, true);
FileOutputFormat.setOutputCompressorClass(job, GzipCodec.class);
FileOutputFormat.setOutputPath(job, output path));
我希望你會發現類似的API /代碼在Python中。
您可以生成gzip文件作爲生成的輸出。通過'-D mapred.output.compress = true -D mapred.output.compression.codec = org.apache.hadoop.io.compress.GzipCodec'作爲您的流式作業的選項。
相關問題
- 1. 壓縮輸入流Java
- 2. 輸出壓縮HTML
- 3. SPHINX輸出壓縮?
- 4. 使用g4壓縮壓縮輸出tiff
- 5. 如何從流式Hadoop作業獲取壓縮(文本)輸出
- 6. C中的流媒體壓縮庫用於流式傳輸
- 7. 使用輸入/輸出流的Java LZ4壓縮
- 8. 壓縮到流
- 9. 壓縮流
- 10. 使用GZip壓縮輸出
- 11. 壓縮和解壓流
- 12. 解壓縮或膨脹php://輸入流?
- 13. 獲取壓縮文件的輸入流?
- 14. 解壓縮trunctated壓縮流(放氣)
- 15. 使用Compression.DeflateStream壓縮和解壓縮流
- 16. JavaScript:數據流壓縮/解壓縮
- 17. 的YUICompressor - 壓縮多輸入多輸出
- 18. 解壓縮GZIP流
- 19. 如何壓縮流?
- 20. 流的Delta壓縮
- 21. 錯誤壓縮流
- 22. 快速壓縮流式圖像
- 23. 壓縮文件的僅內存流式傳輸
- 24. YUI壓縮機 - 壓縮多個輸入文件到一個輸出文件
- 25. 查找壓縮文件和輸出行
- 26. 批處理:REG的輸出壓縮
- 27. 如何壓縮MapReducer的輸出?
- 28. 星火未壓縮JSON輸出
- 29. 基於JEKYLL_ENV壓縮SASS輸出?
- 30. Parquet輸出文件不壓縮