在hadoop作業計數器中,「地圖輸出物化字節數」與「地圖輸出字節數」有什麼區別?我沒有看到前者當我禁用地圖輸出壓縮,所以我猜這是真正的輸出字節(壓縮),而後者是未壓縮的字節?「地圖輸出物化字節數」vs「地圖輸出字節數」
6
A
回答
10
我認爲你是對的。 從http://hadoop.apache.org/docs/r1.0.4/releasenotes.html:
MAPREDUCE-2365。 FileInputFormat(BYTES_READ)和FileOutputFormat(BYTES_WRITTEN)的新計數器。用於壓縮MapOutputSize的新計數器MAP_OUTPUT_MATERIALIZED_BYTES。 (亞洲時報Siddharth賽斯)
(變化由於Hadoop的0.20.2)
.............................. .................................................. .................................................. .................
以下是湯姆白色的 「Hadoop的權威指南」 一帖,第三版(表8-2,261頁):
「映射輸出物化字節數」 - 實際寫入磁盤的映射輸出的字節數。如果啓用了地圖輸出壓縮,則會反映在計數器值中。
「映射輸出字節數」 - 作業中所有映射產生的未壓縮輸出的字節數。每次在地圖的OutputCollector
上調用collect()
方法時都會增加。
相關問題
- 1. 字節數組輸出爲圖像
- 2. PHP dechex更改輸出字節數量
- 3. HMACSHA256輸出字節/位
- 4. 輸出失配從字節數組創建的位圖
- 5. Spark - MapOutputTrackerMasterEndpoint:地圖輸出狀態是N個字節,超過了akka framesize
- 6. Hadoop Mapredce地圖輸出
- 7. 訂單輸出的地圖
- 8. Java字節數組輸出流給出什麼
- 9. 如何找出套接字的傳輸/接收字節數
- 10. 砍下輸出字節千兆字節轉換
- 11. 輸入字符到地圖
- 12. 」字節「vs」字節「
- 13. C++輸出的1字節澄清
- 14. 的Verilog fwrite的輸出字節
- 15. 將字節[]輸出到.txt文件
- 16. CScore輸出PCM大於一個字節
- 17. DataOutputStream不生成字節作爲輸出?
- 18. HTTP輸出中的垃圾字節?
- 19. 輸出可用內存爲兆字節
- 20. 「直方圖」函數:輸入字符串和輸出字典
- 21. 上傳圖片時出現「格式錯誤的字節輸入」
- 22. C++數組輸出地址?
- 23. UNKNOW輸出,數字
- 24. 本地化clang輸出
- 25. Eureka的本地化輸出?
- 26. Grails本地化,數字輸入
- 27. 有效地將大量字節數據從C++傳輸到Java
- 28. 格式化整數字符串輸出
- 29. 新手Python:打印輸出空字節的函數
- 30. 輸出二進制數據丟失一些字節
我似乎在我的作業詳細信息頁面中看不到「Map output materialized bytes」。我正在使用Hadoop 2.0.0-mr1-cdh4.2.1。我是否需要進行一些設置更改? –