有沒有辦法輸出來記錄MapReduce作業的中間(Map Phase)輸出而不編輯應用程序? (該應用程序不是我的,但集羣是,並且我可以根據需要設置Hadoop集羣)Hadoop MapReduce中間輸出
回答
keep.task.files.pattern參數可用於保留中間文件。一旦作業完成,中間文件必須手動清理。因爲這是一個map/reduce任務屬性,所以必須在配置文件中設置它,並再次打包jar文件。
請你詳細說明一下嗎?我已經設置了這個參數,並且在輸出目錄以及mapred本地緩存中的任何地方都進行了搜索,但沒有任何地圖階段輸出... – ihadanny
...我對$ {mapred.output.dir }/_暫時的,但我能找到的所有文件夾都是「_attempt_local_0003_r_000000」文件夾,從來沒有與其對應的「m」文件夾 – ihadanny
我在'mapred'中將'keep.task.files.pattern'設置爲'。* 00000. *' -site.xml「和'core-site.xml'中,參數'hadoop.tmp.dir'設置爲'$ HADOOP_HOME \ tmp'。執行作業後,file.out和file.out.index位於'$ HADOOP_HOME/tmp/mapred/local/taskTracker/praveensripati/jobcache/job_201111031937_0001/attempt_201111031937_0001_m_000001_0/output'文件夾中。這些文件是SequenceFile格式。 [Here](http://goo.gl/7fJzT)是讀取序列文件的示例代碼。你使用了什麼樣的模式? –
- 1. Hadoop MapReduce不寫輸出
- 2. Hadoop HDFS MapReduce輸出到MongoDb
- 3. Hadoop - MapReduce - Mapper輸出類型
- 4. 在Hadoop中向Cassandra輸出一行Mapreduce
- 5. hadoop mapreduce中單獨的輸出文件
- 6. Hadoop,MapReduce - 多輸入/輸出路徑
- 7. Hadoop MapReduce多輸入
- 8. hadoop mapreduce流式傳輸中的多文件輸出
- 9. Hadoop中的MapReduce
- 10. 將Hadoop Mapreduce輸出到本地磁盤或標準輸出
- 11. hadoop mapreduce
- 12. Hadoop中的Mapreduce程序中的意外輸出
- 13. mapreduce中的reducers hadoop
- 14. Hadoop MapReduce中的DataJoins
- 15. Hadoop MapReduce - 每個輸入的一個輸出文件
- 16. 如何將hadoop mapreduce的輸出作爲restful api的輸入?
- 17. Java MapReduce:如何在Hadoop輸出中存儲LONG列表
- 18. 從Hadoop中的映射器生成多個輸出文件MapReduce
- 19. 如何格式化Mapreduce在Hadoop中寫入的輸出
- 20. Hadoop Mapreduce wordcount
- 21. Hadoop mapreduce編程
- 22. hadoop mapreduce model java
- 23. Hadoop和MapReduce
- 24. hadoop mapreduce teragen FAIL_CONTAINER_CLEANUP
- 25. hadoop mapreduce兩種
- 26. 在hadoop mapreduce
- 27. hadoop的Dumbo mapreduce
- 28. Hadoop Mapreduce ClassNotFoundException
- 29. Hadoop MapReduce思維
- 30. hadoop-mapreduce reducer-組合器輸入
你能重新配置工作嗎? –