2013-03-05 31 views
3

是否可以使用Oozie將MapReduce作業的輸出連接成單個文件?可以說我有輸出...使用Oozie組合輸出文件部分

part-r-00000 
part-r-00001 
part-r-00002 

,我只是想......

output.csv 

我知道我可以拉下來,與hadoop fs -getmerge一個文件,但我很好奇,如果工作流應用程序和HDFS是可能的。

回答

2

兩個簡單的選項,我能想到的:

  1. 修改生成此輸出使用單個減速
  2. 運行與身份映射器,身份減速機和單減速器的地圖,減少行動的工作
+0

是的,迄今爲止,我只看到了單減速器解決方案。我希望有更清潔的東西。如果事實證明沒有其他辦法,我會接受你的答案。 – climbage 2013-03-06 04:01:15

+0

不幸的是,沒有辦法將文件連接到一臺服務器上,然後再上傳到HDFS – 2013-03-06 15:00:47