我試圖將我的reducer的結果輸出到多個文件。數據結果全部包含在一個文件中,其餘結果根據其尊重文件中的類別進行分割。我知道0.18,你可以用MultipleOutputs做到這一點,它並沒有被刪除。但是,我試圖使我的應用程序0.20+兼容。現有的多輸出功能仍然需要JobConf(我的應用程序使用Job和Configuration)。如何根據密鑰生成多個輸出?使用Hadoop生成多個輸出文件0.20+
4
A
回答
9
對MultipleOutputs的支持不在0.20中。您將需要使用舊的API。
它已被添加到0.21當前未發佈爲org.apache.hadoop.mapreduce.lib.output.MultipleOutputs。
This thread在郵件列表中討論了這個問題。
2
您可以做這在Hadoop 0.20,只是如上所述,你必須使用舊的API。
有一些很粗糙的代碼,這樣做在 http://github.com/orngejaket/Info_Moist_1_Splicer/tree/master/src/contrib/streaming/src/java/org/infochimps/hadoop/mapred/lib/
產生的罐子每個記錄寫入到它(消毒)鍵後命名的文件。
相關問題
- 1. 使用Hadoop Pig生成多個輸出
- 2. 從Hadoop中的映射器生成多個輸出文件MapReduce
- 3. XslTransform.Transform生成多個輸出文件
- 4. 多個輸出HADOOP
- 5. Hadoop映射器可以在輸出中生成多個鍵嗎?
- 6. 使用XSL比較兩個文件並生成輸出文件
- 7. 在Hadoop流中生成單獨的輸出文件
- 8. Hadoop:如何生成自定義減少輸出文件名?
- 9. 生成多個輸出文件的腳本組件
- 10. 使用RequireJS的優化器和單個構建文件生成多個輸出
- 11. 如何在Hadoop 0.20中使用MultipleoutputFormai?
- 12. 使用phantom.js生成多個HAR文件
- 13. hadoop作業輸出文件
- 14. 如何讀取一個文件並生成多個文本輸出文件
- 15. 如何使用命令'np.random.normal'通過單個輸入文件生成多個輸出文件?
- 16. 的Hadoop MapReduce的多個輸入文件
- 17. 生成文件:有3種輸入產生一個輸出
- 18. 使用Hadoop多輸出寫入多個輸出啓用推測執行
- 19. Xcode中的警告:「輸出文件的多個生成命令」
- 20. 的iOS SDK(xcodebuild聯編):生成多個輸出文件
- 21. 是否可以爲map-reduce生成多個輸出文件?
- 22. 從模板生成多個輸出文件
- 23. TesseractOCRiOS |警告:輸出文件的多個生成命令
- 24. 使用CQL3的Hadoop多輸出
- 25. 如何在運行時在HADOOP中生成多個文件名?
- 26. 使用PigLatin(Hadoop)加載多個文件
- 27. Hadoop PIG輸出沒有在PARALLEL運算符中被拆分成多個文件
- 28. Hadoop - 使用Java將reducer輸出合併到單個文件中
- 29. XSLT生成多輸出
- 30. 分別生成多個xlswrite輸出
這令人難以置信的令人沮喪和愚蠢。這似乎是該計劃中需要的基本功能。 – monksy 2010-02-02 04:37:08
是的。很多工作正在朝向具有1.0的正確API接口發展。 – 2010-02-02 16:45:07
如果使用cdh distrubution,則不行。 cdh3是0.20.1加上一些修補與MultipleOutputs類。我最初不願意使用cdh並使用apache distro。但是,在幾個問題之後,對cdh更加滿意。 – smartnut007 2011-05-27 23:22:22