1
A
回答
1
Hadoop接受Streaming命令選項-outputformat
。
要將輸出文件生成爲序列文件,請使用-outputformat SequenceFileOutputFormat
。
例如:
$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/hadoop-streaming.jar \
-input myInputDirs \
-output myOutputDir \
-outputformat org.apache.hadoop.mapred.SequenceFileOutputFormat\
-mapper MapperClass \
-reducer ReducerClass
默認情況下,-inputformat
和-outputformat
被設置爲分別TextInputFormat
和TextOutputFormat
。
相關問題
- 1. 如何在python中爲json文件編寫流式mapreduce作業?
- 2. 使用Python編寫文本文件
- 3. 使用python編寫excel列
- 4. 用Python編寫文件
- 5. 用python編寫文件
- 6. 在編寫XML文件時(使用Python)
- 7. 如何用python編寫程序來處理文本流?
- 8. 使用流寫入文件
- 9. Hadoop MapReduce讀取和寫入序列文件
- 10. 編寫Python文本文件
- 11. 如何使用python編寫列表文件
- 12. 用Java編寫Portlet流文件
- 13. Hadoop的MapReduce的流排序多個列
- 14. 使用mapreduce處理文件
- 15. 用Python編寫列表項到文本文件
- 16. 使用流寫入文本文件
- 17. 寫入文件使用python
- 18. 使用WScript.shell編寫文件
- 19. 如何用Python編寫csv文件?
- 20. 無法用python編寫csv文件
- 21. openpyxl:用python編寫大型excel文件
- 22. 用Python編寫Fortran無格式文件
- 23. 用Python編寫的壓縮文件
- 24. 如何用Python編寫MIDI文件?
- 25. 錯誤而流MapReduce的文件
- 26. Python:建議如何提高在Python中編寫流文本文件
- 27. 使用Python將文件列表寫入文件
- 28. 如何編寫或編輯Python文件?
- 29. 正在寫文件時使用restlet流文件正在寫入
- 30. 爲WCF編寫文件流客戶端
非常感謝。這對我有用。 我只是很想知道,這是否可能在Python代碼中。通過導入hadoop庫。 –
是的,如果你使用mrjob模塊編寫MapReduce。檢查此鏈接[這裏](https://pythonhosted.org/mrjob/guides/writing-mrjobs.html#input-and-output-formats) – franklinsijo
可悲的是,這是行不通的。 在java中, job.setOutputFormatClass(SequenceFileOutputFormat.class); 工作正常,但是當我在終端中使用它時,它顯示類沒有找到。 :( –