2012-09-17 102 views
2

假設我有兩個文件我想通過不同的格式映射。一個是序列文件,另一個是明文。有沒有辦法爲每一個分別指定一個-inputFormat?還是有什麼我應該做的映射通過兩個?Hadoop與兩個輸入格式的流?

回答

0

這是MultipleInputs類的用途。對於您輸入MultipleInputs的每個輸入:

MultipleInputs.addInputPath(job, inputPath, inputFormatClass, mapperClass);