2015-10-26 73 views
1

我創建了包含多個小輸入文件的HAR文件。對於運行圖減少工作與單一的輸入文件,這將非常具有命令:使用HAR文件輸入的MapReduce作業

hadoop jar <jarname> <packagename.classname> <input> <output>

但如果萬一上面<input>是一個HAR文件中會有怎樣的命令,使得的所有內容HAR文件被認爲是輸入?

回答

2

如果輸入的是一個HAR文件,然後輸入以下的地方必須給予

har:///hdfs path to har file 

由於Hadoop的檔案將被暴露成文件系統,MapReduce的將能夠使用Hadoop中的所有文件檔案作爲輸入。

+0

「hadoop檔案將作爲文件系統公開」是這裏值得注意的事情。謝謝。 – Azim

相關問題