1
我創建了包含多個小輸入文件的HAR
文件。對於運行圖減少工作與單一的輸入文件,這將非常具有命令:使用HAR文件輸入的MapReduce作業
hadoop jar <jarname> <packagename.classname> <input> <output>
但如果萬一上面<input>
是一個HAR文件中會有怎樣的命令,使得的所有內容HAR
文件被認爲是輸入?
我創建了包含多個小輸入文件的HAR
文件。對於運行圖減少工作與單一的輸入文件,這將非常具有命令:使用HAR文件輸入的MapReduce作業
hadoop jar <jarname> <packagename.classname> <input> <output>
但如果萬一上面<input>
是一個HAR文件中會有怎樣的命令,使得的所有內容HAR
文件被認爲是輸入?
如果輸入的是一個HAR文件,然後輸入以下的地方必須給予
har:///hdfs path to har file
由於Hadoop的檔案將被暴露成文件系統,MapReduce的將能夠使用Hadoop中的所有文件檔案作爲輸入。
「hadoop檔案將作爲文件系統公開」是這裏值得注意的事情。謝謝。 – Azim