我正在使用Hadoop 2.7.1並使用Java進行編碼。我能夠運行一個簡單的mapreduce程序,我提供一個文件夾作爲MapReduce程序的輸入。如何使用文件(許多文件的完整路徑)作爲MapReduce作業的輸入
但是我想用一個文件(完整路徑在裏面)作爲輸入;此文件包含要由映射器函數處理的所有其他文件。
以下是文件內容,
/allfiles.txt
- /tmp/aaa/file1.txt
- /tmp/bbb/file2.txt
- /tmp/ccc/file3.txt
如何指定輸入路徑的MapReduce程序的文件,以便它可以開始處理每一個文件?謝謝。