我使用Hadoop 0.20.2合作,並希望使用-cat shell命令,如果可能的兩個文件連接成一個(來源:http://hadoop.apache.org/common/docs/r0.19.2/hdfs_shell.html)如何將hadoop中的兩個文件連接成一個使用Hadoop FS shell的文件?
這裏是我提交(名稱已經更改)的命令:
**/path/path/path/hadoop-0.20.2> bin/hadoop fs -cat /user/username/folder/csv1.csv /user/username/folder/csv2.csv > /user/username/folder/outputdirectory/**
它返回的bash:/用戶/用戶名/文件夾/輸出目錄/:沒有這樣的文件或目錄
我也嘗試創建目錄,然後重新運行它 - 我仍然有「無這樣的文件或目錄'錯誤。
我也嘗試使用-cp命令將它們複製到一個新文件夾中,並使用-getmerge將它們組合起來,但getmerge也沒有運氣。
在hadoop中這樣做的原因是這些文件非常龐大,需要很長時間才能在hadoop之外進行下載,合併和重新上傳。
按照您的建議使用hadoop fs -put完全符合我的需要 - 它將兩個CSV連接成HDFS上的第三個文件。非常感謝你的幫助Chris! – user1397044
追加支持在20.2中不可用,因爲它不包含在內。它後來被合併爲後續版本。 –