2014-06-30 69 views
0

如何在本地文件系統中可用的文件上運行Java映射/減少作業?例如,我有一個3節點的集羣,並且所有節點都在其本地文件系統中有一個日誌文件,例如/home/log/log.txt。如何在本地文件系統上運行map/reduce?

如何在這些文件上運行作業?在運行作業之前,我需要將它們合併並轉移到HDFS嗎?

謝謝。

回答

0

您可以上傳一個文件夾下的所有單個文件,並將該文件夾路徑作爲您的地圖縮減程序的輸入路徑。您的Map Reduce在該文件夾中的所有文件上運行。

+0

謝謝。但是,如果文件非常大,那麼當將所有文件移動到單個系統時,這會造成問題。如果有3個以上的節點,則會變得更加困難。有沒有辦法直接運行它,而不必移動文件? – drunkenfist

+0

你可以在你的linux終端中使用下面的hadoop命令將文件放入hdfs中。 hadoop fs -put chmk

相關問題