我需要將大量文件從一個hdfs目錄移動到另一個hdfs目錄中(而不是複製)到另一個hdfs目錄。將大量文件從hdfs移動到hdfs
我可以使用distcp,但它似乎是一個矯枉過正,因爲它是複製文件(複製它)我只想移動它。兩個問題:
A)是那裏有什麼:
我想用MapReduce的做到這一點,因爲有成千上萬的文件需要被移動(或重命名爲新的路徑)。我也想將它與oozie集成。我自己可以寫一個mapreduce工作,但我想知道是否有什麼可以完成這項工作。
B)我真的需要這樣做mapred?
不幸的是,我對hdfs rename的性能特徵不夠了解;你認爲我可以通過單線程方法來重命名文件嗎?