2017-01-16 55 views
0

我想巨大的文件從HDFS複製通過DistCp使用通過下面的代碼到S3:DistCp使用:從HDFS複製文件到S3(如何在斯卡拉或Java使用)

val files:Array[String] = new Array[String](2) 
files(0) = "/****/in.zip" 

val in = new Path(new URI("/**/in.zip")) 
val out = new Path(new URI("***/out.zip")) 
var distcpOpt = new DistCpOptions(in,out) 
ToolRunner.run(new DistCp(new Configuration(),distcpOpt), files) 

我試圖做一些事情類似於this link

以前有人做過這個,請大家幫忙。

回答

0

我發現瞭解決方案:

1-文件陣列應具有兩個值:一是一個用於輸入和第二一個用於輸出。

2- distcpOpt不需要具有任何值(空字符串就足夠了)

-3-是從S3路徑肯定

相關問題