我有一個名爲RDD初始化RDD清空
JavaPairRDD<String, List<String>> existingRDD;
現在我需要初始化這個existingRDD
爲空,這樣,當我得到的實際RDD的我可以做一個工會與此existingRDD
。 如何將existingRDD
初始化爲空RDD,但將其初始化爲空? 這裏是我的代碼:
JavaPairRDD<String, List<String>> existingRDD;
if(ai.get()%10==0)
{
existingRDD.saveAsNewAPIHadoopFile("s3://manthan-impala-test/kinesis-dump/" + startTime + "/" + k + "/" + System.currentTimeMillis() + "/",
NullWritable.class, Text.class, TextOutputFormat.class); //on worker failure this will get overwritten
}
else
{
existingRDD.union(rdd);
}
我不知道我非常理解你正在嘗試做什麼。你想在一個空的RDD上創建一個聯合?做什麼的? – eliasah
是的。當我通過eachRDD循環時,我的意思是foreachRDD在我的代碼中,我需要將rdd與這個現有的RDD結合起來,這樣最後我可以將這個現有的RDD保存到我的s3中。 –
爲什麼不能簡單地將'existingRDD'設置爲'rdd'寫入s3之後的第一次迭代? –