我正在從HDFS加載文件到JavaRDD
,並且想要更新那個RDD
。爲此,我將其轉換爲IndexedRDD
(https://github.com/amplab/spark-indexedrdd),但我無法獲得Classcast Exception
。 基本上我會做出關鍵值對並更新密鑰。 IndexedRDD
支持更新。有什麼方法可以轉換嗎?Spark RDD更新
JavaPairRDD<String, String> mappedRDD = lines.flatMapToPair(new PairFlatMapFunction<String, String, String>()
{
@Override
public Iterable<Tuple2<String, String>> call(String arg0) throws Exception {
String[] arr = arg0.split(" ",2);
System.out.println("lenght" + arr.length);
List<Tuple2<String, String>> results = new ArrayList<Tuple2<String, String>>();
results.addAll(results);
return results;
}
});
IndexedRDD<String,String> test = (IndexedRDD<String,String>) mappedRDD.collectAsMap();
您正在使用哪個版本的spark? – eliasah