1
我嘗試從循環內的另一個RDD迭代聯合來創建RDD,但如果我對循環內的結果RDD執行操作,結果將獨佔地工作。循環內部的Spark Union給出了void
var rdd : RDD[Int] = sc.emptyRDD
for (i <- 1 to 5) {
val rdd1 = sc.parallelize(Array(1))
rdd = rdd ++ rdd1
}
// rdd.foreach(println) => void
for (i <- 1 to 5) {
val rdd1 = sc.parallelize(Array(1))
rdd = rdd ++ rdd1
rdd.foreach(x=>x)
}
// rdd.foreach(println) => (1,1,1,1,1)
如果我在循環外創建rdd1
一切正常,但不在裏面。
它是否存在解決此問題的特定輕量級操作?