1
我已經運行下面的代碼,結果是37spark並行化(List(1,2,3,4),2)總是按順序對列表進行分區?
val z = sc.parallelize(List(1,2,7,4,30,6), 2)
z.aggregate(0)(math.max(_, _), _ + _)
res40: Int = 37
似乎火花分區列表分爲2所列出:[1,2,7],[4,30,6]。
然後我在列表中改變的7和4的順序,我得到了34
scala> val z = sc.parallelize(List(1,2,4,7,30,6), 2)
z: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[18] at parallelize at <console>:24
scala> z.aggregate(0)(math.max(_, _), _ + _)
res11: Int = 34
我想知道的是,如果火花始終保持在列表分區時,元素的順序?
謝謝!