val data: RDD [(String, Array[Int])] = sc.parallelize(Seq(
("100",Array(1, 2, 3, 4, 5)), ("1000",Array(10, 11, 12, 13, 14))
))
val codes = sc.parallelize(Seq(2, 3, 12, 13))
val result = data.map {case (id,values) => (id, values.diff(codes))}
我想獲得的結果爲:星火RDD:設置差異
val result: Array[(String, Array[Int])] = Array(
("100", Array(1, 4, 5)), ("1000", Array(10, 11, 14))
)
然而,當我做差集,我得到的類型不匹配的錯誤。
你的代碼是失去了一些東西......是什麼'dummy_data_sorted' ? –
很抱歉更新了代碼。 – user3803714