幫助,我有兩個RDD,我想合併到一個RDD.This是我的代碼。如何合併兩個RDD到一個RDD
val us1 = sc.parallelize(Array(("3L"), ("7L"),("5L"),("2L")))
val us2 = sc.parallelize(Array(("432L"), ("7123L"),("513L"),("1312L")))
幫助,我有兩個RDD,我想合併到一個RDD.This是我的代碼。如何合併兩個RDD到一個RDD
val us1 = sc.parallelize(Array(("3L"), ("7L"),("5L"),("2L")))
val us2 = sc.parallelize(Array(("432L"), ("7123L"),("513L"),("1312L")))
您需要RDD.union
這些並不在鍵連接。聯盟本身並沒有真正做任何事情,所以它的開銷很低。請注意,組合的RDD將包含原始RDD的所有分區,因此您可能希望在聯合後合併。
val x = sc.parallelize(Seq((1, 3), (2, 4)))
val y = sc.parallelize(Seq((3, 5), (4, 7)))
val z = x.union(y)
z.collect
res0: Array[(Int, Int)] = Array((1,3), (2,4), (3,5), (4,7))
API
def++(other: RDD[T]): RDD[T]
返回此RDD和另外一個聯盟。
def union(other: RDD[T]): RDD[T]
返回此RDD和另外一個聯盟。任何相同的元素將出現多次(使用.distinct()消除它們)。
什麼是您的預期輸出和您嘗試過什麼? – mtoto
3L 7L 5L 2L 432L 7123L 513L 1312L – Simon
我想這RDD,是指兩個RDD合併成一個RDD – Simon