0
有兩種RDDS,第一個是一個(鍵,值)對rdd_1
:加入2個RDDS在火花其中第一RDD的值是第二RDD的鍵
key1,[value1, value2]
第二個也是(鍵,值)對rdd_2
:
(key2, value3), (key3, value4)...
我想加盟rdd1
和rdd2
和rdd_1
的value1
& value2
爲的。我需要的結果是
key1, [value1: value3, value2: value4]
我可以處理rdd1
與flatMap,然後更改順序,這意味着:
key1,[value1, value2] -> (key1, value1),(key1, value2)->(value1, key1),(value2, key1)
然後加入rdd2
,然後更改訂單&合併與KEY1。 .. 有沒有更高效的做到這一點?謝謝。