0
我有一個原始的RDD數據的RDD(鑰匙,ID),看起來有點像:合併與RDD(K1,K2)
(A,A)
(A,B)
(B,C)
(C,D)
這些都是在一個圖形邊緣(表示爲頂點的名字)我使用一些代碼來生成具有唯一ID的第二個RDD。
(A,0)
(B,41)
(C,82)
(D,123)
我想以某種方式合併這些RDDS得到一個最終的RDD看起來像:
Edge(0,0,AA)
Edge(0,41,AB)
Edge(41,82,BC)
Edge(82,123,CD)
基本上創建邊緣[RDD]這樣我就可以在這些邊緣使用graphx。是否有可能將Id RDD與原始邊緣RDD合併?
以下任何一條都有幫助? – mtoto
@mtoto我不得不重寫一堆後端代碼,所以我一直無法測試。我認爲@semsorock可能有一個很好的解決方案。我正在考慮現在使用純RDD,並使用'join'將所有配對都按我的想法配對。 –