我有一個pairRDD與元組在下面的表格是:轉換的RDD成一個鍵值對RDD,與值列表是
[(1,"b1","c1","d1","e1"), (2,"b2","c2","d2","e2"), ...
我要的是上述轉換成關鍵 - 值對RDD,其中,所述第一場將是關鍵,和第二場的字符串列表(值)。即我想把它變成下面的形式:
[(1,["b1","c1","d1","e1"]), (2,["b2","c2","d2","e2"]), ...
在此之後,是否可以訪問我想要的任何字段?
例如,我可以訪問元組(1,["b1","c1","d1","e1"])
,然後只提取字段d1
?
如果你想保存密鑰的順序,這看起來像是一個'HashMap <整數,列表>'或'LinkedHashMap <整數,列表>'。 –
Titus
我應該使用rdd.hashMap嗎? – hammad
哦,我誤解了,我以爲你想一個RDD對象轉換爲一個普通的Java對象,作爲一個RDD對象,你可以使用'JavaPairRDD <整數,列表>'。 –
Titus