2017-04-20 69 views
-1

我有下面的一個文件的「#」分裂之後,多個拆分和地圖在星火

res64: Array[(String, String)] = Array((1,Animation|Children's|Comedy), (2,Adventure|Children's|Fantasy)) 

如何獲得(使用不同的)像(1, Animation),(1,Children's)等。唯一的一對,每key(電影ID在這裏)像RDD中的1?

回答

0

可以簡單如

rdd.mapValues(x => x.split('|'))\ 
.flatMapValues(x=>x)\ 
.distinct()\ 
.collect()