0
我已經創建了下面的示例RDD,獲取獨特的RDD串
val rdd = sc.parallelize(List(("[email protected]"),
("[email protected]"),
("[email protected]")))
//I used the following to split,
val rdd1 = rdd.map(_.split("@")) //RDD[Array[String]]
什麼我想現在要做的是得到一個新的RDD具有不同的區域,即
val finalrdd = sc.parallelize(List(("domainA"),
("domainB")))
我發現this post但我無法讓它工作。