0
DocsRDD:RDD [X:矢量[字符串]以RDD [X:矢量[字符串] +迭代器:矢量[字符串]
RDD[Vector[String]]
DocsRDD:
Vector(Doc1.txt, Doc2.txt, Doc5.txt)
Vector(Doc4.txt, Doc3.txt)
Vector(Doc6.txt, Doc9.txt)
我想要什麼只是所有的雙對文檔的,例如用於DocsRDD我想
AllDualDocsRDD:
Vector(Doc1.txt, Doc2.txt)
Vector(Doc1.txt, Doc5.txt)
Vector(Doc2.txt, Doc5.txt)
Vector(Doc4.txt, Doc3.txt)
Vector(Doc6.txt, Doc9.txt)
下面是我的代碼示例(我是Spark,Scala的新手)。
val AllDualDocsRDD = DocsRDD.map(e => if (e.size > 2) {
val V_iter = (1 to e.size).flatMap(e.combinations).filter(_.size == 2).toVector
V_iter.foreach(println)
//Here I Cannot put V_iter : scala.Vector[Vector[String]]
}
else e)
但是好像我撞到了牆上!有誰知道我能做到這一點?