1
我有陣元組[INT]的RDD,想知道有多少元素數組中的類似相似元素的數量,是什麼是做到這一點的最佳方式?查找(數組[INT],數組[INT])的RDD
我有陣元組[INT]的RDD,想知道有多少元素數組中的類似相似元素的數量,是什麼是做到這一點的最佳方式?查找(數組[INT],數組[INT])的RDD
陣共有單元號是一個大小交集的:
rdd.map { case (x, y) => x.toSet.intersect(y.toSet).size }
你說的「類似」是什麼意思? –