RDD減這麼想的工作,我想這個簡單的例子用戶定義類型
scala> rdd2.collect
res45: Array[Person] = Array(Person(Mary,28,New York), Person(Bill,17,Philadelphia), Person(Craig,34,Philadelphia), Person(Leah,26,Rochester))
scala> rdd3.collect
res44: Array[Person] = Array(Person(Mary,28,New York), Person(Bill,17,Philadelphia), Person(Craig,35,Philadelphia), Person(Leah,26,Rochester))
scala> rdd2.subtract(rdd3).collect
res46: Array[Person] = Array(Person(Mary,28,New York), Person(Leah,26,Rochester), Person(Bill,17,Philadelphia), Person(Craig,34,Philadelphia))
我希望rdd2.subtract(rdd3).collect
只應該是Person(Craig,34,Philadelphia)
但我得到RDD2作爲我的輸出任何人都可以請解釋一下嗎?
謝謝你的回答,它在我的情況下效果很好。但如何使用粘貼模式可以解決問題? –
解決方案需要將案例類置於一個包中(本例中爲mytest)。要做到這一點,我們需要粘貼模式。與原始選項。 –