0
我有一個如下所示的數據框。查找數據幀中屬性組合的前n個元素spark
scala> ds.show
+----+----------+----------+-----+
| key|attribute1|attribute2|value|
+----+----------+----------+-----+
|mac1| A1| B1| 10|
|mac2| A2| B1| 10|
|mac3| A2| B1| 10|
|mac1| A1| B2| 10|
|mac1| A1| B2| 10|
|mac3| A1| B1| 10|
|mac2| A2| B1| 10|
+----+----------+----------+-----+
對於屬性1中的每個值,我想找到該鍵的前N個鍵和聚合值。 輸出:用於ATTRIBUTE1鍵 聚合值將是
+----+----------+-----+
| key|attribute1|value|
+----+----------+-----+
|mac1| A1| 30|
|mac2| A2| 20|
|mac3| A2| 10|
|mac3| A1| 10|
+----+----------+-----+
現在,如果N = 1,那麼輸出將是A1 - (mac1,30)A2-(mac2,20)
如何實現這在DataFrame/Dataset中? 我想爲所有屬性實現此目的。在上面的例子中,我也想找到屬性1和屬性2。