2017-08-29 52 views

回答

1

的解決方案類似於Retrieve top n in each group of a DataFrame in pyspark這是pyspark

如果您在斯卡拉做的一樣,那麼它應該是如下

df.withColumn("rank", rank().over(Window.partitionBy("Dept_id").orderBy($"salary".desc))) 
    .filter($"rank" <= 3) 
    .drop("rank") 

我希望答案是有幫助的

+0

@Coder ,沒有答案幫助你? –

+0

謝謝,這真的幫了我。 – Learner

+0

@Coder感謝您的接受。你也可以upvote當你將符合條件:) –