2016-08-01 44 views
2

我有一個Spark數據框,我想組一個關鍵要素,並有結果的排序列表星火數據框中GROUPBY和排序成一個列表

目前我使用:

df.groupBy("columnA").agg(collect_list("columnB"))

如何使列表中的項目按升序排序?

+2

的可能的複製[如何在不使用SQL星火排序在星火數據幀?](http://stackoverflow.com/questions/29741360/how-to-sort-dataframe-in-spark-without-using-spark-sql) –

回答

12

你可以嘗試在functions軟件包中提供的功能sort_array

import org.apache.spark.sql.functions._ 
df.groupBy("columnA").agg(sort_array(collect_list("columnB"))) 
+5

如何根據'df'中的不同列對'collect_list()'中的元素進行排序? – vdep