的Python:
sc.parallelize([['Chris',29,110],['Bob',28,104],['Bob',25,102],['Adam',22,100]]).groupBy(lambda x: x[0]).sortByKey().flatMap(lambda x: list(x[1])).collect()
[[ '亞當',22,100],[ '鮑勃',25,102],[ '鮑勃',28,104],[ '克里斯',29,110]]
斯卡拉:
sc.parallelize(List(Array("Chris",29,110),Array("Bob",28,104),Array("Bob",25,102),Array("Adam",22,100))).groupBy(x => x(0).asInstanceOf[String]).sortByKey().flatMap(x=> x._2).collect()
數組[數組[不限] =陣列(陣列(亞當,22,100),陣列(鮑勃,28,104),陣列(鮑勃,25,102),陣列(克里斯,29,110))
你可能想把其他列一個如果你想將它們包含在你的分類標準中,那麼它就是你的密鑰的一部分。所以在上面的例子中,第二列的Bob排序不會在那裏。
請添加您的代碼,以便於您的幫助。 – ale64bit