我有一個Spark RDD,其條目我想以有組織的方式進行排序。假設條目是一個包含3個元素(name,phonenumber,timestamp)
的元組。我想首先根據phonenumber
的值對條目進行排序,然後根據timestamp
的值對條目進行排序,同時尊重並不改變基於phonenumber
完成的排序。 (所以timestamp
只根據phonenumber
排序重新排列)。有Spark功能來做到這一點?如何使用兩個功能同時對RDD條目進行排序?
(我用的Spark 2.X使用Scala)