0
我想按年/月/日劃分數據幀。我還想刪除任何空白分區,並將輸出保存在我的本地計算機下,如年/月/日等文件夾下。Spark如何根據年份和月份劃分數據幀
我已經嘗試了以下,但它仍然創建200奇怪的分區。
val sqldf = spark.sql("SELECT year(EventDate) AS Year_EventDate, month(EventDate) as Month_EventDate FROM table CLUSTER BY Year_EventDate,Month_EventDate")
sqldf.write.format("com.databricks.spark.csv").option("header", "true").mode("overwrite").save(destinationFolder)
它爲我工作。謝謝 – jane