我正在做兩個臨時表的聯合,並試圖按列排序,但火花抱怨我無法解析我訂購的列。這是一個錯誤還是我錯過了什麼? lazy val spark: SparkSession = SparkSession.builder.master("local[*]").getOrCreate()
import org.apache.spark.sql.types.StringType
val ol
我想計算Spark數據框上的組分位數(使用PySpark)。無論是近似還是精確的結果都可以。我更喜歡在groupBy/agg的上下文中使用的解決方案,以便我可以將其與其他PySpark聚合函數混合使用。如果由於某種原因無法實現,則採用不同的方法也可以。 This question是相關的,但並不指示如何使用approxQuantile作爲聚合函數。 我也有權訪問percentile_approx