當我在SparkSQL中使用窗口函數時,出現以下警告消息。任何人都可以請讓我知道如何解決這個問題。在SparkSQL數據框中使用窗口函數時出現的警告消息
警告消息: No Partition Defined for Window operation! Moving all data to a single partition, this can cause serious performance degradation.
我的代碼: def calcPrevBrdrx(df: DataFrame): DataFrame = { val w = Window.orderBy("existing_col1") df.withColumn("new_col", lag("existing_col2", 1).over(w)) }
基本上我通過使用窗口滯後函數添加一個新列(new_col),它與「existing_col2」相比只是向下滑動一行。 – Ramesh
我可以在新數據幀中看到新列'new_col'按預期正確創建。但如上所述,我收到警告信息。 – Ramesh