0
df = spark.createDataFrame([(1.0,100.0, float('nan')), (float('nan'),100.0, 2.0)], ("a", "b"))
df.select(F.max(df.a)).show()
+------+
|max(a)|
+------+
| NaN|
+------+
我不想NaN的,我該怎麼辦?
df = spark.createDataFrame([(1.0,100.0, float('nan')), (float('nan'),100.0, 2.0)], ("a", "b"))
df.select(F.max(df.a)).show()
+------+
|max(a)|
+------+
| NaN|
+------+
我不想NaN的,我該怎麼辦?
你可以做
df.na.fill(0)
你申請你max
過濾器之前