我使用的是Spark/Scala,我想根據列的類型使用默認值填充DataFrame中的空值。在Spark DataFrame中的na.fill Scala
即字符串列 - > 「串」,數值列 - > 111,布爾列 - >假等
目前DF.na.functions API na.fill
fill(valueMap: Map[String, Any])
提供像
df.na.fill(Map(
"A" -> "unknown",
"B" -> 1.0
))
這需要知道列名稱以及列的類型。
OR
fill(value: String, cols: Seq[String])
這只是字符串/ double類型,甚至沒有布爾。
有沒有一個聰明的方法來做到這一點?
您可能需要使用'isInstanceOf'檢查輸入的數據類型和更換合適。 – Shankar
請提供一個可重現的例子。 – mtoto
感謝您的幫助,我使用模式匹配來查找類型,nad創建了一個映射並使用它 –