2017-01-04 58 views
0

我想使用spark數據框重命名列並添加一個條件。Spark:DataFrame重命名列和更新行值

例如:我有一列「代碼」,我想重命名爲「源代碼」,我想添加一個條件。當列中的值等於「A」時,應將其重命名爲「代理」,當值爲「O」時,應將其重命名爲「其他」。

+0

您正在使用的語言? – Natalia

+0

@Natalia我正在使用Spark Scala。 – SFatima

+0

檢查此對話[http://stackoverflow.com/questions/35592917/renaming-column-names-of-a-data-frame-in-spark-scala](http://stackoverflow.com/questions/35592917/重命名-列名對的一數據幀合火花階) –

回答

1

重命名列

df.withColumnRenamed("oldName", "newName") 

更新值

val newColumnValue = df("c")... //some calculation 
df.withColumn("updatedValue", newColumn)