我在dataframe(d1)
中有一列:MODEL_SCORE
,其值爲nulll7880
。 我想在datframe
中創建另一個column MODEL_SCORE1
,它是MODEL_SCORE
的子串。根據另一列的子字符串在數據框中創建列,scala
我正在試着這個。它的創建列,但沒有給予預期的結果:
val x=d1.withColumn("MODEL_SCORE1", substring(col("MODEL_SCORE"),0,4))
val y=d1.select(col("MODEL_SCORE"), substring(col("MODEL_SCORE"),0,4).as("MODEL_SCORE1"))
謝謝,能我這樣做沒有創建UDF? – muni
您也可以使用df.withColumn(「col2」,substring(df(「col1」),4,3))。show 這裏4是字符串中的位置,3是從該位置開始的字符串的總長度。 – vindev