我有一個以String形式的列的數據框。 我想在pyspark中將列類型更改爲Double類型。如何將字符串類型中的Dataframe列更改爲pyspark中的Double類型
以下是這樣的,我做到了, -
toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType())
changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show']))
只是想知道,這是做了正確的方式,同時通過Logistic迴歸運行 ,我得到了一些錯誤,所以我不知道, 是這個麻煩的原因。
謝謝,我一直在尋找如何留住原來的列名 – javadba
有一個清單某處的短字符串數據類型的Spark將確定? – alfredox