我有一個有兩列的數據框,其中一個(稱爲dist)是密集向量。我如何將它轉換回整數數組列。將數據幀中的矢量列轉換回數組列
+---+-----+
| id| dist|
+---+-----+
|1.0|[2.0]|
|2.0|[4.0]|
|3.0|[6.0]|
|4.0|[8.0]|
+---+-----+
我嘗試使用以下UDF的幾個變種,但它返回一個類型不匹配錯誤
val toInt4 = udf[Int, Vector]({ (a) => (a)})
val result = df.withColumn("dist", toDf4(df("dist"))).select("dist")
什麼是「標準」欄? –
一個數組例如 – ulrich
所以,你顯然想要在一個矢量中合併所有列,對嗎? –