如何將數據幀轉換爲多列 我可以得到RDD [org.apache.spark.sql.Row],但我需要一些可用於組織的東西。 apache.spark.mllib.fpm.FPGrowth,ei RDD [數組[String]] 如何轉換?scala dataframe to RDD [array [String]]
df.head
org.apache.spark.sql.Row = [blabla,128323,23843,11.23,blabla,null,null,..]
df.printSchema
|-- source: string (nullable = true)
|-- b1: string (nullable = true)
|-- b2: string (nullable = true)
|-- b3: long (nullable = true)
|-- amount: decimal(30,2) (nullable = true)
and so on
感謝
如果向我們展示RDD的內容和預期輸出,它可能很有用:) – zero323
它仍然沒有意義。這裏究竟代表着什麼? – zero323