1
我如何轉換的RDD具有以下結構轉變爲數據幀中階轉換一個RDD成數據幀星火
org.apache.spark.rdd.RDD[(Long, org.apache.spark.mllib.linalg.Vector)] = MapPartitionsRDD[42]
這裏RDD的每一行都包含一個索引Long
和矢量org.apache.spark.mllib.linalg.Vector
。
我想將org.apache.spark.mllib.linalg.Vector
的每個組件放在一行數據框的單獨列中。
您是否嘗試過使用rdd.toDF()?它隱含在 –
@AndreiT。它不會創建我想要的數據框,我想將'org.apache.spark.mllib.linalg.Vector'的每個組件放在單獨的列中。 –
矢量有多少條目? –