關於如何在pyspark 1.6.1中將rdd轉換爲數據幀並將數據幀轉換回rdd的任何示例? toDF()
不能在1.6.1中使用?如何在pyspark 1.6.1中將rdd轉換爲數據框?
例如,我有一個這樣的RDD:
data = sc.parallelize([('a','b','c', 1,4), ('o','u','w', 9,3), ('s','q','a', 8,6), ('l','g','z', 8,3), \
('a','b','c', 9,8), ('s','q','a', 10,10), ('l','g','z', 20,20), ('o','u','w', 77,77)])