我想要更好地將Dataframe轉換爲RDD。現在我正在將數據幀轉換爲集合和循環集合以準備RDD。但我們知道循環不是好的做法。在斯卡拉轉換火花數據幀到RDD
val randomProduct = scala.collection.mutable.MutableList[Product]()
val results = hiveContext.sql("select id,value from details");
val collection = results.collect();
var i = 0;
results.collect.foreach(t => {
val product = new Product(collection(i)(0).asInstanceOf[Long], collection(i)(1).asInstanceOf[String]);
i = i+ 1;
randomProduct += product
})
randomProduct
//returns RDD[Product]
請建議我做這適用於大數據量的標準是穩定&格式。
第一筆鉅額的數據和收集的不是很好的朋友,其次,爲什麼?你在做什麼:「轉換+ ???」? – eliasah
謝謝eliasah。我需要RDD [Product],我將用它來對此應用一些規則。 –