2
val ordersRDD = sc.textFile("/user/cloudera/sqoop_import/orders");
val ordersRDDStatus = ordersRDD.map(rec => (rec.split(",")(3), 1));
val countOrdersStatus = ordersRDDStatus.countByKey();
val output = countOrdersStatus.map(input => input._1 + "\t" + input._2);
如何在spark-scala中保存Iterable [String]的輸出到hdfs。 可迭代[字符串]如何在spark-scala中保存Iterable [String]到hdfs
注:輸出中不是一個RDD(我不能使用output.saveAsTextFile(「HDFS路徑」)
上面的代碼工作得很好。謝謝。 – Anhata