2017-07-10 74 views

回答

2

您可以將RDD轉換爲DataFrame然後保存。

data.toDF().write.format("orc").save("/path/to/save/file") 

讀回,用sqlContext

import org.apache.spark.sql._ 
val sqlContext = new org.apache.spark.sql.hive.HiveContext(sc) 

val data = sqlContext.read.format("orc").load("/path/to/file/*") 
相關問題