1
我有一個類型爲[String,ArrayList [String]]的DStream,我想將此DStream轉換爲avro格式並將其保存爲hdfs。我怎麼能做到這一點?如何將DStream轉換爲avro格式並保存在hdfs中的文件
我有一個類型爲[String,ArrayList [String]]的DStream,我想將此DStream轉換爲avro格式並將其保存爲hdfs。我怎麼能做到這一點?如何將DStream轉換爲avro格式並保存在hdfs中的文件
您可以將您的流轉換爲JavaRDD或將其轉換爲DataFrame並將其寫入文件並提供Avro格式。
// Apply a schema to an RDD
DataFrame booksDF = sqlContext.createDataFrame(books, Books.class);
booksDF.write()
.format("com.databricks.spark.avro")
.save("/output");
更多示例請訪問Accessing Avro Data Files From Spark SQL。
希望這有助於。
DataFrame booksDF = sqlContext.createDataFrame(books,Books.class);這裏顯示的是nullpointerException,在我已經提供dstream.getClass()類的字段中,現在我已經轉換了我的dstream或類型[GenericData.Record],所以如果你可以在該上下文中回答將會很有幫助 – JSR29