2017-06-14 169 views
1

我想避免將整個流寫入文件,然後將其加載到數據框。什麼是正確的方式?Spark從InputStream創建一個數據幀?

+0

火花流? –

+0

https://spark.apache.org/docs/latest/api/scala/index.html#[email protected](path:String,minPartitions:Int):org.apache.spark.rdd。 RDD [String] – Reactormonk

+0

@Reactormonk,此API在hdfs中獲取路徑,而不是流。 – Raytracer

回答

1

您可以檢查Spark StreamingsqlnetworkWordCount這也解釋了,你的問題可以通過創建的SparkSessionsingleton instance通過使用SparkStreamingSparkContext來解決。

你應該有更好的想法,通過以上鍊接dataframes創建從streaming rdd