0
嗨,我是Pyspark Streaming的新手。Pyspark流式轉換錯誤
numbers0 = sc.parallelize([1,2,3,4,5])
numbers1 = sc.parallelize([2,3,4,5,6])
numbers2 = sc.parallelize([3,4,5,6,7])
stream0 = ssc.queueStream([numbers0, numbers1, numbers2])
stream0.pprint()
ssc.start()
ssc.awaitTermination(20)
ssc.stop()
這工作得很好,但只要我做了以下我得到一個錯誤:
stream1 = stream0.transform(lambda x: x.mean())
stream1.pprint()
ssc.start()
ssc.awaitTermination(20)
ssc.stop()
我要的是數據流只由我以前流的平均值。 有誰知道我必須做什麼?
有什麼錯誤? –
通過這種方式使用變換,您將有3個條目是每個RDD的手段。 –