0
我正在使用Dstream(Spark Streaming)的Transform API對數據進行排序。 我正在使用netcat從TCP套接字讀取數據。 繼使用的代碼行: myDStream.transform(rdd => rdd.sortByKey())sortByKey不適用於Dstream
無法找到函數sortByKey。任何人都可以請幫助這一步中的問題是什麼?
我正在使用Dstream(Spark Streaming)的Transform API對數據進行排序。 我正在使用netcat從TCP套接字讀取數據。 繼使用的代碼行: myDStream.transform(rdd => rdd.sortByKey())sortByKey不適用於Dstream
無法找到函數sortByKey。任何人都可以請幫助這一步中的問題是什麼?
如果您使用netcat
作爲輸入,您可能會使用socketTextStream
,它返回ReceiverInputDStream[String]
。在這種情況下transform
將採取功能:
(RDD[String]) => RDD[U]
只有RDD[(T, U)]
,其中T
有相應Orderign
可以sortedByKey
。其他RDD
你可以使用sortBy
:
myDSTream.transform(rdd => rdd.sortBy(x => x))
我沒有得到,我剛剛開始學習火花流。你能否提出更詳盡的闡述? –