我想從DStream中刪除前n個RDD。我嘗試使用以下函數與轉換,但它不起作用(錯誤OneForOneStrategy:org.apache.spark.SparkContext java.io.NotSerializableException),我不認爲它會完成我的真正目標,刪除RDDs,因爲它會返回空的。如何從Spark Streaming中的DStream中刪除RDD?
var num = 0
def dropNrdds(myRDD: RDD[(String, Int)], dropNum: Int) : RDD[(String, Int)] = {
if (num < dropNum) {
num = num + 1
return myRDD
}
else {
return sc.makeRDD(Seq())
}
}
有沒有辦法切掉前n個窗口,但仍然得到流的其餘部分?我看着那個函數,我想我必須指定切片的結束。我的動機是:http://stackoverflow.com/questions/26445407/how-can-i-perform-an-operation-on-two-windowed-dstreams-with-an-offset – Zatricion 2014-10-28 17:32:23
還是有一種方法,我可以保持跟蹤我所做的切片,並隨着事物被添加到輸入流而繼續移動它? – Zatricion 2014-10-29 04:22:52