2016-04-01 23 views

回答

1

明白了火花1.5 ..它的作品,但它僅挑選其時間戳等於當前時間戳的文件。

對於實例

臨時文件夾:文件f.txt(時間戳T1:當文件被創建)

星火輸入文件夾:/輸入

當你做一個MV(Hadoop的FS - mv /temp/f.txt/input):Spark不會選擇

但是在移動之後如果你改變移動文件的時間戳,spark會選擇。

https://github.com/apache/spark/blob/master/streaming/src/main/scala/org/apache/spark/streaming/dstream/FileInputDStream.scala

不得不檢查火花的源代碼。