1
我想簡單的文件使用Sparkstreaming流例如(火花streaming_2.10,版本:1.5.1)星火FileStreaming問題
public class DStreamExample {
public static void main(final String[] args) {
final SparkConf sparkConf = new SparkConf();
sparkConf.setAppName("SparkJob");
sparkConf.setMaster("local[4]"); // for local
final JavaSparkContext sc = new JavaSparkContext(sparkConf);
final JavaStreamingContext ssc = new JavaStreamingContext(sc,
new Duration(2000));
final JavaDStream<String> lines = ssc.textFileStream("/opt/test/");
lines.print();
ssc.start();
ssc.awaitTermination();
}
}
當我運行單個文件或主管該代碼它不打印任何東西從文件中,我在日誌中看到它不斷輪詢,但沒有打印任何內容。這個程序運行時,我嘗試將文件移動到目錄。
有什麼我失蹤?我嘗試在線路RDD上應用地圖功能,這也不起作用。
感謝您迴應!現在,當我修改文件內容並移至監控目錄時,Sparkstreaming正在選擇要處理的文件。 – Ravi