0
我有一個遠程服務器生成文件。服務器將文件每15分鐘推送到hadoop羣集。這些文件存儲在一個特定的目錄中。我們使用flume從本地目錄讀取文件並將它們發送到HDFS。但是,SpoolDir適合處理數據。Spooldir源碼停止處理
問題是當文件被寫入目錄時flume關閉處理。
我不知道如何使flume spooldir wait
完成寫入文件,然後處理它。 或者如何使用腳本外殼或處理器在完全寫入之前阻止讀取文件。
有人可以幫助我!