0
我有一個應用程序每天或每小時或者隨機地向S3寫入數據,另一個應用程序將數據從S3讀取到本地HBase。有沒有什麼辦法可以告訴最後一次更新上傳的文件是什麼,然後再讀取文件,換句話說,增量複製文件?將文件從S3增量複製到本地hdfs
例如: 第1天:App1將文件1,2,3寫入文件夾1; App2將這3個文件讀取到HBase; 第4天:App1寫入文件4 & 5至文件夾1,6,7,8至文件夾2; APP2需要從文件夾中讀出從文件夾1 4 & 5,然後6,7,8 2.
感謝