我想寫通過流水從S3存儲流數據到紅移的數據是實時流式傳輸(每分鐘600個文件),我不希望任何形式的數據丟失。有沒有辦法將數據放入S3存儲桶的Kinesis Firehose中?
如何把從S3到數據的Kinesis流水?
我想寫通過流水從S3存儲流數據到紅移的數據是實時流式傳輸(每分鐘600個文件),我不希望任何形式的數據丟失。有沒有辦法將數據放入S3存儲桶的Kinesis Firehose中?
如何把從S3到數據的Kinesis流水?
它實際上專門做相反,流水發送傳入數據流到亞馬遜S3不從亞馬遜S3和S3相比其它可將數據發送到像紅移和Elasticsearch服務等服務。
我不知道這是否會解決您的問題,但你可以使用COPY from S3紅移。
希望這將有助於!
看來,你的情況是:
有兩種基本你能方式執行此操作:
坦率地說,有什麼好處在通過室壁運動流水發送,因爲室壁運動只會批它,將其存儲到臨時S3文件,然後將其加載到紅移。因此,這不是一個有益的方法。
相反,我會建議:
這是一個簡單的,鬆耦合的解決方案,這將是比流水的方法更簡單(這需要以某種方式讀取每個列出的文件文件並將內容發送到Firehose)。
歡迎計算器! 「來自S3存儲桶的數據流」是什麼意思?數據如何發送到S3?有沒有可能將發送實體更改爲Firehose而不是S3?一旦進入Firehose,你將如何處理這些數據? –
數據來自SFTP服務器,一旦數據進入S3,我想將它存儲在Redshift中。爲了避免數據丟失,我想將數據放入流水流中,然後存儲到Redshift中。 – Vignesh