AWS ElasticSearch加載流式數據

我在跟隨此guide將實時Web流量數據加載到S3中，將Lambda配置爲加載到ES域索引中。目前對於每條記錄，我在S3存儲桶中創建一個名爲{GUID} .json的新json文件，該文件只包含一行。例如：AWS ElasticSearch加載流式數據

{"email":"[email protected]","firstname":"Hello","lastname":"World"}

所以，當這正式上線，這將上傳數以百萬計的JSON文件S3桶然後得到通過lambda函數推入ES。這是加載流數據的正確方法嗎？或者我應該制定一個計劃流程來每小時彙總多個記錄，例如每個json文件記錄10k條記錄，然後上傳到S3存儲桶？我覺得這在技術上不是「實時流媒體」。

有什麼建議嗎？

來源

2016-09-14 Bo Hu

您是否嘗試過使用AWS Kinesis Firehose將流數據加載到ElasticSearch？

參考：https://aws.amazon.com/kinesis/firehose/firehose-to-elasticsearch-service/

它將採取大多需要離開您的最終努力。

來源

2016-11-14 16:15:16 R45c4l

問候。請查看[Take a tour]（http://stackoverflow.com/tour）和[你的回答在另一個城堡中：何時答案不是答案]（http://meta.stackexchange.com/questions/225370 ）瞭解爲什麼只有鏈接的答案不是答案。只需稍作修改即可改善您的答案。謝謝。 – Drew

AWS ElasticSearch加載流式數據

回答

相關問題