0
我在跟隨此guide將實時Web流量數據加載到S3中,將Lambda配置爲加載到ES域索引中。目前對於每條記錄,我在S3存儲桶中創建一個名爲{GUID} .json的新json文件,該文件只包含一行。例如:AWS ElasticSearch加載流式數據
{"email":"[email protected]","firstname":"Hello","lastname":"World"}
所以,當這正式上線,這將上傳數以百萬計的JSON文件S3桶然後得到通過lambda函數推入ES。這是加載流數據的正確方法嗎?或者我應該制定一個計劃流程來每小時彙總多個記錄,例如每個json文件記錄10k條記錄,然後上傳到S3存儲桶?我覺得這在技術上不是「實時流媒體」。
有什麼建議嗎?
問候。請查看[Take a tour](http://stackoverflow.com/tour)和[你的回答在另一個城堡中:何時答案不是答案](http://meta.stackexchange.com/questions/225370 )瞭解爲什麼只有鏈接的答案不是答案。只需稍作修改即可改善您的答案。謝謝。 – Drew