我需要處理高峯期每秒100秒的記錄。這些記錄是簡單的JSON體,它們應該被收集,然後處理/轉換成數據庫。Kinesis是我需要的正確工具嗎? (和其他各種問題)
的幾個問題...
1)是該室壁運動吧?或者SQS更適合?
2)當使用kinesis時,我想使用如下所示的python示例:https://aws.amazon.com/blogs/big-data/snakes-in-the-stream-feeding-and-eating-amazon-kinesis-streams-with-python/還是應該在KCL中實現我的生產者和消費者?有什麼不同?
3)Kinesis是否向消費者的管理提供任何東西,或者我只是在EC2實例上運行它們並自己管理它們?
4)什麼是訪問數據的正確模式 - 我不能錯過任何記錄,所以我假設我會從「TRIM_HORIZON」而不是「最新」獲取記錄。如果是這樣,我如何管理重複?換句話說,我的消費者如何從流中獲取記錄並處理消費者的關注等,並且始終知道他們正在獲取所有記錄?
謝謝!
你打算做什麼樣的處理?你關心維護他們訂單的消息嗎? –
嗨 - 消息不必維護訂單,消費者所做的唯一處理就是轉換爲不同的格式並轉發到其他服務。 –