我在讀this SO answer和許多這樣的博客。多個消費羣體消費者如何在卡夫卡的同一主題上跨越分區工作?
我所知道的:
多的消費者可以運行多個消費者在使用多個消費羣ID,並從消費羣體只有一個消費者可以從一個分區給定的時間消耗在單個分區上運行。
我的問題是從多的消費羣體從同一主題消費相關多個消費者:
在多種消費(不同組)的情況下,會發生什麼耗時一個主題(最終是同一個分區)?
他們是否得到相同的數據?
如何管理偏移量?每個消費者是否分開?
(可能是基於意見)您或一般推薦的方式是如何處理在單個分區上運行的單獨組的兩個使用者之間的重疊數據?
編輯: 「重疊數據」:指兩個消費者在同一分區獲得相同數據進行操作單獨的消費羣。
感謝您的回覆。你能建議如何處理第四個問題嗎? –
你能解釋一下「重疊數據」的含義嗎? –
如果爲了提高性能,我決定在一個分區上使用來自不同用戶組的兩位消費者。那麼,如果單獨的消費者羣體的消費者獲得相同的數據如何處理這種數據冗餘,並確保每個消息在兩個消費者中只處理一次? –