我已經在AWS上設置了一個示例Kafka集羣,並試圖通過給定的配置來確定最大吞吐量。我目前正在爲此分析提供此處提供的帖子。爲吞吐量縮放卡夫卡
我將不勝感激,如果你能澄清以下問題。
我觀察到具有給定硬件的大小爲512字節(單個生產者 - 單個消費者)的消息的吞吐量爲40MB/s。假設我需要達到80MB/s的吞吐量。
正如我理解的一種方法來增加每個主題的分區數量並增加生產者和消費者的線程數量。 (假設我不更改批量大小,壓縮比等的默認值)
- 如何在給定硬件上找到可能的最大吞吐量?如果要進一步提高吞吐量,我們需要改進我們的硬件資源。
(換句話說如何做出決定「,其中X GB RAM和Y GB的磁盤空間,這是我能做到的最大吞吐量。如果我需要進一步提高我不得不RAM升級到XX GB吞吐量磁盤空間爲YY GB「)
2.我們是否應該垂直或水平縮放集羣?什麼是推薦的方法?
謝謝。