我在Apache NiFi中使用Kafka作爲緩衝系統創建數據攝取工作流程。我有一個3節點集羣運行相同的工作流程,每個節點有4個核心。由Kafka引起的NiFi工作流程中的瓶頸
我依賴於將數據移入和移出不同卡夫卡主題的幾個實例,這是工作流程中速度最慢的部分,並且性能方面非常不一致,因爲兩個相同的測試可能會有高達100%工期增加。
我們的發佈和使用Kafka處理器正在所有三個節點上運行,而我們的Kafka主題在三個經紀人中有3個分區。
有沒有人有任何想法會導致這種不一致,以及我能做些什麼來緩解它並加快工作流程?
我們需要更多的細節... NiFi的版本是什麼?什麼版本的卡夫卡經紀人?什麼版本的Kafka處理器(0.9 vs 0.10)?你在PublishKafka前看到了流文件的構建,或者什麼是慢?您是否一次發佈並使用一條消息? –
NiFi版本1.1.0,Kafka版本0.10.1.2.1,0.10 kafka處理器,在發佈kafka之前在隊列中建立文件,消耗kafka沒有按照需要快速返回文件,我相信它正在發佈和使用1個文件一段時間,不包括具體的批量邏輯。 – TomRobson