我正在使用Kafka處理日誌事件。我對Kafka Connect和Kafka Streams有簡單連接器和流轉換的基本知識。Kafka將單個日誌事件行聚合到組合日誌事件中
現在我有具有以下結構的日誌文件:
timestamp event_id event
日誌事件具有由event_id的連接的多個日誌行(例如,郵件日誌)
實施例:
1234 1 START
1235 1 INFO1
1236 1 INFO2
1237 1 END
而且一般有多個事件:
Examp勒:
1234 1 START
1234 2 START
1235 1 INFO1
1236 1 INFO2
1236 2 INFO3
1237 1 END
1237 2 END
的時間窗口(開始和結束之間)可達到5分鐘。
至於結果我要像
event_id combined_log
例的話題:
1 START,INFO1,INFO2,END
2 START,INFO2,END
什麼是實現這一目標的正確的工具?我試圖用卡夫卡流解決它,但我可以弄清楚如何...
感謝您的回答,我會看看Processor API。是的,訂單問題也應該考慮。 – imehl
處理器API是解決方案 - 再次感謝! – imehl
@imehl:或許您想更新您的問題,並提供一些信息,說明您最終做了什麼來解決您的問題,現在您找到了解決方案? –