我想知道什麼對我最好:卡夫卡流或卡夫卡消費者API或卡夫卡連接?我應該使用什麼:卡夫卡流或卡夫卡消費者API或卡夫卡連接
我想從主題讀取數據,然後做一些處理並寫入數據庫。所以我寫了消費者,但我覺得我可以編寫Kafka流應用程序,並使用它的有狀態處理器執行任何更改並將其寫入數據庫,這可以消除我的使用者代碼,並且只需編寫db代碼。
數據庫我想插入我的記錄是: HDFS - (插入生JSON) MSSQL - (處理JSON)
另一種選擇是卡夫卡連接,但我發現沒有JSON支持,目前爲hdfs接收器和jdbc接收器連接器(我不想寫在avro中)並且創建模式也是複雜的嵌套消息的痛苦。
或者我應該寫自定義卡夫卡連接來做到這一點。
因此,需要您對我是否應該寫卡夫卡消費者或卡夫卡流或卡夫卡連接的意見? 在性能方面什麼會更好,開銷更少?
我曾嘗試HDFS宿JSON,但不能使用** org.apache。 kafka.connect.json.JsonConverter **但是當我** org.apache.kafka.connect.storage.StringConverter **它可以工作,但是它以字符串轉義格式寫入json對象。 例如。 ** {「name」:「hello」} **被寫入hdfs中作爲**「{\」name \「:\」hello \「}」** –
所以我需要有人專家來建議我是否應該寫同樣的與kafka消費者或kafka流或自定義kafka連接。 –
我想要做的處理是基本驗證和少量字段值轉換。 –