使用JSON生成/使用來自Kafka的卡。使用下面的屬性保存到HDFS在JSON:使用JsonConverter的Kafka Connect HDS Sink for JSON格式
key.converter=org.apache.kafka.connect.json.JsonConverter
value.converter=org.apache.kafka.connect.json.JsonConverter
key.converter.schemas.enable=false
value.converter.schemas.enable=false
監製:
curl -X POST -H "Content-Type: application/vnd.kafka.json.v1+json" \
--data '{"schema": {"type": "boolean", "optional": false, "name": "bool", "version": 2, "doc": "the documentation", "parameters": {"foo": "bar" }}, "payload": true }' "http://localhost:8082/topics/test_hdfs_json"
消費者:
./bin/connect-standalone etc/schema-registry/connect-avro-standalone.properties etc/kafka-connect-hdfs/quickstart-hdfs.properties
問題1:
key.converter.schemas.enable=true
value.converter.schemas.enable=true
獲取異常:
org.apache.kafka.connect.errors.DataException: JsonDeserializer with schemas.enable requires "schema" and "payload" fields and may not contain additional fields
at org.apache.kafka.connect.json.JsonConverter.toConnectData(JsonConverter.java:332)
問題2:
啓用上述兩個屬性不拋出任何問題,但沒有數據寫入了HDFS。
任何建議將高度讚賞。
感謝
感謝您的建議! –
@dawsaw你知道這樣的擴展是否可以使用本地kafka connect api實現? –
有一個已經與Kafka一起出貨的JsonConverter。我認爲這裏的問題是特定於HDFS連接器的輸出格式,這必然意味着擴展連接器,如果我已經正確理解了您的問題,則本身不會在Connect本身做任何事情。 – dawsaw