1
我有一個從Kafka主題讀取的應用程序。現在,我需要使用Kafka連接器將這些文件發送到HDFS: http://docs.confluent.io/2.0.0/connect/connect-hdfs/docs/index.html是否有Kafka Connect Python客戶端?
有相同的命令。我想知道如何在Python腳本中完成這項工作。提前致謝!
我有一個從Kafka主題讀取的應用程序。現在,我需要使用Kafka連接器將這些文件發送到HDFS: http://docs.confluent.io/2.0.0/connect/connect-hdfs/docs/index.html是否有Kafka Connect Python客戶端?
有相同的命令。我想知道如何在Python腳本中完成這項工作。提前致謝!
如果您使用Connect的distributed mode,則可以使用類似requests的庫來撥打REST API調用。你只需POST
到connectors資源與配置,並將啓動連接器。
嗨Ewen!感謝我們的迴應。我試過這個: localhost是我的引導服務器和zookeeper (分別爲9092和2181個端口)。但我得到連接錯誤。 'File「/usr/lib/python2.6/site-packages/requests/adapters.py」,第413行,發送 raise ConnectionError(err,request = request) requests.exceptions.ConnectionError :('連接中止',錯誤(111,'拒絕連接'))' – NoName
您可能沒有在正確的端口上發出請求。由於您剛剛使用'http:// localhost/connector',因此您正在對端口80發出請求。默認情況下,REST API會在8083上偵聽,因此您可能需要'http:// localhost:8083/connectors' –
Hello Ewen,感謝您的解決方案。我嘗試過,但運行'bin/connect-distributed.sh config/connect-distributed.properties'時出現以下錯誤: 'ERROR牧民工作線程中未捕獲的異常,退出:(org.apache.kafka.connect。 runtime.distributed.DistributedHerder:183) org.apache.kafka.common.errors.TimeoutException:超時時提取主題元數據' 而我的腳本返回'' –
NoName