我正在嘗試整合Spark/Kafka來構建流媒體應用程序。 Kakfa版本:0.9 spark:1.6.2SparkStreaming/Kafka膠印處理
如何處理RDD批處理數據後的偏移量。
你能否給我更多關於處理偏移量的見解?
火花內置了自動存儲和讀取偏移嗎?還是我需要引導火花來讀取某些商店(如mongo或oracle)的偏移量?
JavaInputDStream<String> directKafkaStream = KafkaUtils.createDirectStream(jsc, String.class, String.class,
StringDecoder.class, StringDecoder.class, String.class, kafkaParams, topicMap,
(Function<MessageAndMetadata<String, String>, String>) MessageAndMetadata::message);
directKafkaStream.foreachRDD(rdd -> {
這個答案是非常廣泛的,更超過它只是火花文檔的副本! – avr