2
我有一個並行度爲8的DataStream。我將兩個接收器添加到DataStream中。一個很慢(Elasticsearch),另一個很快(HDFS)。但是,我的事件只會在被刷新到ES後寫入HDFS,因此ES需要的時間比無ES的時間要長。如何在Apache Flink中並行寫入接收器
dataStream.setParallelism(8);
dataStream.addSink(elasticsearchSink);
dataStream.addSink(hdfsSink);
在我看來,這兩個匯使用相同的線程。是否可以通過使用與兩個接收器相同的源,或者是否必須添加另一個作業(一個用於earch接收器)以並行寫入輸出?
我檢查了Map(1/8)到Map(8/8)正在部署和接收數據的日誌。
考慮到背壓使我趨向於同一個方向,謝謝澄清。 –