3
我正在構建作用於多個流的Apache Spark應用程序。Spark流和高可用性
我並閱讀文檔的性能調優部分: http://spark.apache.org/docs/latest/streaming-programming-guide.html#performance-tuning
我沒有得到的是:
1)位於多個工作節點的流媒體接收器或者是驅動程序的機器?
2)如果接收數據的節點中的一個出現故障,會發生什麼(電源關閉/重啓)
好的,所以如果帶接收器的工人將被殺死 - 驅動程序將重新實例化接收器,並且新工人將再次開始接收數據 - 所有這一切都會自動進行。這聽起來很合理,但它是否在某處被記錄? –
@PiotrR我認爲你是[尋找這個](http://spark.apache.org/docs/latest/streaming-programming-guide.html#fault-tolerance-semantics) –