我使用Spark Streaming v2.0.0從Kafka檢索日誌並進行一些操作。我正在使用功能mapWithState
以保存和更新與設備相關的某些字段。我想知道這個函數如何在集羣中工作。事實上,我現在只是使用獨立模式,但稍後我會嘗試使用Yarn羣集。Spark Streaming:mapWithState函數如何在集羣中工作?
但是,假設我有一個有多個節點的集羣,如果一個節點更新設備的狀態,他是否立即通知此更新的所有其他節點?如果否,則需要設置羣集中的mapWithState
函數。我該怎麼做?
謝謝Yuval,這非常清楚! –
Hi Yuval,你有關於HashPartitioner的任何文檔。我只有這個鏈接,但我不明白它是如何工作的。 http://spark.apache.org/docs/2.0.2/api/java/index.html?org/apache/spark/HashPartitioner.html –
http://stackoverflow.com/questions/31424396/how-does- hashpartitioner-work –