2015-09-08 45 views
0

我們已經使用Hazelcast 3.4.2創建了一個具有三個節點的羣集,並且我有 以下問題。當一個節點產生OOM時,羣集變得無響應

如果一個節點進入OOM,則其他節點變爲無響應。然而,有時候那些節點 (除去去OOM的節點)管理恢復,但恢復時間不可預測。

此外,我們添加了以下兩個Hazelcast屬性作爲JVM參數。但是,問題依然存在於羣集中。

  1. hazelcast.client.heartbeat.timeout
  2. hazelcast.max.no.heartbeat.seconds

的是,集羣是由上述兩種Hazelcast屬性來給幾個不同的值多次啓動請節點。

所以我想知道,這是否是一個知識問題。此外,如果上述情況 是一個知識問題,我們是否有解決此問題的方法。

感謝

回答

0

做你的成員有足夠的空間?當一個成員出現故障時,相同數量的數據必須分配給較少的成員。這可能會對他們造成內存壓力。我建議啓用詳細的GC日誌並測試您的方案。