2016-10-22 78 views
2

我有以下設置:爲N1-標準1實例爲什麼我的GCE實例每6小時自動重啓?

  1. 實例模板,HTTP(S)訪問,對SSD硬盤
  2. 實例組命名端口80/443,開啓自動調整大小on最小/最大= 2/10個實例,目標CPU = 60%,冷卻= 60s,初始延遲= 600s
  3. 端口80每10秒進行一次組嘗試, (S)負載均衡器作爲HTTP後端,最大CPU = 80%,運行狀況檢查與以上定義的組相同

其他一切都是默認值。我從我的圖表中看到,我的兩個實例經常重新啓動,原因不明。這兩個實例都是每6小時重新啓動一次,但相隔一個小時,所以它們至少永遠不會同時下降。實例模板由自動縮放組以外的幾個月可靠運行的實例(即沒有常規,無法解釋的重新啓動)的磁盤構成。我從來沒有見過我的一個實例在LB儀表板中被列爲不健康的,但是如果我不得不猜測,我會猜測我的健康檢查配置不正確。謝謝。

運行「gcloud compute operations list」會產生類型爲「compute.instances.repair.recreateInstance」的事件,它與週期性重新啓動完全一致。我不知道爲什麼會發生這種情況,還沒有找到任何線索搜索。

回答

1

您的實例重新啓動,因爲它們可能不健康。請檢查BackendSevrice.GetHealth(group)是否爲所有實例返回HEALTHY。如果沒有,這可能是你的服務器的情況,以及在範圍130.211.0.0/22(https://cloud.google.com/compute/docs/load-balancing/health-checks

+0

防火牆錯誤配置感謝您的調試步驟。這個問題本身就消失了,但如果它再次出現,我會試試這個。那天發生了大規模的協調DDoS攻擊,可能導致了不尋常的網絡延遲。 –

相關問題