2016-09-28 91 views
1

TLDR:什麼是我應該等待多長時間的上限?保證 GCE實例是否已從負載平衡路徑中刪除並可以安全刪除?GCP HTTPS負載均衡:何時可以安全刪除實例?


詳情:我有一個比較標準的設置:一個管理實例組在GCE情況下,在他們面前的全局HTTPS負載平衡器指向只有一個後端服務管理的實例組中它。健康檢查標準爲5秒超時,5秒不健康閾值,2次連續失敗,2次連續成功。

我部署了一些新實例,將它們添加到實例組中,並刪除舊實例。幾分鐘後(通常10-15分鐘),我刪除舊的實例。

每隔一段時間,我注意到刪除舊實例(我認爲它們不再接收流量)與客戶端的偶發502響應相關,只能在負載均衡器級別日誌中看到:

我已經做了一堆日誌關聯和tcpdumping和負載測試是相當有信心,這502沒有被新的,健康的實例中的一個服務。在任何情況下,我的問題是:

什麼是上限,我應該等待多長時間,以保證一個GCE實例已經從負載均衡路徑中去除,可以安全地刪除?

+0

啓用連接刪除https://cloud.google.com/compute/docs/load-balancing/enable-connection-draining – Dagang

回答

0

爲了回答我自己的問題:事實證明,這些502與關閉實例無關,10分鐘有足夠的時間從服務路徑中移除實例。 502s是由nginx超時和GCP的HTTP(S)負載平衡器超時之間的競爭條件引起的 - 我已經在此處寫了一篇完整的博客文章:Tuning NGINX behind Google Cloud Platform HTTP(S) Load Balancer