如何處理負載尖峯並排隊請求？

在Kubernetes中是否有配置，我可以在新實例生成之前指定要排隊的最小請求數？如何處理負載尖峯並排隊請求？

這是上下文：我們已經爲我們的用例設置了強大的高CPU機器，並且每個請求都在服務器上承擔了大量的負載。一切工作完美，直到我們達到具體的數字說300 ... 100毫秒的加速時間的請求。從那時起，我們正在接收連接被拒絕的錯誤一段時間，然後服務器開始處理它們，一旦產生新的機器。處理負載尖峯的最佳方法是什麼？我正在尋找應用引擎中的「等待延遲」配置。我的應用程序部署在Google計算引擎上，由Kubernetes編排。

來源

2016-09-07 Rakesh Vidya Chandra

您可以使用readinessProbe（見container probes），以指示容器準備好服務請求，並使用HorizontalPodAutoscaler來自動調整你的應用程序上/下根據觀察到的CPU利用率。希望這可以幫助。

來源

2016-09-08 00:25:04 janetkuo

如果我只想在探測成功時開始將流量發送到某個窗格，我將指定一個ReadinessProbe。如果探測器失敗並且現有的其他Pod無法處理更多請求，該怎麼辦？有一些排隊必須扮演其角色來處理所有請求的地方。 –

如何處理負載尖峯並排隊請求？

回答

相關問題