我在主節點上的OOM之後遇到了Kubernetes問題。 Kubernetes服務看起來不錯,日誌中沒有任何錯誤或警告消息。但Kubernetes未能處理新的部署,這是在OOM發生後創建的。OOM後Kubernetes中斷
我通過systemctl restart kube-*
重新加載了Kubernetes。它解決了這個問題,Kubernetes開始正常工作。
我只是想知道它是否預期Kubernetes的行爲或錯誤?
我在主節點上的OOM之後遇到了Kubernetes問題。 Kubernetes服務看起來不錯,日誌中沒有任何錯誤或警告消息。但Kubernetes未能處理新的部署,這是在OOM發生後創建的。OOM後Kubernetes中斷
我通過systemctl restart kube-*
重新加載了Kubernetes。它解決了這個問題,Kubernetes開始正常工作。
我只是想知道它是否預期Kubernetes的行爲或錯誤?
看來問題不是由OOM造成的。它是由kube-controller引起的,無論OOM是否發生。
如果我重新啓動kube-controller,Kubernetes通常會開始處理部署和pod。
如果你能分享kube-controller的日誌,那將是非常棒的。但是,當api服務器崩潰/ OOMKilled時,在早期版本的kubernetes中可能會出現潛在的同步問題(我記得我們看到了類似daemonset的問題,並且我向Kubernete社區提交了bug),但很少見。與此同時,我們做了大量的工作來完成kubernetes的生產:既調整kubernetes並製作其他需要與kubernetes交談的微服務。希望這些博客文章,將有助於:
https://applatix.com/making-kubernetes-production-ready-part-2/這是關於30 +旋鈕我們用來調整kubernetes
https://applatix.com/making-kubernetes-production-ready-part-3/這是關於微服務行爲,確保集羣的穩定性
「但Kubernetes無法處理新的部署,這是在OOM發生後創建的。「 - 無法處理'deployment'時,事件/日誌是什麼? – surajd