我在我的系統上運行了< 24次檢查。服務器並不經常負載過重。在正常操作期間,負載平均值保持在1以下。Sensu Scheduler奇數
我已經注意到一個重新發生的問題,其中check-cpu檢查將開始在系統中觸發高負載平均數,而高負載沒有任何有機原因。進一步調查顯示,高負載報告實際上是由於check-cpu腳本與其他檢查並行運行。在執行檢查之外,CPU負載很好。
我從sensu 0.20升級到0.23並繼續觀察相同的問題。
我們發現sensu-server和sensu-client服務的重新啓動可以解決問題一段時間(大約24小時),然後它將返回。
我們在這個理論上,在主機上的檢查的調度/執行中必定存在某種時間延遲,這會導致這種重疊最終發生。
所有檢查都設置爲30或60
我決定退房CPU檢查的間隔設置爲83區間運行,至今未發生問題。可能是因爲check-cpu檢查與其他任何人不一致,因此在短時間內沒有看到高CPU負載。
這是某種固有的調度問題與sensu?是否應該知道如何發送具有足夠間距的檢查,或者這是應該由interval參數控制的東西嗎?
謝謝!
由於類似的原因,我們在不同的,非對齊的間隔運行我們的支票。而不是每30秒。 –