2016-08-30 25 views
6

我正在使用最新的sensu核心版本0.26.1,在一臺CentOS機器上設置了sensu服務器,在另一臺CentOS機器上設置了一個sensu客戶端。感知客戶端錯誤「正在執行上一個檢查命令」

有在一個意義上的客戶端500的檢查,我保持意義上-client.log看到"previous check command execution in progress",但每個檢查實際上完成非常快(大部分小於0.1秒和間隔爲60秒) ,我可以通過在sensu用戶sudo su sensu -c "{run my check}"下運行來確認。

然而,實際情況是,在團扇儀表盤,它顯示我的許多檢查正在運行超過1分鐘,似乎意義上的客戶端得到了認真卡/慢,我嘗試以下方法:

  1. 刪除一些長期運行的檢查,並重新啓動意義上的服務器/客戶端
  2. 添加timeout定義我的支票,限制超時爲10,則導致許多支票的「執行超時」
  3. 我試過只運行1,10,50的檢查,似乎一切正常,但是,只要檢查的次數達到一定數量可能200-300,就會出現問題。

上述兩個都沒有工作,有沒有辦法調試哪些檢查實際上阻止?或者,我可以將Sensu配置爲僅在超過定義的timeout時終止支票?所以,我不會看到日誌「正在進行上次檢查命令執行」

我被封鎖此此消息,並需要幫助:)

回答

1

要調試這一點,你可以明顯地檢查意義上,client.log 。 您可以設置在意義上

除此之外默認文件的日誌級別:ps aux | grep sensu會告訴你,每一個檢查將顯示爲一個單獨的進程,你可以很容易地手動確認是否和檢查可能掛斷了電話。 這裏通常的問題是,在支票上有缺陷導致他們掛起而不是sensu-client本身掛斷。

我已經親身體驗了一些檢查。

要深入瞭解您的問題,至少需要輸出一些日誌和ps命令[問題發生時]。