2013-04-22 66 views
0

我有一個服務檢查,我發現在Nagios Exchange站點上可以很好地適用於小目錄,但對於需要30或60秒以上才能完成的大型服務檢查並不好。長期在Nagios服務檢查

http://exchange.nagios.org/directory/Plugins/Uncategorized/Operating-Systems/Linux/CheckDirSize/details

我遇到的問題是,我需要配置一個服務檢查的Nagios可以每天運行一次,但將繼續開放供1440分鐘(一天)。目錄列表非常龐大,需要很長時間才能完成(長達20小時)。

這是我的服務檢查(每天檢查使用nrpe時,超時是86400秒,這也是一天)。但由於某種原因,即使我可以在ps -ef |命令行中看到du-sk的運行grep的杜,Nagios是報告「(服務檢查超時)」:

define service { 
    use        generic-service,srv-pnp 
    host_name      IMAGEServer1 
    service_description    Images 
    check_command     check_nrpe!check_dirsize -t 86400 
    check_interval     1440 
    } 

在Linux服務器上我nrpe.cfg文件,我有這兩個指令,以及:

command_timeout=86400 
connection_timeout=86400 

我怎麼能讓Nagios完成檢查並且不超時?我的印象是,我的上述指示是正確的。

回答

1

什麼是超時是本地端check_nrpe命令(它有一個默認的超時2分鐘)。你可以編輯它的命令定義來使用長時間的超時。

或者,您可能希望將其作爲對作爲cron作業運行的IMAGEServer1的被動檢查來執行。

+0

謝謝,我能夠通過調整超時來解決問題。 – 2013-05-21 17:26:03