2011-10-24 20 views
7

我一直在運行的Nagios兩年左右,但最近這一問題開始與我的服務之一後出現套接字超時。Nagios的:嚴重 - 10秒

我越來越

CRITICAL - Socket timeout after 10 seconds 

check_http -H my.host.com -f follow -u /abc/def檢查,其中用於正常工作。沒有其他服務正在報告此問題。遠程站點已經運行良好,我可以從nagios服務器上執行wget http://my.host.com/abc/def,並且它可以很好地下載響應。另外,做一個check_http -H my.host.com -f follow工作得很好,也就是說,只有當我使用-u這個論點時,事情纔會中斷。我也嘗試傳遞給它不同的用戶代理字符串,沒有區別。我試圖增加超時時間,沒有運氣。我試着用-v,但它得到的全部是:

GET /abc/def HTTP/1.0 
User-Agent: check_http/v1861 (nagios-plugins 1.4.11) 
Connection: close 
Host: my.host.com 


CRITICAL - Socket timeout after 10 seconds 

......它不告訴我發生了什麼問題。

任何想法如何解決這個問題?

謝謝!

+0

您是否嘗試過加入'-4'或'-6'到check_http選項?在我必須強制IPv4檢查之前,我遇到了這個問題。 – Starfish

+0

謝謝,我試了一下。用'-4'我得到同樣的錯誤。用'-6'我得到: 名稱或服務未知 HTTP關鍵 - 無法打開TCP套接字 – fulv

+0

您可以發佈wget的輸出嗎?我假設您使用的是目標網址進行重定向。 – Starfish

回答

15

嘗試使用的check_http-N選項。

我遇到了類似的問題,在我的情況下,網絡服務器並沒有終止,發送響應後連接(HTTPS是工作,HTTP是不是)。 check_http嘗試從打開的套接字讀取,直到服務器關閉連接。如果沒有發生,則發生超時。

-N選項告訴check_http只接收標題,但不接收頁面/文檔的內容。

+1

謝謝你,我的最終服務是不是「問題」的狀態了! – fulv

+1

爲解決方案而歡呼,但連接未終止是堆棧中可能出現問題的標誌。 OP可以評論觸發它的變化是什麼,如果知道的話? – cosimo

+0

有同樣的問題,這是由於「優化」網絡設備。 – Vegard

1

我找到我的問題到與最新版本的openSUSE配置的安全供應商的問題。

從其它網頁的內容似乎是企圖利用這似乎並沒有正常工作,或缺少在默認配置的東西,使其能夠工作TLSv2協議的問題。

爲了克服我註釋掉安全提供有關從JRE安全配置文件中的問題。

#security.provider.10=sun.security.pkcs11.SunPKCS11 

security.provider。在配置中價值可能不同,但本質上SunPKCS11提供商存在問題。

這種配置在

$JAVA_HOME/lib/security/java.security 
您正在使用的JRE的

通常發現。

0

這個網址在nrpe.cfg修正:(上德布6.0擠壓使用的nagios-NRPE服務器)

command[check_http]=/usr/lib/nagios/plugins/check_http -H localhost -p 8080 -N -u /login?from=%2F