2013-04-27 61 views
0

我們有幾個應用程序在Windows 2K,2008服務器上運行。他們用java編寫。 這些應用程序需要執行許多自動化任務。我們很難監控這些應用程序。有時由於XYZ的原因,應用程序掛起或無法執行所需的工作。我們只是在幾天後才知道這個事情,當時有人報告說沒有執行所需的功能。 要解決這個問題,我們爲每個imp例外添加了電子郵件,但開發人員需要花時間每天檢查這1000封電子郵件。這又是不可行的&高效的解決方案。Java應用程序異常監視和警報

現在我們正在尋找一個警報,告警,通知顯示&監控系統。我們需要一個遠程應用程序,它可以接收來自這些Java應用程序的警報,然後根據特定信息/條件/配置,遠程應用程序可以在屏幕上顯示一些紅色,橙色,綠色文本。基於紅色文字,用戶可以直觀地看到系統中存在問題。如果需要,可以通知用戶在應用程序中存在嚴重問題。

請幫助我們確定任何現有的機制,工具,包來實現這一目標。任何建議將不勝感激。

感謝

回答

0

這裏有無數的方法來實現這一點,但他們都將需要一些努力。繼續進行的方式取決於您的需求和能力。我有幾種選擇:

  • 您的進程是否將它們的異常記錄到某個中央服務器上運行的Syslog守護進程。然後,您可以讓管理員通過日誌文件讀取嚴重問題,但有很多方法可以對系統日誌消息進行後處理,對其的Web搜索可能會提供更多提示。
  • 登錄服務器時有什麼辦法可以觀察進程是否正常運行?你可以在服務器上安裝像Nagios這樣的東西,然後編寫一個插件來監視你所有服務器上的特定進程。該插件基本上可以是一個shell腳本,用於檢查「ps」或日誌文件,或任何你想要的。 如果您在IT部門,您的組織可能已經有一些像這樣的系統(NMS)。
  • 我不確定爲什麼這個問題被標記爲「snmp」,但在技術上可以在每臺服務器上安裝SNMP代理,並讓他們在特定條件下發送陷阱。我認爲這會略微矯枉過正,因爲你還必須得到一個好的SNMP管理器來接收陷阱並提醒系統管理員。
0

我會結合使用check_logfiles插件來解析日誌異常並引發警報,並使用check_jmx/jmxquery來檢查JVM中的度量標準,例如堆使用率和線程數。

check_logfiles

check_jmx