2013-08-29 49 views
1

我所處的環境支持大約100個數據庫,web和misc。其他服務器(99%的Windows)。基礎設施(硬件+網絡)由顧問管理,而我的團隊負責系統開發。基礎設施人員已經安裝了用於跟蹤一般系統健康狀況等的SCOM環境,並且我也有可能使用它來跟蹤應用程序的健康狀況。SCOM作爲應用程序監視工具(由開發組使用)有意義嗎?

任何人都可以提供洞察到SCOM是否非常適合使用自定義規則監視自定義開發的應用程序?我的團隊中沒有人有與SCOM合作的經驗,並且我正試圖權衡學習SCOM的好處,還是按照預定的時間間隔運行一些Powershell腳本來尋找警告條件。

有些事情我們想要監控:

  • 掃描日誌文件的症狀會指示特殊情況, 像「掛」服務
  • 調用的URL和監視響應時間
  • 調用網址掃描出錯信息
  • 監控數據庫查詢活動等

對SCOM沒有經驗(來自發展觀點),這些類型的任務是否適合SCOM的工作?學習SCOM來實現這種監控與使用Powershell,bat或cygwin腳本還是像Gibraltar這樣的工具是否合理?

回答

0

是的,你問的是有些可能的。我花了一天的最佳時間試圖弄清楚這一點,所以我想我會在這裏發佈我在你身邊找到的。

可以爲任何機器上的任何日誌設置監控。只要你可以看到使用事件日誌查看器登錄窗口(實際上有更多,但如果你能在這裏看到它,假設它可以被監控)

把你正在監控的任何東西放到它自己的組中SCOM並設置它自己的管理包,如果您希望收到關於這些警報的郵件,您甚至可以設置與訂閱匹配條件相匹配的郵件警報

這是一個例如,如果只想監視遠程服務器上的「應用程序」日誌:

  1. 將操作控制檯作爲Operations Manager作者或管理員角色的成員。

  2. 在操作控制檯中。點擊創作按鈕。

  3. 在導航窗格中:

    1. 展開創作,然後展開管理包對象。
    2. 右鍵單擊「規則」,然後單擊「創建新規則...」以啓動「創建規則嚮導」。
  4. 在選擇規則類型頁:

    1. 展開警報生成規則,展開基於事件,然後單擊NT事件日誌(警報)。
    2. 從列表中選擇目標管理(Windows核心庫 - 自定義)或單擊新建...創建管理包。
    3. 單擊下一步。
  5. 在規則的名稱和說明頁:

    1. 在規則名稱框中,鍵入應用程序事件日誌錯誤。
    2. (可選)爲規則鍵入說明。
    3. 單擊選擇以選擇要定位的項目。
    4. 在Select Items to Target對話框中,選擇Windows Computer,然後點擊OK。
    5. 確保已啓用規則選項已選中,然後單擊下一步。
  6. 在「事件日誌名稱」頁面上,確保「日誌名稱」設置爲「應用程序」,然後單擊「下一步」。

  7. 在構建事件表達式頁面:

    1. 指定下列表達式:

      參數名稱運算符值 事件級別等於錯誤

    2. 單擊下一步。
  8. 在配置警報頁:

    1. 在警報描述框中,指定以下內容:

來源:$數據/ EventSourceName $ 事件ID:$ Data/EventDisplayNumber $ 事件類別:$ Data/EventCategory $ 用戶:$ Data/UserName $ 計算機:$ Data/Logging計算機$ 事件描述:$數據/ EventDescription $

2. In the Severity option, click Warning. 
3. Click Alert suppression... to define the handling of duplicate alerts. In the 

警報抑制對話框: 1.單擊以下字段: 事件ID 事件來源 記錄計算機 事件類別 用戶 說明 2.點擊好。

  1. 單擊創建。 重複此過程以創建類似的任何其他事件日誌中的錯誤警報。

可能看起來有點困惑(差的格式不會幫助,抱歉)但是一旦它在你面前,它就會有意義。

希望這有助於反正隊友,

李Ĵ

相關問題