我找做一個ASP.Net Web場接近實時地的一些簡單的監控建議。這個問題的目標是:ASP.Net Web場監測
- 確定在短期(分鐘長)來監視多個Windows Server生產盒子可笑負載週期
- 接收在幾個關鍵近乎實時反饋的最佳方式有關每個框的度量。這些是通過WMI提供的簡單指標,例如CPU,內存和磁盤尋呼。我正在儘快確定我的時間限制,延遲了120秒,這是絕對的上限。
- 監控任何給定的框是否是向上(與「向上」被定義爲在合理時間內響應Web請求)
這裏有更多的細節,事情我已經試過了,等
- 我對伐木不感興趣。我們有日誌記錄解決方案。
- 我已經看過了解決方案,如ELMAH不提供硬件監控的方式很多,並不在整個Web場可見。
- ASP.Net健康監測過於寬泛,過於關注日誌記錄,不適用於深度分析。
- 我們正在使用亞馬遜網絡服務,並且我們研究了CloudWatch。它看起來不錯,但論壇上的信息表明這些指標往往落後了幾分鐘,其中一條線索引用了2分鐘,因爲您期望能夠收到反饋的絕對速度最快。這對於以後的分析很有幫助,但並不能幫助我們實時處理
- 像JetBrains分析器這樣的工具可以很好地進行測試,但是在實時監控過程中再次沒有幫助。
- 我見過的最接近的出的現成的解決方案是Nagios這是免費的,似乎衡量任何一種盒,包括Windows的關鍵指標。但是,它似乎需要一個Linux機器來運行自己並進行大量的手動配置。我寧願不花時間挖掘配置文件,因爲Linux不是我的主要(甚至是次要的)環境,所以當它在生產中出現故障時,我就不要再花時間去做一個小溪了。
是否有任何我缺少的現成解決方案?顯然,一個易於安裝的基於Windows的解決方案非常理想。我不需要很多花裏胡哨的東西。
在沒有出的現成的解決方案,似乎容易讓我寫一些簡單的處理我需要什麼。我一直在想一個簡單的客戶端 - 服務器設置,服務器通過http從每個客戶端請求幾個WMI指標,並將它們粘貼到數據庫中。然後,我們可以通過查詢或儀表板等來監控指標。如果客戶端沒有迴應,它就會下降。
與此有任何問題,最佳實踐,或其他的想法?
感謝您的幫助/反饋。
更新:我們更多地考慮了Cloudwatch,我們可能會專注於嘗試它。 This forum post是我能找到的最正式的東西。其中,亞馬遜代表表示,數據的官方延遲時間爲4分鐘。然而,用戶說2分鐘的舊數據總是可靠的,1分鐘有時是可靠的。我們要嘗試一下,希望這是足以讓我們的需求。
感謝您的建議,但是這可能是太大了,對我們來說太昂貴了。我無法找到該軟件的許可費用,但以我的經驗全部任務的軟件是昂貴的,它可能不會是值得的費用給我們。 – 2010-05-04 15:36:32