2016-09-20 209 views
1

如何監控Azure IaaS虛擬機可用性。如果VM發生故障或重新啓動,如何獲得警報。Azure IaaS虛擬機監控

現有的Azure監控/警報和診斷,提供諸如CPU,內存和網絡等性能指標的警報。有沒有我們可以考慮的任何KPI,以便在虛擬機出現故障時提醒用戶。

我們不想投資於SCOM並找到替代方案。

+0

調查CloudMonix,如果你發現Azure門戶有點太...限制http://cloudmonix.com(我附屬於產品) – Igorek

回答

0

可以使用Azure的監控對於這一點,並創建警報,並使用它們基於性能計數器(CPU /內存等)

Azure的監測

https://azure.microsoft.com/en-us/documentation/articles/monitoring-overview/

接收警報通知

https://azure.microsoft.com/en-us/documentation/articles/insights-receive-alert-notifications/

您可以直接通過Azure Portal使用它,或者使用c#連接例如。所有你需要的信息都在上面的鏈接中。

+0

謝謝你的鏈接,我已經通過他們了,什麼KPI你建議警惕虛擬機已關閉。 – Jyothi

+0

您可以使用CPU –

+0

我已經測試了「CPU百分比客戶操作系統」度量標準的閾值小於1的警報,並且不會觸發警報。 – Jyothi

-1

您在訂閱中運行了多少臺虛擬機?如果您正在運行網站或Web服務,那麼您可以設置站點到站點VPN隧道,並利用PowerShell腳本來測試可用性。我們使用Task scheduler來調用執行HTTP GET的PowerShell腳本,以針對特定機器上的網站,以確保機器啓動。

您也可以使用Get-AzureVM來測試VM的狀態。

+0

如果我們必須從第三臺機器安裝任務計劃程序,我們有兩個爲該站點提供服務的Web虛擬機,並可以獲得另一個虛擬機。但挑戰在於IaaS虛擬機通常不會脫機,如果第三虛擬機脫機,我們也有與解決方案相同的問題。 如果有任何設置您的解決方案,請分享鏈接 – Jyothi

0

我對「網絡輸入」度量標準有很好的結果。

使用以下設置設置「網絡輸入」警報:數字「小於」,時間聚合「總計」,閾值「15000字節」(請參閱​​最適合您的數字)「Over the last 1分鐘「,頻率爲」每1分鐘「。