2016-04-28 68 views
-2

我們在Azure上有一個經典的虛擬機。它所做的只是在其上運行帶有大量數據庫的SQL服務器(我們有另一個虛擬機,它是一個Web服務器,它是訪問sql classic VM數據的網絡端)。Azure虛擬機每2-3小時崩潰

從昨天早上起我們就有這個問題,現在我們每隔2-3個小時就會遇到停電。似乎沒有任何理由。我們一直在與Azure支持合作,但他們似乎仍在努力解決問題。在事件日誌中似乎沒有任何信息給我們。

發生的一切就是我們收到一個pingdom警報,說明盒子已經沒有了,我們無法在它超時並且所有數據庫調用都失敗時無法遠程訪問它。 5分鐘後它會回來。它似乎沒有完全重新啓動或任何它只是haults。

關於這可能導致什麼的任何想法?或者我們可以尋找更好的信息的任何地方?或者從這種情況下補丁的方法?

似乎在同一時間發生的事件日誌中唯一的事情是DNS客戶端事件「名稱[DNSName]的名稱解析超時後沒有配置的DNS服務器響應。」

+0

這聽起來好像是一個Azure支持問題,不是StackOverflow的問題(並且懷疑你在ServerFault上的表現會更好,因爲它好像是一個暫時的服務問題)。 –

+0

如果您的應用程序支持此方案,您是否考慮過將Azure SQL作爲替代方案? –

+0

我的2美分相同,這個問題通常是關於你的磁盤提供的IOPS,可能是你的IOPS配額枯竭了,這就是爲什麼虛擬機死亡,一段時間後IOPS配額得到更新(它每小時更新一次我相信),你把你的機器拿回來。 AWS和Azure都會發生這種情況 –

回答

-1

這結束了與節點/部門,我們的虛擬機是在一個錯誤。我通過擴大VM實例的大小(4核心到8核心)來解決這個問題,這迫使Azure將它移動到另一個節點/扇區,並糾正了這個問題。

1

聰明或快速恢復:

你有沒有使用本地主機或127.0.0.1/Instance名裏的VM(內部)連接查詢的SQL Server。如果您可以在內部無任何問題地連接SQL Server,然後使用Capture VM(即不丟失任何數據)然後使用Capture或Snapshot SQL Server VM創建新虛擬機。

可以通過以下標準發生此問題:

  1. Azure的網絡防火牆
  2. Windows服務器更新