6

我在託管一個網站的Windows Azure(Iaas)上有許多虛擬機。有許多負載平衡的前端虛擬機,全部使用SQL Express連接到單個虛擬機。它運作良好。Windows Azure虛擬機(Iaas)意外重啓

但是!

我在所有虛擬機中隨機重新啓動。對於前端虛擬機(使用IIS),由於它們是負載平衡的,因此該站點不受影響,並且負載平衡器會相應地進行調整。但是,當託管數據庫的虛擬機重新啓動時,該站點將停止運行,直到數據庫重新啓動。啓動需要3分鐘,但如果頻繁發生,仍然不能接受。雖然重新啓動相對比較少見(每個虛擬機每月2個),但有時我們每週會有4個重新啓動,每個虛擬機啓動4次,這令人煩惱。並非所有的虛擬機都會重新啓動,我無法弄清楚一個模式。重新啓動也是意想不到的(拉動電源電纜類型的重新啓動,而不是關閉)。數據中心是西歐。

微軟強調,SLA只包含可用性集合中的2VM,這對於數據庫虛擬機(以及企業SQL版本需要花費一個手臂和三條腿)是不可能的。此外,SQL Azure不是一個選項,因爲應用程序非常瑣碎,並且SQL Azure數據庫在高峯時段受到限制(儘管它在中型虛擬機上使用SQL Express時超級平滑!)。

我的問題: 有這麼多的重新啓動是正常嗎?還有其他人有同樣的問題嗎?您對Azure上的這種環境有什麼經驗?我能做些什麼來最大限度地減少這種宕機

謝謝大家!

+0

我相信這個問題是關於話題的。 Azure有點不同,因爲系統配置是廣義上的「編程」類型,因爲Azure需要正確設置以便任何代碼在其中工作。 – Jarvis 2013-06-26 13:51:15

+0

絕對編程相關,因爲這大多數都是代碼! – 2013-11-18 05:18:18

回答

3

有這麼多的重新啓動是正常嗎?

是的,這可能發生在給定的月份,您需要站在高可用性模式下的SQL Server才能真正實現這個目標。

是的,它確實需要手臂和腿部。 ;(

什麼是在Azure這樣的環境你的經驗 幾個月真的好幾個月是壞,取決於你的集羣和數據中心你在MS中存在的數據中心具有混合範圍內我們的硬件出來。這並不意味着它們在某些數據中心的舊筆記本電腦上運行,但這確實意味着我的經驗表明,新的數據中心傾向於擁有更好的套件,因此重新啓動的次數減少了,即我們使用美國東部地區。最大限度地減少這種宕機時間?

高可用性與見證是唯一的方式來給你在虛擬機的可用性,是的,它的成本和手臂和腿。

其他嚴重選項。緩存緩存..您應該使用計算機緩存,天藍色緩存並儘量減少對數據庫的調用。這可能會減少您的聊天應用程序,並允許您在SQL Azure中退後一步,但可能會讓您足以讓故障恢復恢復。

隊列隊列將幫助您恢復應用程序,併爲您提供用戶正在處理的消息。

使用SQL Azure作爲故障轉移。使用來自Premise的SQL Azure Sync進行數據同步(不確定此功能適用於Express),並寫入您的應用程序代碼以獲取連接錯誤和故障轉移。

查看Azure的其他部分以獲取應用程序的某些部分以減少進入SQL的調用數量,即i。e你可以將東西移動到表格存儲中嗎?

HTHS給你一些想法。

+0

雖然這證實了我的理論,但它很糟糕。其他提供商的虛擬機更穩定。但是,我同意緩存和切換回SQL Azure似乎是唯一的方法!謝謝! – 2013-05-10 12:27:58

1

Windows Azure的基礎設施服務(IaaS的)只被一般可用性(GA,或生產)約3周,自4月16日(見公告here)。在GA之前,沒有SLA,因爲各種補丁仍然應用於主機操作系統,所以您會看到更頻繁的操作系統重新啓動。你是否說這種模式自4月16日以來一直保持相同的速度?

既然IaaS是GA,我不會期望一週內有4次重新啓動。這就是說:有幾個原因,你會看到一個重新啓動:

  • 主機硬件故障(這需要關閉所有的客戶機操作系統是主機上運行)
  • 主機軟件更新(且僅當需要的重新啓動主機操作系統)。 主機操作系統重新啓動不應該以您看到的頻率發生。
  • 客戶操作系統問題。這就是與PaaS(網絡/工作者角色雲服務)脫節的地方。在IaaS中,Azure沒有進行客戶操作系統維護;這一切都在你的手中。如果自動安裝Windows更新,可以重新啓動。可能您可能會遇到應用程序級別的問題,導致該框在很長一段時間內無響應,從而導致Azure光纖控制器重新啓動您的盒子,因爲它認爲它不健康。而且......你的應用程序可能會以某種方式崩潰。

如果您排除了應用程序錯誤,並確定虛擬機在重新啓動時處於良好狀態,則可能需要向Microsoft打開支持憑單以幫助進一步診斷問題。

+1

我已經創建了一個MS支持票證,他們已經確認Azure有一個失敗的節點。不幸的是,他們只調查了一次重啓,但我懷疑它適用於所有人。 – 2013-05-10 12:26:06

+1

並禁用自動更新窗口;) – 2013-05-10 12:26:27