2012-11-19 55 views
4

我們有幾個爲web,FTP和電子郵件服務配置的fedora系統。我們希望反映這些服務,以便我們爲用戶提供接近100%的可靠性。我是一位經驗豐富的Linux管理員,但對冗餘系統沒有多少經驗。企業故障轉移(如google.com)如何實際工作?

這樣做的最好方法是什麼?谷歌和亞馬遜如何做到這一點? Google.com解析爲多個IP地址,但是如果我的本地桌面緩存了其中一個無法訪問的IP,我將收到失敗的連接消息。他們如何防止這種情況發生?

如果其中一臺服務器出現故障,它如何自動重定向到另一個系統,而最終用戶卻不知道它?

我知道有故障轉移設備,但它們只是用於故障轉移系統本身,而不是一個完整的網絡。

假設我們有最壞的情況,比如我的主系統變得無法訪問。在Linux系統上使用哪些基本組件來提供此功能?

我正在尋找概念或方法,而不是像「check out openstack」這樣的答案。構成解決方案的實際部分是什麼?需要做些什麼才能實現這種功能?

+0

有趣的 - 但通常是sysadmins/netadmins擔心的工作,所以關閉主題:) – 2012-11-19 01:29:19

+0

你在姊妹網站serverfault.com檢查?這聽起來像是可以在那裏得到一些好的答案的東西。 –

回答

2

谷歌或亞馬遜發佈的IP地址不是真正的服務器,而是負載均衡器。負載均衡器動態地將傳入的客戶端連接轉發到實際的服務器,並且它可能在成千上萬的單個IP地址之後。

您可能會問,如果負載均衡器本身出現故障? 那麼,他們通常工作在羣集 - 至少2,並且都共享相同的虛擬IP地址。如果出現故障,虛擬IP仍然可以正常工作,因爲此負載均衡器集羣的其他成員仍在處理該請求。

如果羣集負載均衡器停止運行,它們會自動更改它們的DNS,使得此虛擬IP不會再通告給DNS客戶端。爲了使速度更快,這些IP上的典型TTL設置較低,幾分鐘或更短(對於google.com,這是5分鐘)。

當然,現實比這個稍微複雜一點,但它應該給你粗略的想法。