2012-06-25 34 views
0

根據this文章,每個集羣都有自己的存儲空間。Hotmail羣集數據存儲如何工作?

集羣主機上百萬用戶(多少取決於硬件的年齡),是一個自包含的一組服務器,其中包括: 前端服務器 - 服務器是用於檢查病毒和舉辦代碼可與您的瀏覽器或電子郵件客戶端,使用諸如POP3和DeltaSync 後端服務器 - SQL和文件存儲服務器,垃圾郵件過濾器,監控 - 和垃圾郵件的數據,目錄代理的存儲和服務器處理入站和出站郵件。 負載均衡 - 硬件和軟件用來均勻地分配負載更多獲得更快的性能。

我猜哪個集羣用戶被分配到由所在地區(IP地址)來決定。在這種情況下,如果我把自己的電子郵件,德國,然後是檢查我的電子郵件,當我來到美國,我被分配到不同集羣(因此不同的SQL數據庫)。所以對我來說,能夠看到電子郵件在美國,這是否意味着在所有的集羣所有的數據庫都在不斷同步?

回答

1

地理最可能你是如何分配一個羣集(認爲它像一個內容分發網絡)。我想你是對與這種假設。

當然我不能可以肯定地說,這一切是如何運作的,但是從我與其他大型提供商的經驗來看,我的想法如下:

電子郵件冗餘存儲在一個集羣內(所以機器/硬盤驅動器的損失)而且這些羣集也可能(可能)冗餘存儲在地理位置不同的位置,從而導致大規模停電和災難對最終用戶影響較小。這種推/拉一直在數據集羣內完成(考慮像HDFS這樣的文件系統)以確保n級冗餘。由於在任何給定小時內登錄到不同羣集中的系統的機會都很小,因此不需要實時同步信息(就可用性而言),但可能需要大約幾分鐘/小時,並且可以儘可能快地運行它們的機器以確保數據的持久性。

羣集設置可能是類似亞馬遜:東/西海岸集羣,一個集羣歐元,和不同的地方有很多其他用戶的是,亞洲羣集(或兩個或三個)。這些數據之間的推拉並不是分鐘的規模,而是幾小時。

這一切冗餘和同步是很重要的是要記住的其他服務,如你所提到的職位,如SkyDrive的和信使全部共享這個sayme基礎設施的文章。