我正在設計一個分佈式系統,其中包含一定數據流。我想保證在任何給定時間至少有N個節點具有近乎當前的數據。 我不需要完整的一致性,只有最終的一致性(在任何時刻t.i.,數據的當前快照最終應該出現在至少N個節點上,這裏很難定義術語「當前」,但仍然)。節點可能會失敗並隨時恢復,並且沒有單個「中央」節點。 O溢出!將我指向一些描述複製方案的優秀論文。到目前爲止,我發現了一個:Consistency Mana
我希望我的Azure角色爲reprocess data in case of sudden failures。我考慮以下選項。 對於要處理的每個數據塊,我都有一個數據庫錶行,並且可以添加一個表示「處理節點上一次ping的時間」的列。因此,當一個節點抓取一個數據塊進行處理時,它將「處理」狀態和該時間設置爲「當前時間」,然後節點負責每隔一分鐘更新一次該時間。然後週期性地,一些節點會要求「所有的處理狀態