我在三個虛擬機上安裝了Service Fabric,Windows Server 2016上每個虛擬機有5個節點(每個節點都配有獨立的NodeType以避免端口衝突等)。這與運行OneBox Service Fabric在開發機器上有5個節點。Service Fabric ImageStoreService無法複製
在安裝過程中,所有服務都很順利,所有服務都能正常啓動。問題在於ImageStoreService無法完成其複製週期,其中3個節點之一(beta2
,gamma4
& beta0
)停留在In Build
而不是完成。
服務本身報道:
Error event: SourceId='System.FM', Property='State'. Partition is below target replica or instance count. ImageStoreService 3 3 00000000-0000-0000-0000-000000003000 N/P RD beta2 Up 131372506454740092 N/S IB gamma4 Up 131372506515241065 N/S RD beta0 Up 131372506515241066 (Showing 3 out of 3 replicas. Total available replicas: 2.)
我確信每個系統服務創建的共享文件夾可用,並且對磁盤的後備文件夾(有時卸載過程中創建的孤兒)。我在所有三臺服務器上禁用了Windows防火牆,以防止任何阻塞。我已經在這三臺機器上重新安裝了Windows Server 2016,並重新安裝了Service Fabric,問題依然存在。
更新 根據意見的問題,我創建了一個新的配置和部署它橫跨3個虛擬機(如前),但運行每個虛擬機只有1個節點。
同樣的服務啓動正常,但ImageStoreService報道:
Unhealthy event: SourceId='System.FM', Property='State', HealthState='Warning', ConsiderWarningAsError=false. Partition reconfiguration is taking longer than expected. ImageStoreService 3 3 00000000-0000-0000-0000-000000003000 P/P RD gamma Up 131376836149092409 S/S IB alpha Up 131376836457801126 S/S IB beta Up 131376836457801127 (Showing 3 out of 3 replicas. Total available replicas: 1.)
這Warning
成爲Error
隨着時間的推移。似乎只要ImageStore的複製必須跨越虛擬機,它就無法完成複製。
我的問題是如果有人遇到過這個?有關可能導致複製失敗的任何建議?安裝羣集中存儲與複製事件相關的錯誤信息的位置?
我們從同一頁獲得了我們的信息。在您的答案中提到的部分下方,還提到了以下內容 「出於開發目的,您可以在給定計算機上有多個節點。在生產環境中,Service Fabric僅支持每個物理或虛擬機一個節點。 「 我仍然必須確定爲什麼ImageStoreService是唯一無法正常運行的系統服務。 – Snympi
那麼你爲什麼要將開發集羣的設置與產品集羣混合? – LoekD
我有一個由3臺機器組成的開發集羣,用於調試目的 - 特別是當涉及到測試故障域是否正常工作時。我沒有提到這是一個產品設置。問題是ImageStoreService的系統服務未啓動。 – Snympi