2015-10-15 33 views
2

當我運行QUORUM = 2的3個mesos-master時,它們在被選爲領導者後1分鐘失敗,給出錯誤:Mesos-master:在fd = 25時關閉失敗:傳輸端點沒有連接[107]

E1015 11:50:35.539562 19150 socket.hpp:174] Shutdown failed on fd=25: Transport endpoint is not connected [107] 

E1015 11:50:35.539897 19150 socket.hpp:174] Shutdown failed on fd=24: Transport endpoint is not connected [107] 

他們不斷在一個循環中相互選舉,一直失敗並重新選舉。

如果我設置QUORUM = 1,那麼一切正常。這可能是什麼原因?

+0

你的一個發送電子郵件至mesos郵件列表?它已經解決了? – haosdent

+0

是的,就是我。一個問題是防火牆阻止訪問服務器的公共IP,zookeeper正在廣播公共IP(在advertise_ip中設置),因此沒有人能夠互相連接。奴隸也不能連接到主人與相同的錯誤。 當我刪除防火牆規則並將本地IP設置爲advertise_ip時,從站可能發生連接。但是還沒有嘗試QUORUM = 2。 – aladagemre

+0

聽起來不錯,如果你能最終解決問題或遇到新問題,也請將它發送到郵件列表。以便其他人也可以從你的案例中學習。謝謝。 :-) – haosdent

回答

1

一個問題是AWS防火牆阻止訪問服務器的公共IP,zookeeper正在廣播公共IP(在advertise_ip中設置),因此沒有人能夠互相連接。奴隸也無法連接到相同錯誤的主人。

當我將本地IP設置爲advertise_ip(以便Zookeeper廣播本地IP)時,主設備可以進行通信並且QUORUM = 2工作。當我刪除防火牆規則時,從站可以連接到主站。

0

我們有同樣的問題,與像消息mesos-主日誌驅:

mesos主[27499]:E0616 14:29:39.310302 27523 socket.hpp:174]關機失敗上FD = 67 :運輸端點沒有連接[107]

原來這是負載均衡器的健康檢查,以/stats.json

相關問題