2015-06-22 73 views
11

我意識到,當我殺死領袖動物園管理員主火花不響應(當然我分配領導人選舉任務的動物園管理員)。以下是錯誤日誌,我師父星火節點上看到的。你有任何建議來解決它?選舉新的領導人飼養員的關閉星火主

15/06/22 10:44:00 INFO ClientCnxn: Unable to read additional data from 
> server sessionid 0x14dd82e22f70ef1, likely server has closed socket, 
> closing socket connection and attempting reconnect 

15/06/22 10:44:00 
> INFO ClientCnxn: Unable to read additional data from server sessionid 
> 0x24dc5a319b40090, likely server has closed socket, closing socket 
> connection and attempting reconnect 

15/06/22 10:44:01 INFO 
> ConnectionStateManager: State change: SUSPENDED 

15/06/22 10:44:01 INFO 
> ConnectionStateManager: State change: SUSPENDED 

15/06/22 10:44:01 WARN 
> ConnectionStateManager: There are no ConnectionStateListeners 
> registered. 

15/06/22 10:44:01 INFO ZooKeeperLeaderElectionAgent: We 
> have lost leadership 

15/06/22 10:44:01 ERROR Master: Leadership has 
> been revoked -- master shutting down. 
+0

什麼是 spark.deploy.recoveryMode,spark.zookeeper.url您的具體配置參數?你用--supervise啓動嗎?你的集羣管理員是什麼? – huitseeker

回答

3

這是預期的行爲。你必須建立大師的「N」數字,你需要指定所有主env.sh動物園管理員網址

SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=zk1:2181,zk2:2181" 

注意,動物園管理員維護法定人數。這意味着你需要有奇數飼養員和仲裁僅維持在飼養員集羣將達到。由於火花對飼養員決定了它意味着直到動物園管理員法定人數保持火花集羣將不起來。

當您設置了兩個(n)的主人,打倒動物管理員當前主會下降,新主機將被選出,所有工作節點都將連接到新的主。

你應該給

./start-slave.sh spark://master1:port1,master2:port2 

你必須等待1-2分鐘開始你的工人!注意到這個故障轉移。