2016-01-16 85 views
0

我有一個安裝程序,我使用3個mesos主人和3個mesos slasves。在做出所有必需的配置後,我可以看到3個mesos主人是由動物園管理員維護的羣集的一部分。mesos奴隸沒有連接mesos主人集羣

現在我已經設置了3個mesos從屬設備,當我啓動mesos-slave服務時,我期待mesos從屬設備可用於mesos主頁的Web UI頁面。但我在奴隸標籤中看不到他們中的任何一個。

selinux,防火牆,iptalbes全部禁用。能夠在節點之間執行ssh。

[[email protected] ~]$ sudo systemctl status mesos-slave -l 
    mesos-slave.service - Mesos Slave 
    Loaded: loaded (/usr/lib/systemd/system/mesos-slave.service; enabled) 
    Active: active (running) since Sat 2016-01-16 16:11:55 UTC; 3s ago 
    Main PID: 2483 (mesos-slave) 
    CGroup: /system.slice/mesos-slave.service 
      ├─2483 /usr/sbin/mesos-slave --master=zk://10.0.0.2:2181,10.0.0.6:2181,10.0.0.7:2181/mesos --log_dir=/var/log/mesos --containerizers=docker,mesos --executor_registration_timeout=5mins 
      ├─2493 logger -p user.info -t mesos-slave[2483] 
      └─2494 logger -p user.err -t mesos-slave[2483] 

Jan 16 16:11:55 slave1.novalocal mesos-slave[2494]: I0116 16:11:55.628670 2497 detector.cpp:482] A new leading master ([email protected]:5050) is detected 
Jan 16 16:11:55 slave1.novalocal mesos-slave[2494]: I0116 16:11:55.628732 2497 slave.cpp:729] New master detected at [email protected]:5050 
Jan 16 16:11:55 slave1.novalocal mesos-slave[2494]: I0116 16:11:55.628825 2497 slave.cpp:754] No credentials provided. Attempting to register without authentication 
Jan 16 16:11:55 slave1.novalocal mesos-slave[2494]: I0116 16:11:55.628844 2497 slave.cpp:765] Detecting new master 
Jan 16 16:11:55 slave1.novalocal mesos-slave[2494]: I0116 16:11:55.628872 2497 status_update_manager.cpp:176] Pausing sending status updates 
Jan 16 16:11:55 slave1.novalocal mesos-slave[2494]: E0116 16:11:55.628922 2503 process.cpp:1911] Failed to shutdown socket with fd 11: Transport endpoint is not connected 
Jan 16 16:11:55 slave1.novalocal mesos-slave[2494]: I0116 16:11:55.629093 2502 slave.cpp:3215] [email protected]:5050 exited 
Jan 16 16:11:55 slave1.novalocal mesos-slave[2494]: W0116 16:11:55.629107 2502 slave.cpp:3218] Master disconnected! Waiting for a new master to be elected 
Jan 16 16:11:55 slave1.novalocal mesos-slave[2494]: E0116 16:11:55.983531 2503 process.cpp:1911] Failed to shutdown socket with fd 11: Transport endpoint is not connected 
Jan 16 16:11:57 slave1.novalocal mesos-slave[2494]: E0116 16:11:57.465049 2503 process.cpp:1911] Failed to shutdown socket with fd 11: Transport endpoint is not connected 

回答

3

所以有問題的行是:

Jan 16 16:11:55 slave1.novalocal mesos-slave[2494]: I0116 16:11:55.629093 2502 slave.cpp:3215] [email protected]:5050 exited 

具體地,請注意它檢測主爲具有IP地址127.0.0.1。 Mesos Agent [1]看到該IP地址,並嘗試連接失敗(主服務器與代理程序不在同一臺機器上運行)。

發生這種情況是因爲主人宣佈它認爲是IP地址進入Zookeeper。在你的情況下,主人認爲它的IP是127.0.0.1,然後將其存儲到ZK。 Mesos有幾個配置標誌來控制這種行爲,主要是--hostname--no-hostname_lookup--ip--ip_discovery_command,並通過設置環境變量LIBPROCESS_IP。請參閱http://mesos.apache.org/documentation/latest/configuration/瞭解有關它們以及它們所做的操作的詳細信息。

您可以做的最好的事情是確保機器具有可解析的主機名。 Mesos對盒子主機名進行反向DNS查找,以便確定知識產權人將與其聯繫。

如果您無法正確獲取主機名設置,我會建議手動設置--hostname--ip這應該會導致mesos準確地發佈您想要的內容。

[1] mesos從已更名爲代理,請參閱:https://issues.apache.org/jira/browse/MESOS-1478

+0

這正是我寫了我自己:-) – Tobi

+0

感謝火鳥,問題是固定的, – Sunil

+0

@Sunil請接受的答案,然後。謝謝。 – Tobi