2017-08-02 71 views
1

我想在Ubuntu 14.04上的一臺服務器( - >一個節點,服務器本身)上配置Torque v6.1.1.1。 我使用defauts參數(configure)進行安裝。在構建包之後,我安裝了這些模塊:服務器,客戶端和媽媽。 我配置是這樣的:扭矩單節點,不匹配協議

  • server_priv /節點

hostname

  • 服務器名

hostname

  • mom_priv /配置

$pbsserver hostname $logevent 20

我從mom_log此錯誤:

LOG_ERROR::read_tcp_reply, Mismatching protocols. Expected protocol 4 but read reply for 0 

從server_log

LOG_ERROR::tcp_connect_sockaddr, Failed when trying to open tcp connection - connect() failed [rc = -2] [addr = 127.0.1.1:15003] 

我試圖severals的東西,如:給了媽媽一個名字在配置文件中,並將此名稱添加到/ etc/hosts中,並將其替換爲hostname本地主機沒有結果。

我該如何解決它? 非常感謝

回答

0

Tkanks了很多,我解決了這個問題通過

  • 安裝V6.0.1

  • 運行./torque.setup localhost root

  • server_priv /節點:localhost

  • mom_priv /配置:$pbsserver <hostname>$mom_host localhost

  • 服務器名稱:<hostname>

0

我建議殺死pbs_serverpbs_mom進程,然後重新啓動它們。您可以分別使用pbsnodesmomctl -d0進行檢查。

+0

我有此與pbsnodes'的ubuntu 狀態=向下 power_state =運行 NP = 1個 n-型=簇 mom_service_port = 15002 mom_manager_port = 15003 '和這與momctl -d0'主機:ubuntu/ubuntu版本:6.1.1.1 PID:189950 服務器[0]:ubuntu(127.0.1。1:15001) 警告:發送到服務器中沒有消息 homeDirectory的:從服務器 警告沒有接收到消息的/ var /閥芯/扭矩/ mom_priv MOM活性:16秒 LogLevel的:100(使用SIGUSR1/SIGUSR2調整) 注意:沒有檢測到本地作業 診斷完成 '它' – user7378541

+0

如果'hostname'和'hostname -f'沒有返回相同的輸出,那麼您需要將它們都停止('qterm'&'momctl -s' ),將長名稱放入server_name文件中,註釋'$ pbsserver'行,然後開始一切備份。 – clusterdude

+0

或者,您可以將主機名設置爲短名稱。這需要1)更新'/ etc/hostname',2)運行'hostname ',3)將短名稱條目添加到'/ etc/hosts'中。 (它可能還需要重新啓動'pbs_server'和'pbs_mom'服務。( – clusterdude