0
我在目錄/ scratch/sharatds(掛載在NFS上)的機器上安裝了mpich1和UPC。配置MPI節點進行通信的問題
但是,當我試着初步運行它時,它曾經在單個機器(lagrid02)上運行良好。
當我嘗試在循環中包含其他機器(lagrid02-09)時,它會拋出錯誤。
rm_3521: p4_error: rm_start: net_conn_to_listener failed: 36394
p0_30647: p4_error: Child process exited while making connection to remote process on lagrid03: 0
p0_30647: (38.617188) net_send: could not write to fd=4, errno = 32
如果你有一個想法,可能會出現什麼問題,你能建議我採取什麼措施來使它工作嗎?