2017-04-24 20 views
0

我正在運行一個代碼,該函數在python中通過系統調用生成mpi進程。MPI4py錯誤「tmi結構不可用且回退結構未啓用」

的代碼運行在某些情況下很好,但是當我增加一個節點上產生了超過某個點,我得到以下錯誤職工人數:

can't open /dev/ipath, network down (err=26) 
[0] MPI startup(): tmi fabric is not available and fallback fabric is not enabled 

例如有16個CPU的節點上,我可以產生12個1 cpu進程,它會運行,如果我嘗試產卵14我得到這個錯誤。

任何想法是什麼導致它,以及如何解決這個問題將是受歡迎的。

我使用的是intel/mpi/64/5.1.3.210。

回答

0

啓用後備面料解決了這個問題對我來說:

mpiexec.hydra -genv I_MPI_FABRICS=dapl,ofa,tcp,tmi,ofi -np 32 _name_of_mpi_executable_here_