2016-03-18 35 views
5

提交COMPSs應用程序後,我收到以下錯誤消息並且未執行該應用程序。COMPSs - 已填充節點錯誤

MPI_CMD=mpirun -timestamp-output -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/user/runcompss 
--project=/tmp/1668183.tmpdir/project_1458303603.xml 
--resources=/tmp/1668183.tmpdir/resources_1458303603.xml 
--uuid=2ed20e6a-9f02-49ff-a71c-e071ce35dacc 
/apps/FILESPACE/pycompssfile arg1 arg2 : -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh 
/apps/INTEL/mkl/lib/intel64 null 
/home/myhome/kmeans_python/src/ true 
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 1 
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc : -n 1 -H s00r0 
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh 
/apps/INTEL/mkl/lib/intel64 null 
/home/myhome/kmeans_python/src/ true 
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 2 
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc 

-------------------------------------------------------------------------- 
All nodes which are allocated for this job are already filled. 
-------------------------------------------------------------------------- 

我正在使用COMPS 1.3。

這是爲什麼發生?

+0

您能發佈更多關於您執行過哪些命令的信息嗎? –

+0

我編輯了我的問題以包含命令。 –

回答

5

您正在嘗試在同一節點中運行主服務器和輔助服務器。羣集中帶有NIO適配器(默認選項)的COMPS 1.3正在使用mpirun在羣集的不同節點中產生主進程和輔助進程,並且羣集中安裝的mpirun不允許執行此操作。

的選項來解決這個問題有以下幾種:

  1. 不指定--tasks_in_master =在enqueue_compss命令。
  2. 您有具有GAT適配器(--comm = integratedtoolkit.gat.master.GATAdaptor)執行更多的開銷

下一頁COMPSs軟件版本將使用產卵命令這是在不同的羣集資源管理器可用(如blaunch,srun)必須解決此問題

+2

完美!我已經使用GAT適配器解決了我的問題。但是,因爲我知道NIO適配器更高效,所以我將在下一個版本發佈後立即更新COMPS。 感謝您的快速和準確的響應。 –