我必須在具有不同配置(例如不同數量的節點)的羣集上運行openmp程序。 但是我面臨的問題是,無論何時我試圖用2個節點運行程序,那麼同一段程序運行2次而不是並行運行。在羣集上運行openmp
我的程序 -
gettimeofday(&t0, NULL);
for (k=0; k<size; k++) {
#pragma omp parallel for shared(A)
for (i=k+1; i<size; i++) {
//parallel code
}
#pragma omp barrier
for (i=k+1; i<size; i++) {
#pragma omp parallel for
//parallel code
}
}
gettimeofday(&t1, NULL);
printf("Did %u calls in %.2g seconds\n", i, t1.tv_sec - t0.tv_sec + 1E-6 * (t1.tv_usec - t0.tv_usec));
這是一個LU分解程序。 當我運行它2節點上,然後我得到的輸出是這樣的 -
難道5.2秒
1000個電話的確在5.3秒
1000個電話的確在41秒
2000調用41秒難道2000個電話
正如你所看到的每個程序運行兩次,每個值(1000,2000,3000 ...),而不是並行運行。 這是我的家庭作業計劃,但我堅持在這一點上。
我正在使用SLURM腳本在我的大學計算羣集上運行此程序。這是教授提供的標準腳本。
#!/bin/sh
##SBATCH --partition=general-compute
#SBATCH --time=60:00:00
#SBATCH --nodes=1
#SBATCH --ntasks-per-node=2
##SBATCH --mem=24000
# Memory per node specification is in MB. It is optional.
# The default limit is 3GB per core.
#SBATCH --job-name="lu_openmpnew2nodes"
#SBATCH --output=luopenmpnew1node2task.out
#SBATCH --mail-user=***@***.edu
#SBATCH --mail-type=ALL
##SBATCH --requeue
#Specifies that the job will be requeued after a node failure.
#The default is that the job will not be requeued.
echo "SLURM_JOBID="$SLURM_JOBID
echo "SLURM_JOB_NODELIST"=$SLURM_JOB_NODELIST
echo "SLURM_NNODES"=$SLURM_NNODES
echo "SLURMTMPDIR="$SLURMTMPDIR
cd $SLURM_SUBMIT_DIR
echo "working directory = "$SLURM_SUBMIT_DIR
module list
ulimit -s unlimited
#
echo "Launch luopenmp with srun"
export I_MPI_PMI_LIBRARY=/usr/lib64/libpmi.so
for i in {1000..20000..1000}
do
srun ./openmpNew "$i"
done
#
echo "All Done!"
您是否嘗試在不同節點或多線程上運行OpenMP工具?你是怎麼稱呼該計劃的?您使用了哪些選項? –
Hi @AlexanderVogt - 首先,我使用-fopenmp選項編譯了使用gcc編譯器的程序。然後我使用上面的腳本將它放入集羣。 –