我正在Bluehive中運行代碼。代碼有一些參數N.如果N很小,那麼代碼運行得很好。但是,對於稍微大的N(例如N = 10)的碼被運行數個小時,並在結束時我收到以下錯誤消息:slurmstepd:錯誤:在某個點超出步驟內存限制
slurmstepd: error: Exceeded step memory limit at some point.
其中我提交批處理文件有以下代碼:
#!/bin/bash
#SBATCH -o log.%a.txt -t 3-01:01:00
#SBATCH --mem-per-cpu=1gb
#SBATCH -c 4
#SBATCH --gres=gpu:1
#SBATCH -J Ankani
#SBATCH -a 1-2
python run.py $SLURM_ARRAY_TASK_ID
我爲代碼分配了足夠的內存。但仍然得到錯誤
"slurmstepd: error: Exceeded step memory limit at some point."
有人可以幫忙嗎?