1
當我向具有兩個GPU的節點提交帶選項--gres = gpu:1的SLURM作業時,如何獲得分配給作業的GPU ID?有沒有爲此目的的環境變量?我使用的GPU都是NVIDIA GPU。 謝謝。如何在多個GPU節點上獲取分配給SLURM作業的GPU ID?
當我向具有兩個GPU的節點提交帶選項--gres = gpu:1的SLURM作業時,如何獲得分配給作業的GPU ID?有沒有爲此目的的環境變量?我使用的GPU都是NVIDIA GPU。 謝謝。如何在多個GPU節點上獲取分配給SLURM作業的GPU ID?
您可以使用環境變量CUDA_VISIBLE_DEVICES
獲取GPU ID。此變量是分配給作業的GPU ID的逗號分隔列表。
它的工作原理。謝謝。看起來環境變量GPU_DEVICE_ORDINAL也起作用。 – Negelis